엑셀보다 쉬운 SQL - 3주차

Join

Left Join, Inner Join, Union

<수업 목표>

  • 여러 테이블의 정보를 연결하는 Join을 이해한다.
  • 연결된 정보를 바탕으로 보다 풍부한 데이터분석을 연습한다.
  • 아래 위로 결과를 연결하는 Union을 공부한다.
  1. Join이란?
    -> 두 테이블의 공통된 정보 (key값)를 기준으로 테이블을 연결해서 한 테이블처럼 보는 것을 의미

1) Left Join
왼쪽에 오는 테이블을 기준으로 오른쪽 테이블 연결

-> 어떤 데이터는 모든 필드가 채워져있지만, 어떤 데이터는 비어있는 필드가 있습니다.

꽉찬 데이터: 해당 데이터의 user_id 필드값이 point_users 테이블에 존재해서 연결한 경우
비어있는 데이터: 해당 데이터의 user_id 필드값이 point_users 테이블에 존재하지 않는 경우

2) Inner Join
두 테이블의 교집합을 표시

-> 여기서는 비어있는 필드가 있는 데이터가 없어요!
그 이유는, 같은 user_id를 두 테이블에서 모두 가지고 있는 데이터만 출력했기 때문이에요

select * from enrolleds e
inner join courses c
on e.course_id = c.course_id;
  • 위 쿼리가 실행되는 순서: from → join → select

3) Union
Select를 두 번 할 게 아니라, 한번에 모아서 보고싶은 경우 사용

(
	select '7월' as month, c.title, c2.week, count(*) as cnt from checkins c2
	inner join courses c on c2.course_id = c.course_id
	inner join orders o on o.user_id = c2.user_id
	where o.created_at < '2020-08-01'
	group by c2.course_id, c2.week
  order by c2.course_id, c2.week
)
union all
(
	select '8월' as month, c.title, c2.week, count(*) as cnt from checkins c2
	inner join courses c on c2.course_id = c.course_id
	inner join orders o on o.user_id = c2.user_id
	where o.created_at > '2020-08-01'
	group by c2.course_id, c2.week
  order by c2.course_id, c2.week
)

union을 사용하면 내부 정렬이 먹지 않아요.
이 때 유용한 방법이 있지요. 바로, SubQuery(서브쿼리) !

  1. 숙제

숙제: enrolled_id별 수강완료(done=1)한 강의 갯수를 세어보고, 완료한 강의 수가 많은 순서대로 정렬해보기. user_id도 같이 출력되어야 한다.

  • 힌트!
    • 조인해야 하는 테이블: enrolleds, enrolleds_detail
    • 조인하는 필드: enrolled_id
select e.enrolled_id,
	     e.user_id,
	     count(*) as cnt
  from enrolleds e
 inner join enrolleds_detail ed on e.enrolled_id = ed.enrolled_id
 where ed.done = 1
 group by e.enrolled_id, e.user_id
 order by cnt desc
  1. 마치며

하면 금방 슈슉 끝내는 걸
왜 이렇게 밍기적밍기적 하기가 싫을까??

조인을 하니까 조금 더 재밌는 것 같다.

좋은 웹페이지 즐겨찾기