내일배움단 sql 3일차

sql 왕초보 버전으로 수강해보니 이거 매우 엑셀스럽다.

join on

엑셀의 vlookup 과 유사한 기능으로
두 시트에서 동일한 값을 기준으로 서로 매칭시켜준다.

left join ~ on A = B

select * from users u
left join point_users p
on u.user_id = p.user_id

users 시트와 point_users 시트에서
user_id 값으로 매칭
단, 왼쪽 데이터 기준으로 정렬됨.

inner join ~ on A = B

select * from users u
inner join point_users p
on u.user_id = p.user_id

위의 left join과 결과값은 유사하지만
null 값이 없이 데이터가 꽉 찬 것만 연결.

SQL 쿼리가 실행되는 순서

select u.name, count(u.name) as count_name from orders o
inner join users u
on o.user_id = u.user_id 
where u.email like '%naver.com'
group by u.name

from → join → where → group by → select

  1. from orders o: orders 테이블 데이터 전체를 가져오고 o라는 별칭을 붙입니다.

  2. inner join users u on o.user_id = u.user_id : users 테이블을 orders 테이블에 붙이는데, orders 테이블의 user_id와 동일한 user_id를 갖는 users 테이블 데이터를 붙입니다. (*users 테이블에 u라는 별칭을 붙입니다)

  3. where u.email like '%naver.com': users 테이블 email 필드값이 naver.com으로 끝나는 값만 가져옵니다.

  4. group by u.name: users 테이블의 name값이 같은 값들을 뭉쳐줍니다.

  5. select u.name, count(u.name) as count_name : users 테이블의 name필드와 name 필드를 기준으로 뭉쳐진 갯수를 세어서 출력해줍니다.

Join 연습1

  1. 내가 쓴 코드
select o.payment_method, round(avg(pu.point),2) from point_users pu 
inner join orders o on pu.user_id = o.user_id 
group by o.payment_method
  1. 답안 코드
select o.payment_method, round(AVG(p.point)) from point_users p
inner join orders o 
on p.user_id = o.user_id 
group by o.payment_method
  1. 고찰
    select 와 form 사이에 써야할 단어...들에서
    alias가 o인지 pu인지 많이 헛갈렸다.
    노트에 어떤 시트에 어떤 필드가 있는지 기록해놔야 안헷갈릴듯....

Join 연습2

  1. 내가 짠 코드
select name, count(*) from enrolleds e
inner join users u 
on e.user_id = u.user_id
where is_registered = 0
group by name
order by count(*)
  1. 답안 코드
select name, count(*) as cnt_name from enrolleds e
inner join users u
on e.user_id = u.user_id 
where is_registered = 0
group by name
order by cnt_name desc
  1. 고찰
    자꾸 select와 from 사이에 넣는게 헷갈린다...
    답안 코드에서는 count(*) 필드명을 cnt_name 으로 변경하였고
    변경된 필드명(cnt_name)을 내림차순으로 정렬하였다.

Join 연습3

  1. 내가 짠 코드
select c.course_id, title, count(*) from courses c
join enrolleds e on c.course_id = e.course_id 
where is_registered = 0
group by c.course_id
  1. 답안 코드
select c.course_id, c.title, count(*) as cnt_notstart from courses c
inner join enrolleds e 
on c.course_id = e.course_id
where is_registered = 0
group by c.course_id
  1. 고찰
    alias를 붙였다 안붙였다....난리다 ㅎㅎ
    inner join으로 안쓰고 join으로 썼는데도 같은 결과가 나왔다.
    왜 그럴까......???
    이건 질문해봐야겠다.

그리고..., 퀴즈에서 제공한 이미지를 잘 관찰해야겠다.
또 필드명을 안바꿨네....

Join 연습4

  1. 내가 짠 코드
select c1.title, week, count(*) as cnt from courses c1 
inner join checkins c2 on c1.course_id = c2.course_id
group by c1. title, c2.week
order by c1. title
  1. 답안 코드
select c1.title, c2.week, count(*) as cnt from checkins c2
inner join courses c1 on c2.course_id = c1.course_id
group by c1.title c2.week
order by c1.title, c2.week
  1. 고찰
    어.....이번 코드는 다른 부분들이 좀 있다.
    일단, 시트 붙이는 순서를 서로 바꿔놨다.....
    헌데 같은 결과를 낳았다 ㅎㅎㅎㅎ
    두 개 시트가 공통되는 필드가 있기에 순서가 좀 바뀌어도
    원하는 결과가 나온 것 같다.
    내가 짠 코드에서는 week은 순서대로 정렬을 안했었는데
    답안 코드에서는 week도 정렬하였다.

Join 연습5

  1. 내가 짠 코드
select c1.title, week, count(*) as cnt from courses c1 
inner join checkins c2 on c1.course_id = c2.course_id
inner join orders o on c2.user_id = o.user_id
where o.created_at >= '2020-08-01'
group by c1. title, c2.week
order by c1. title, c2.week
  1. 답안 코드
select c1.title, c2.week, count(*) as cnt from courses c1
inner join checkins c2 on c1.course_id = c2.course_id
inner join orders o on c2.user_id = o.user_id
where o.created_at >= '2020-08-01'
group by c1.title, c2.week
order by c1.title, c2.week
  1. 고찰
    우와....이건 좀 시간 걸렸다.
    퀴즈4 에서 하나씩 데이터를 다시 확인해보며 짰는데
    where 문 위치를 맨 아랫줄에 넣었더니 자꾸 에러가 나서....
    group by 위로 올렸더니 실행이 되었다.
    답안 코드랑 미묘하게 코드가 다르긴 한데
    어쨌든 결과는 똑같이 나왔다 ㅋㅋㅋㅋ

여기서 퀴즈! 막해보기 (left join)

  1. 내가 쓴 코드
select count(pu.point) as pnt_user_cnt, 
		count(*) as tot_user_cnt, 
		round(count(point_user_id)/count(*),2) as ratio 
		from users u
left join point_users pu on u.user_id = pu.user_id
where u.created_at between '2020-07-10' and '2020-07-20'
  1. 답안 코드
select count(point_user_id) as pnt_user_cnt,
       count(*) as tot_user_cnt,
       round(count(point_user_id)/count(*),2) as ratio
  from users u
  left join point_users pu on u.user_id = pu.user_id
 where u.created_at between '2020-07-10' and '2020-07-20'
  1. 고찰
    ratio 계산식 쓸 때 버버벅...
    count(point_user_id)/count(*) 을 써야하는데
    pnt_user_cnt/tot_user_cnt
    를 썼었다 ㅎㅎㅎㅎ
    필드명을 명명한 것과 필드명(값)은 구분해야한다.

좋은 웹페이지 즐겨찾기