【BigQuery】분석・데이터 세트 작성 과정
2183 단어 GoogleAnalyticsBigQuery
소개
BigQuery에서 분석하는 사람들은 있을 것 같지만
어떤 순서로 하고 있는지는 발견되지 않고, 착수에 고생. .
자신이 BigQuery를 사용하여 GA의 로우 데이터 분석을 해 온 순서·방법에 대해 정리한다.
※세세한 SQL에 대해서는 이번은 접하지 않는다.
※이번 취급하는 데이터는 GA의 데이터.
아젠다
・분석의 각 공정
· 데이터 추출 진행 방법
· 예
・정리
분석의 각 단계
대략 이하의 공정
①분석 테마 결정/분석 대상 결정
② 추출 조건 정의/대상 항목 결정
③데이터 추출 ★
④ 비주얼라이즈
⑤ 결과 공유/토론
ㅀ①~⑤의 반복 ー
⑥GOAL(최종 아웃풋 작성/시책의 결정 등)
가장 시간이 걸리고 BigQuery의 성질도 고려한 분석 절차로서,
데이터 추출의 부분을 깊은 파고.
데이터 추출 진행 방법
BigQuery 포인트
① "무엇 단위"의 데이터?
검색하려는 항목이 얼마나 많은 데이터 (사용자 세션 적중)인지
최종적으로 분석·가시화하고 싶은 데이터가 몇 단위인가
의식으로 데이터를 만드는 것이 중요합니다.
② 테이블을 나누어 분석을 진행한다
분석 과정을 알기 쉽고 데이터 검증이 쉽다.
얼마나 많은 데이터?
액세스 분석 데이터에는
"사용자", "세션", "히트 (PV)"의 개념이 있습니다.
BigQuery의 데이터 구조는 1 레코드 1 세션 단위이지만,
안에는 히트(PV)의 정보가 중첩과 같은 형태로 포함되어 있다.
그 때문에, 세션 단위의 정보·히트 단위의 정보를 맞추어 보고 싶다! 라고 말하면,
「세션 단위의 정보」와 「히트 단위의 정보」를 나누어 취득해,
세션의 일의 키로 결합해 데이터 세트를 작성해 가는 이미지가 된다.
맞춤 측정기준
GA의 데이터는 원칙 Google이 정의한 상자 안에 데이터를 설정해 가는 이미지입니다만,
맞춤 측정기준에서는 개별 사이트에서 임의의 항목을 설정 및 취득할 수 있습니다.
이쪽도 히트 세션마다 설정 가능합니다.
커스텀 차원은 RECORD형의 데이터가 되기 때문에, 취득시에는, 「어떻게 정리해 취득할까」 「마지막, 어느 데이터 세트에 결합해 가는지」를 고려합니다.
예
※이번 사용한 데이터에서는 데모그라(유저의 속성치)를 커스텀 차원으로 취득하고 있다.
회원 등록 정보는 히트로 취하고 있다. CV/LP/세션에 대해서는 대략 표준대로.
요약
· 얼마나 많은 데이터 (사용자, 세션, 히트)인지 매우 중요합니다.
・1개 1개 정보를 확인하면서 진행하는 것이 중요
・마지막으로 데이터 세트로서 정리할 수 있도록, 어느 것을 키에 JOIN 하는지, 머리로 설계해 두어
Reference
이 문제에 관하여(【BigQuery】분석・데이터 세트 작성 과정), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asami_kuriyama/items/72ad39ebb94c9cbd1c1f
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
・분석의 각 공정
· 데이터 추출 진행 방법
· 예
・정리
분석의 각 단계
대략 이하의 공정
①분석 테마 결정/분석 대상 결정
② 추출 조건 정의/대상 항목 결정
③데이터 추출 ★
④ 비주얼라이즈
⑤ 결과 공유/토론
ㅀ①~⑤의 반복 ー
⑥GOAL(최종 아웃풋 작성/시책의 결정 등)
가장 시간이 걸리고 BigQuery의 성질도 고려한 분석 절차로서,
데이터 추출의 부분을 깊은 파고.
데이터 추출 진행 방법
BigQuery 포인트
① "무엇 단위"의 데이터?
검색하려는 항목이 얼마나 많은 데이터 (사용자 세션 적중)인지
최종적으로 분석·가시화하고 싶은 데이터가 몇 단위인가
의식으로 데이터를 만드는 것이 중요합니다.
② 테이블을 나누어 분석을 진행한다
분석 과정을 알기 쉽고 데이터 검증이 쉽다.
얼마나 많은 데이터?
액세스 분석 데이터에는
"사용자", "세션", "히트 (PV)"의 개념이 있습니다.
BigQuery의 데이터 구조는 1 레코드 1 세션 단위이지만,
안에는 히트(PV)의 정보가 중첩과 같은 형태로 포함되어 있다.
그 때문에, 세션 단위의 정보·히트 단위의 정보를 맞추어 보고 싶다! 라고 말하면,
「세션 단위의 정보」와 「히트 단위의 정보」를 나누어 취득해,
세션의 일의 키로 결합해 데이터 세트를 작성해 가는 이미지가 된다.
맞춤 측정기준
GA의 데이터는 원칙 Google이 정의한 상자 안에 데이터를 설정해 가는 이미지입니다만,
맞춤 측정기준에서는 개별 사이트에서 임의의 항목을 설정 및 취득할 수 있습니다.
이쪽도 히트 세션마다 설정 가능합니다.
커스텀 차원은 RECORD형의 데이터가 되기 때문에, 취득시에는, 「어떻게 정리해 취득할까」 「마지막, 어느 데이터 세트에 결합해 가는지」를 고려합니다.
예
※이번 사용한 데이터에서는 데모그라(유저의 속성치)를 커스텀 차원으로 취득하고 있다.
회원 등록 정보는 히트로 취하고 있다. CV/LP/세션에 대해서는 대략 표준대로.
요약
· 얼마나 많은 데이터 (사용자, 세션, 히트)인지 매우 중요합니다.
・1개 1개 정보를 확인하면서 진행하는 것이 중요
・마지막으로 데이터 세트로서 정리할 수 있도록, 어느 것을 키에 JOIN 하는지, 머리로 설계해 두어
Reference
이 문제에 관하여(【BigQuery】분석・데이터 세트 작성 과정), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asami_kuriyama/items/72ad39ebb94c9cbd1c1f
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
BigQuery 포인트
① "무엇 단위"의 데이터?
검색하려는 항목이 얼마나 많은 데이터 (사용자 세션 적중)인지
최종적으로 분석·가시화하고 싶은 데이터가 몇 단위인가
의식으로 데이터를 만드는 것이 중요합니다.
② 테이블을 나누어 분석을 진행한다
분석 과정을 알기 쉽고 데이터 검증이 쉽다.
얼마나 많은 데이터?
액세스 분석 데이터에는
"사용자", "세션", "히트 (PV)"의 개념이 있습니다.
BigQuery의 데이터 구조는 1 레코드 1 세션 단위이지만,
안에는 히트(PV)의 정보가 중첩과 같은 형태로 포함되어 있다.
그 때문에, 세션 단위의 정보·히트 단위의 정보를 맞추어 보고 싶다! 라고 말하면,
「세션 단위의 정보」와 「히트 단위의 정보」를 나누어 취득해,
세션의 일의 키로 결합해 데이터 세트를 작성해 가는 이미지가 된다.
맞춤 측정기준
GA의 데이터는 원칙 Google이 정의한 상자 안에 데이터를 설정해 가는 이미지입니다만,
맞춤 측정기준에서는 개별 사이트에서 임의의 항목을 설정 및 취득할 수 있습니다.
이쪽도 히트 세션마다 설정 가능합니다.
커스텀 차원은 RECORD형의 데이터가 되기 때문에, 취득시에는, 「어떻게 정리해 취득할까」 「마지막, 어느 데이터 세트에 결합해 가는지」를 고려합니다.
예
※이번 사용한 데이터에서는 데모그라(유저의 속성치)를 커스텀 차원으로 취득하고 있다.
회원 등록 정보는 히트로 취하고 있다. CV/LP/세션에 대해서는 대략 표준대로.
요약
· 얼마나 많은 데이터 (사용자, 세션, 히트)인지 매우 중요합니다.
・1개 1개 정보를 확인하면서 진행하는 것이 중요
・마지막으로 데이터 세트로서 정리할 수 있도록, 어느 것을 키에 JOIN 하는지, 머리로 설계해 두어
Reference
이 문제에 관하여(【BigQuery】분석・데이터 세트 작성 과정), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/asami_kuriyama/items/72ad39ebb94c9cbd1c1f
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
· 얼마나 많은 데이터 (사용자, 세션, 히트)인지 매우 중요합니다.
・1개 1개 정보를 확인하면서 진행하는 것이 중요
・마지막으로 데이터 세트로서 정리할 수 있도록, 어느 것을 키에 JOIN 하는지, 머리로 설계해 두어
Reference
이 문제에 관하여(【BigQuery】분석・데이터 세트 작성 과정), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/asami_kuriyama/items/72ad39ebb94c9cbd1c1f텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)