cross join unnest를 사용하여 쉼표로 구분 된 데이터를 단일 열의 여러 레코드로 분해합니다.

"cross join unnest"라는 함수와 "split"함수를 사용하면 실현할 수 있습니다.

샘플

select
  split_record
from
  tbl_test t1
cross join unnest( --・・・(1)
  split(t1.csv_column, ',') --・・・(2)
) as t (split_records)

처리 개요

자꾸 설명하면
(2)의 split 함수로 문자열 (t1.csv_column)을 쉼표로 분할하여 배열로 만들고,
배열을 (1)의 cross join unnest 함수로 단일 열의 레코드로 확장합니다.

이미지

■split 함수

split (문자열, 구분 기호) ...
첫 번째 인수의 문자열을 두 번째 인수의 구분 기호로 나누고 배열로 만듭니다.

■cross join unnest 함수

cross join unnest (배열) AS t (배포 후 열 이름) ...
첫 번째 인수의 배열을 단일 열의 레코드로 확장합니다.
열 이름은 두 번째 인수가 확장된 후 열 이름이 됩니다.

요약

treasure 데이터 등의 빅데이터 기반에는 분석시 취급하기 쉽도록 가공한 후
데이터가 등록된 경우도 있지만 반드시 그렇지는 않습니다.
그대로는 분석에 사용하기 힘든 데이터도 등록되어 있는 것이 있다고 생각합니다.
이번 소개는 csv 형식으로 데이터가 등록되어 있지만
그 CSV의 1 단락을 1 레코드로서 취급하고 싶은 경우를 예로 소개하였습니다.
이 기사가 분석 등의 업무의 도움이 된다고 생각합니다.

Reference

이 문제에 관하여(cross join unnest를 사용하여 쉼표로 구분 된 데이터를 단일 열의 여러 레코드로 분해합니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/shohei727/items/80aebf3956d48fb509a6

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다