[요약] OpenRefine 사용 방법 요약
3084 단어 openrefinePython프리 프로세싱
우리 케타69 사바다.
OpenRefine이라는 데이터 정형(데이터 전처리) 도구가 훌륭하기 때문에 꼭 사용해 달라고 부탁하고 싶어서 Qita에서 사용법을 총괄하기로 했습니다.
하지만 저는 데이터 엔지니어(데이터 과학)가 아니기 때문에'데이터 성형(데이터 예처리)은 어떻게 처리합니까?'이해가 안 돼서 오픈 레파인에서 해볼 것예비처리 대전 목록에서 할 수 있는 것들을 해보기로 했다.
OpenRefine 소개
뭘 할 수 있어요?
화면에 "Apower tool for working with messy data"및 OpenRefine에 대한 설명
언어를 일본어로 바꾸면 "난잡한 데이터를 처리하는 힘의 도구"번역
역시 파워 키트.
Wikidata와 협업하여 관련성 있는 단어를 추출
※ GREAL은 Open Refine 고유 언어(함수)
설치 단계
Windows 환경에서는 ①"Java JRE 설치"②"Open Refine의 ZIP 파일 다운로드"③"동결해제 후 두 번 클릭.exe"만 하면 됩니다.자세한 내용은 여기.를 참조하십시오.
데이터 정형(데이터 예처리) 일람
예비처리 대전의 디렉터리에서 연상하기 쉬운 항목을 열거했다.OpenRefine으로 데이터 성형을 시도해 Qita에 수시로 투고한다.
성명 일람표
나는 데이터의 흔들림 (반각 전각 공간) 을 수정하기 위해 글을 썼다.(2018/08/02 추가)
나는 반각 전각 공간의 흔들림을 수정하는 글을 썼다.(2018/08/10 추가)
인출
취합
잇닿다
갈라놓다
Open Refine API를 사용하여 데이터 테이블을 버스트하는 글을 썼습니다.(2018/08/25 추가)
디지털 유형
범주 유형
날짜 유형
총결산
아마도 Open Refine에는 더 많은 할 수 있는 일이 있을 것입니다. 유용한 기능이 있으면 언제든지 업데이트할 수 있습니다. (일람표에 추가)
Reference
이 문제에 관하여([요약] OpenRefine 사용 방법 요약), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/keita69sawada/items/5f47d1a8ff078e67ee3f
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여([요약] OpenRefine 사용 방법 요약), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/keita69sawada/items/5f47d1a8ff078e67ee3f텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)