데이터 집계는 GoogleColabratory를 사용하는 편이 100배 빠름
이 기사에서 데이터 집계 RTA를하고 있었기 때문에 나도 참가하고 싶습니다.
데이터 집계는 Excel보다 Python 사용하는 것이 100배 빠르다(pandas-profiling, pixiedust)
개인적으로 R로 하는 편이 더욱 빨리 느껴집니다.
여러 상황에 따라 pixiedust의 처리는 생략하고 있습니다. 나중에 추가하고 싶습니다.
TL;DR
방법에 대해
전제
작성된 JupyterNotebook을 GoogleDrive에 복사 (소요 시간 3 분)
GoogleColabratory - auto_padas_profiling.ipynb을 자신의 GoogleDrive에 복사합니다.
모든 셀 실행 (소요 시간 5 분)
끝
참고
Reference
이 문제에 관하여(데이터 집계는 GoogleColabratory를 사용하는 편이 100배 빠름), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/wakame1367/items/de8efdd2bae5e32d4ac3텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)