『데이터 사이언스 100개 노크』를 해본다 ①

데이터 과학 초학자를 위한 실용적인 학습 환경
「데이터 과학 100개 노크(구조화 데이터 가공편)」를 GitHub에 무료 공개
htps : // 굳은 lpr. jp/r/39499

이쪽을 해보려고 생각합니다.
덧붙여서 R은 전혀 모르기 때문에 하지 않는다고 생각합니다.

환경



・Windows10
· Docker for Desktop
· Git

환경 구축



Docker 시작
 wsl -e docker-desktop

Git에서 클론
git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git

Docker 빌드
cd 100knocks-preprocess
docker-compose up -d --build

잠시 시간이 걸립니다 ...
뭔가 다 떨어지는 듯한 ...

환경 구축의 주의점



Docker Toolbox를 사용하는 경우 액세스 대상 URL이 변경됩니다.
http://192.168.99.100:8888
클라이언트 도구를 사용하여 DB에 액세스하는 경우 호스트도 함께 변경됩니다.

100개 노크 환경 확인



다음에 액세스
http://localhost:8888



이런 화면이 열릴 것

work/preprocess_knock_SQL.ipynb를 열면



이런 식으로 SQL 문제가 있습니다.
Python, R도 마찬가지로 anser 폴더 안에 대답도 있는 것 같다.
DB는 Postgre12입니다.

자라와 본 느낌 그렇게 어렵지 않은 느낌입니다만, 제3 정규화하라라든지 말해지면 대단히・・・? 나는 순식간에 구구지군요 w



이 환경은 Jupyter Notebook이라는 것을 사용하는 것 같네요.
뭔가 잘 보이겠다고 생각했지만 잘 모르기 때문에 조사해 보았습니다.

Jupyter notebook은 Jupyter 프로젝트 중 하나이며 OSS 웹 애플리케이션입니다.
Jupyter 프로젝트는 여러 언어에 걸쳐 대화형 처리 실행을 실현하기 위한 서비스와 OSS를 개발하기 위한 프로젝트입니다.
그리고 프로그램의 실행 결과 등을 정리하여 관리할 수 있습니다.

*.ipynb는 확장자의이 화면을 만드는 것 같고, 안을 열면 다음과 같은 json 형식의 파일이었습니다.

Entity_Relationship.ipynb
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# DB論理設計(ER図)\n",
    "- 一部、FKとなっているデータについて、マスターテーブルに存在しないデータを有することもあります\n",
    "- 例)非会員の顧客IDは顧客テーブルに含まれません\n",
    "- そのため、FKの情報は一般的なデータベースにおける外部参照制約を満たすものではありません\n",
    "- データを結合する際の参考情報として利用してください"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "![ER図](data/100knocks_ER.png \"サンプル\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}


참고



이제 들리지 않는 Jupyter notebook htps : // 이 m/s↑3/있어 ms/920fd3에905에d16469780

좋은 웹페이지 즐겨찾기