『데이터 사이언스 100개 노크』를 해본다 ①
「데이터 과학 100개 노크(구조화 데이터 가공편)」를 GitHub에 무료 공개
htps : // 굳은 lpr. jp/r/39499
이쪽을 해보려고 생각합니다.
덧붙여서 R은 전혀 모르기 때문에 하지 않는다고 생각합니다.
환경
・Windows10
· Docker for Desktop
· Git
환경 구축
Docker 시작
wsl -e docker-desktop
Git에서 클론
git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git
Docker 빌드
cd 100knocks-preprocess
docker-compose up -d --build
잠시 시간이 걸립니다 ...
뭔가 다 떨어지는 듯한 ...
환경 구축의 주의점
Docker Toolbox를 사용하는 경우 액세스 대상 URL이 변경됩니다.
http://192.168.99.100:8888
클라이언트 도구를 사용하여 DB에 액세스하는 경우 호스트도 함께 변경됩니다.
100개 노크 환경 확인
다음에 액세스
http://localhost:8888
이런 화면이 열릴 것
work/preprocess_knock_SQL.ipynb를 열면
이런 식으로 SQL 문제가 있습니다.
Python, R도 마찬가지로 anser 폴더 안에 대답도 있는 것 같다.
DB는 Postgre12입니다.
자라와 본 느낌 그렇게 어렵지 않은 느낌입니다만, 제3 정규화하라라든지 말해지면 대단히・・・? 나는 순식간에 구구지군요 w
덤
이 환경은 Jupyter Notebook이라는 것을 사용하는 것 같네요.
뭔가 잘 보이겠다고 생각했지만 잘 모르기 때문에 조사해 보았습니다.
Jupyter notebook은 Jupyter 프로젝트 중 하나이며 OSS 웹 애플리케이션입니다.
Jupyter 프로젝트는 여러 언어에 걸쳐 대화형 처리 실행을 실현하기 위한 서비스와 OSS를 개발하기 위한 프로젝트입니다.
그리고 프로그램의 실행 결과 등을 정리하여 관리할 수 있습니다.
*.ipynb는 확장자의이 화면을 만드는 것 같고, 안을 열면 다음과 같은 json 형식의 파일이었습니다.
Entity_Relationship.ipynb{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# DB論理設計(ER図)\n",
"- 一部、FKとなっているデータについて、マスターテーブルに存在しないデータを有することもあります\n",
"- 例)非会員の顧客IDは顧客テーブルに含まれません\n",
"- そのため、FKの情報は一般的なデータベースにおける外部参照制約を満たすものではありません\n",
"- データを結合する際の参考情報として利用してください"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"![ER図](data/100knocks_ER.png \"サンプル\")"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.6"
}
},
"nbformat": 4,
"nbformat_minor": 4
}
참고
이제 들리지 않는 Jupyter notebook htps : // 이 m/s↑3/있어 ms/920fd3에905에d16469780
Reference
이 문제에 관하여(『데이터 사이언스 100개 노크』를 해본다 ①), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/nanaki11/items/7b9ebab9db6d526f7c73
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Docker 시작
wsl -e docker-desktop
Git에서 클론
git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git
Docker 빌드
cd 100knocks-preprocess
docker-compose up -d --build
잠시 시간이 걸립니다 ...
뭔가 다 떨어지는 듯한 ...
환경 구축의 주의점
Docker Toolbox를 사용하는 경우 액세스 대상 URL이 변경됩니다.
http://192.168.99.100:8888
클라이언트 도구를 사용하여 DB에 액세스하는 경우 호스트도 함께 변경됩니다.
100개 노크 환경 확인
다음에 액세스
http://localhost:8888
이런 화면이 열릴 것
work/preprocess_knock_SQL.ipynb를 열면
이런 식으로 SQL 문제가 있습니다.
Python, R도 마찬가지로 anser 폴더 안에 대답도 있는 것 같다.
DB는 Postgre12입니다.
자라와 본 느낌 그렇게 어렵지 않은 느낌입니다만, 제3 정규화하라라든지 말해지면 대단히・・・? 나는 순식간에 구구지군요 w
덤
이 환경은 Jupyter Notebook이라는 것을 사용하는 것 같네요.
뭔가 잘 보이겠다고 생각했지만 잘 모르기 때문에 조사해 보았습니다.
Jupyter notebook은 Jupyter 프로젝트 중 하나이며 OSS 웹 애플리케이션입니다.
Jupyter 프로젝트는 여러 언어에 걸쳐 대화형 처리 실행을 실현하기 위한 서비스와 OSS를 개발하기 위한 프로젝트입니다.
그리고 프로그램의 실행 결과 등을 정리하여 관리할 수 있습니다.
*.ipynb는 확장자의이 화면을 만드는 것 같고, 안을 열면 다음과 같은 json 형식의 파일이었습니다.
Entity_Relationship.ipynb{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# DB論理設計(ER図)\n",
"- 一部、FKとなっているデータについて、マスターテーブルに存在しないデータを有することもあります\n",
"- 例)非会員の顧客IDは顧客テーブルに含まれません\n",
"- そのため、FKの情報は一般的なデータベースにおける外部参照制約を満たすものではありません\n",
"- データを結合する際の参考情報として利用してください"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"![ER図](data/100knocks_ER.png \"サンプル\")"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.6"
}
},
"nbformat": 4,
"nbformat_minor": 4
}
참고
이제 들리지 않는 Jupyter notebook htps : // 이 m/s↑3/있어 ms/920fd3에905에d16469780
Reference
이 문제에 관하여(『데이터 사이언스 100개 노크』를 해본다 ①), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/nanaki11/items/7b9ebab9db6d526f7c73
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
이 환경은 Jupyter Notebook이라는 것을 사용하는 것 같네요.
뭔가 잘 보이겠다고 생각했지만 잘 모르기 때문에 조사해 보았습니다.
Jupyter notebook은 Jupyter 프로젝트 중 하나이며 OSS 웹 애플리케이션입니다.
Jupyter 프로젝트는 여러 언어에 걸쳐 대화형 처리 실행을 실현하기 위한 서비스와 OSS를 개발하기 위한 프로젝트입니다.
그리고 프로그램의 실행 결과 등을 정리하여 관리할 수 있습니다.
*.ipynb는 확장자의이 화면을 만드는 것 같고, 안을 열면 다음과 같은 json 형식의 파일이었습니다.
Entity_Relationship.ipynb
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# DB論理設計(ER図)\n",
"- 一部、FKとなっているデータについて、マスターテーブルに存在しないデータを有することもあります\n",
"- 例)非会員の顧客IDは顧客テーブルに含まれません\n",
"- そのため、FKの情報は一般的なデータベースにおける外部参照制約を満たすものではありません\n",
"- データを結合する際の参考情報として利用してください"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"![ER図](data/100knocks_ER.png \"サンプル\")"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.6"
}
},
"nbformat": 4,
"nbformat_minor": 4
}
참고
이제 들리지 않는 Jupyter notebook htps : // 이 m/s↑3/있어 ms/920fd3에905에d16469780
Reference
이 문제에 관하여(『데이터 사이언스 100개 노크』를 해본다 ①), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/nanaki11/items/7b9ebab9db6d526f7c73텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)