첫 DeepLearning 입문(Chainer) 일본어 문자 인식 1장 [환경 구축]

안녕하세요 리히트입니다.
환경연구소 에서 판매되고 있는 일본어 문자 인식 데이터 세트를 입수했으므로, 데이터 세트를 활용한 DeepLearning 초학자를 위한 튜토리얼을 공개합니다.
일본어 문자 인식 엔진 개발을 시도합니다.

이하의 이미지를 봐도 알 수 있듯이, 게슈탈트 붕괴 계약한 튜토리얼입니다만, 드물지 않고 노력해 가고 싶습니다.


또한이 기사는
・DeepLearning을 시작하고 싶다!
・mnist의 숫자 인식 이외의 튜토리얼을 하고 싶다!
· DeepLearning 관련 기술에 대해 배우고 싶다!
・스스로 일본어 OCR의 개발을 하고 싶다!

라는 분들을 향해 쓰고 있습니다.
다음 개요에서 설명합니다.



제목


1장
chainer를 기반으로 DeepLearning 환경 구축

2장
기계 학습을 통한 DeepLearning 예측 모델 만들기

3장
모델을 이용한 문자 인식

4장
데이터 확대로 인식 정밀도 향상

5장
신경망 입문 및 소스 코드 해설

6장
Optimizer 선택으로 학습 효율성 향상

7장
TTA, BatchNormalization을 통한 학습 효율 향상


DeepLearning은 완전히 처음, 라는 분은 어쨌든 움직이는 물건을 보고 싶으므로 4장째까지 트라이해 주세요.
5장 이하는 DeepLearning에 대해 한 걸음 더 자세히 알고 싶은 사람을 위한 것입니다.

소개



왜 chainer?



chainer는 국산 OSS입니다. 무엇보다 사용하기 쉽고, 이해하기 쉽고 Google Group에서 chainer에 관한 질문을 해도 곧바로 무료로 응답해 주는 등 최고.

환경



본편은 Mac을 전제로 이야기합니다만, 수시로 Windows에 맞추어 각각 설명(차이는 환경 준비만입니다만) 합니다.
・머신 스펙:메모리 4GB 이상
・Python2.7계, pip가 인스톨 되고 있는 것

환경 준비 (Mac)



터미널에서
sudo pip install chainer

를 입력하고 chainer1.6.0, filelock2.0.5, nose1.3.7, numpy1.10.4, protobuf2.6.1을 일괄 설치합니다.
sudo pip install scipy

를 입력하고 scipy0.17.0을 설치합니다.

또한 이 기사을 참고하여 Opencv2.4.X 계를 설치하십시오.

환경 준비 (Windows)



명령 프롬프트에서
pip install chainer

를 입력하고 chainer1.6.0, filelock2.0.5, nose1.3.7, numpy1.10.4, protobuf2.6.1을 일괄 설치합니다.
pip install scipy

를 입력하고 scipy0.17.0을 설치합니다. 필요한 경우 관리자 모드에서 명령 프롬프트를 시작합니다.
또한 이 기사을 참고하여 Opencv2.4.X 계를 설치하십시오.

데이터 준비(Mac, Windows)



환경연의 웹사이트 에서 히라가나 데이터 세트를 구입(1000엔)하고 다운로드합니다.
바탕 화면에 "HIRAGANA_NN"이라는 디렉토리를 만들고 그 안에 압축을 풉니 다.

-DESKTOP
-HIRAGANA_NN
-304a
-304b
·
·
(참고) 이하의 화상과 같이 되어 있으면 OK입니다.


또한 304a등의 디렉토리는 각각의 히라가나의 Unicode를 나타내고 있어 내용은 이하와 같이 되어 있습니다


이것으로 준비가 완료됩니다.
다음 2장부터 기계 학습에 나아가고 싶습니다!



제목


1장
chainer를 기반으로 DeepLearning 환경 구축

2장
기계 학습을 통한 DeepLearning 예측 모델 만들기

3장
모델을 이용한 문자 인식

4장
데이터 확대로 인식 정밀도 향상

5장
신경망 입문 및 소스 코드 해설

6장
Optimizer 선택으로 학습 효율성 향상

7장
TTA, BatchNormalization을 통한 학습 효율 향상

좋은 웹페이지 즐겨찾기