cn 과 rnn 기반 텍스트 분류 실천

본 고 는 주로 텍스트 분류 에서 CNN 네트워크 와 RNN 네트워크 를 사용 하 는 실천 을 소개 하 는데 그 중에서 CNN 은 maxPool 과 k-maxpool 로 나 뉜 다.주 퍼 에서 직접 실행 할 수 있 습 니 다.
코드 가 github 에 업로드 되 었 습 니 다.
https://github.com/yixiu00001/text-classify-cnn-rnn/blob/master/README.md
1.CNN+maxPool
text-classification-cn-maxpool 이 프로젝트 는 cnn-maxppool 관련 코드 입 니 다.
dataOwn.py

주로 word2vec 의 embedding 방법 을 바탕 으로 단어 와 index 의 매 핑 사전 을 구축 하고 단어 가 설정 값 보다 길지 않 은 padding 과 데이터 의 불 러 오기 와 batch 를 포함한다.iter
CNNDiseaseModel.py

주로 CNN 네트워크 와 관련 된 변수 초기 화 및 네트워크 구조 다.placeholder/inference 등 부분 에 중점 을 두 고 손실 부분 을 계산 합 니 다.현재 label 은 하나의 수치 만 있 고 onehot 형식 이 아니 기 때문에 sparse 를 호출 합 니 다.softmax_cross_entropy_with_logits 인터페이스. 
CNNDiseaseModelTrain.ipynb

이 파일 은 트 레이 닝 모델 의 파일 로 트 레이 닝 부분 에 서 는 전체 트 레이 닝 의 논리 다.
CNNDiseaseModelPredict.ipynb

이 파일 은 이미 훈련 된 모델 에 대해 결과 테스트 를 실시 하여 텍스트 를 입력 하여 테스트 하 는 인터페이스 와 테스트 파일 주 소 를 입력 하여 테스트 하 는 인 터 페 이 스 를 제공 합 니 다.
2.CNN-k-max-pool
여기 와 상기 공정 의 차 이 는 k-max pool 을 사 용 했 지만 이 실험 에서 효과 와 max-pool 의 차이 가 많 지 않 습 니 다.같은 파일 몇 개 포함
dataOwn.py
modelOneConv.py
trainWord2vec.ipynb
predictWord2vec.ipynb

3.text-classification-rnn
이 파일 은 rnn 을 기반 으로 한 분류 로 LSTM 나 GRU 를 선택 할 수 있 습 니 다.
rnn_model_oneLable.py
train_rnn_oneLable.ipynb
predict_rnn_oneLablelNew.ipynb

이 세 파일 에 대응 하 는 데이터 의 label 은 0,1,2 와 같은 숫자 입 니 다.
rnn_model_onehotLable.py
train_rnn_onehotLable.ipynb

이 두 파일 에 대응 하 는 데이터 의 label 은 onehot 형식 입 니 다.예 를 들 어 100000000000,01000000000 등 입 니 다.

좋은 웹페이지 즐겨찾기