NLP: sklearn 중 fit, fittransform, transform 의 차이

1919 단어 NLP
참고:http://blog.csdn.net/qq_35082030/article/details/70338654
fit 원 의 는 설치, 적합 하 다 는 뜻 을 말 하 는데 사실은 train 의 의미 가 있 지만 train 과 달리 훈련 과정 이 아니 라 적당 한 과정 이 고 과정 은 모두 정 해진 것 이 며 마지막 으로 통 일 된 전환 규칙 모델 만 얻 었 다.
transform: 데 이 터 를 변환 하 는 것 입 니 다. 예 를 들 어 데이터 의 획일 화 와 표준화, 테스트 데 이 터 를 훈련 데이터 와 같은 모델 에 따라 변환 하여 특징 벡터 를 얻 습 니 다.
fit_transform: fit 와 transform 의 결합 이 라 고 볼 수 있 습 니 다. 훈련 단계 에서 fit 를 사용 하면transform 은 테스트 단계 에서 테스트 샘플 을 transform 하면 됩 니 다.
예 를 들 면:
corpus = _readbunchobj(wordbag_path).contents
tf_vectorizer = CountVectorizer(max_df=0.95,min_df=2,stop_words=stpwrdlst)
tf = tf_vectorizer.fit_transform(corpus)
contents = _readfile(file_name)
tf = tf_vectorizer.transform([contents])

좋은 웹페이지 즐겨찾기