NLP: sklearn 중 fit, fittransform, transform 의 차이
1919 단어 NLP
fit 원 의 는 설치, 적합 하 다 는 뜻 을 말 하 는데 사실은 train 의 의미 가 있 지만 train 과 달리 훈련 과정 이 아니 라 적당 한 과정 이 고 과정 은 모두 정 해진 것 이 며 마지막 으로 통 일 된 전환 규칙 모델 만 얻 었 다.
transform: 데 이 터 를 변환 하 는 것 입 니 다. 예 를 들 어 데이터 의 획일 화 와 표준화, 테스트 데 이 터 를 훈련 데이터 와 같은 모델 에 따라 변환 하여 특징 벡터 를 얻 습 니 다.
fit_transform: fit 와 transform 의 결합 이 라 고 볼 수 있 습 니 다. 훈련 단계 에서 fit 를 사용 하면transform 은 테스트 단계 에서 테스트 샘플 을 transform 하면 됩 니 다.
예 를 들 면:
:
corpus = _readbunchobj(wordbag_path).contents
tf_vectorizer = CountVectorizer(max_df=0.95,min_df=2,stop_words=stpwrdlst)
tf = tf_vectorizer.fit_transform(corpus)
:
contents = _readfile(file_name)
tf = tf_vectorizer.transform([contents])
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
문장 분류 어노테이션을 ipywidgets로 UI를 작성하여 효율화문서 분류 어노테이션을 조금이라도 편하게 하기 위해, 노트북상에서 움직이는 어노테이션용 UI를 ipywidgets로 구현했습니다. 아래는 실제 화면입니다 (livedoor 뉴스를 어노테이션하는 형태를 가정). 버튼을...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.