파이썬에서 초속 머신러닝'FastText'를 분류해 간단하게 사용하는 방법

주의


처리를 잘못한 건지, 아니면 대변 성능이 나쁜 건지.
불균형 데이터 & 15가지 분류에 따른 테스트 결과는 다음과 같다.
(3572, 0.524636058230683, 0.524636058230683)
나는 만약 차원 삭감 등 항목의 비약적인 정밀도를 높일 수 있다면

환경 구조

  • ※ pip로 설치하면 오류가 발생합니다.
    이를 위해git clone을 만듭니다.
  • git clone https://github.com/facebookresearch/fastText.git
    cd fastText
    make
    
  • ※ M1 칩에 "make"명령을 입력하는 중 다음 오류가 발생했습니다.
  • c++ -pthread -std=c++11 -march=native -O3 -funroll-loops -DNDEBUG -c src/args.cc
    clang: error: the clang compiler does not support '-march=native'
    
    make를 실행하는 디렉토리에 Makefile 들어가기
    만약 - march=native와 - mcpu=apple-m를 없애면 순조롭게 바꿀 수 있다.

    데이터 사용 방법


    학습한 데이터는 이렇게 저장된다

    model.txt


    label1
    당근 엉덩이
    label1
    당근 수프
    label1
    당근 슬라이스
    import sys
    import fasttext as ft
    
    # 学習モデルを作成
    model = ft.train_supervised(input="model.txt")
    
    # モデルを保存
    model.save_model("model.bin")
    
    

    모델 예측 카테고리 사용


    이렇게 하면 모델을 사용하여 유형을 예측할 수 있다.
    model.predict("にんじんジュース")
    (3572, 0.524636058230683, 0.524636058230683)
    

    참고서


    파이썬을 향한 기초가 수상한 사람


    일목요연한 파이썬 입문
    https://amzn.to/3qJWGfP

    기계 학습을 모르는 사람을 향해


    파이톤의 토대 위에서도 소개했듯이 파이톤의 기계 학습을 유창하게 이해할 수 있다
    나는 이 책으로 기계를 배웠다.
    https://amzn.to/3wLswwl
    scikit-learn 노크 20개
    https://youtu.be/Fbynk_9TfXg
  • Kaggle로 승리한 기술
  • https://amzn.to/3JKVccu
    나는 데이터의 예처리와 학습 모델을 할 때 "????"이런 경험이 있다.
    그때 읽고 통과했어.

    좋은 웹페이지 즐겨찾기