Ubuntu에 KH Coder 설치(2021)

7611 단어 KHCoder
이거 뭐야?
이 기사를 읽으면 KH Coder를 Ubuntu에 넣기가 얼마나 힘든지 알 수 있다.시간순으로 적었지만 다 기록된 건 아니어서 재현성은 없겠죠.
언제든지 간단하게 Docker를 제공할 수 있을 것 같습니다.
Docker로 KH Coder 이동하기(2022)
컨디션
Azure에 설치된 "Ubuntu 20.4.2 LTE"서버
최종 설치
  • Java(OpenJDK 11.0.11)
  • R3.6.3 및 다양한 포장
  • mecab와 사전
  • Perl의 모듈
  • mysql5.6(5.7 이후에는 안 됩니다. 정상적으로 설치하면 8.0이 됩니다)
  • 참고 자료
    https://github.com/ko-ichi-h/khcoder/issues/91
    펄이 5.30개라서 이렇게 사용했어요.또 한자 코드는 UTF-8을 사용할 수 있다.EUC-JP가 전혀 없어요.
    Java
    먼저 JRE에 가입합니다.몰라, JDK도 합류했어.
    $ sudo apt install default-jre
    $ java --version
    openjdk 11.0.11 2021-04-20
    
    $ sudo apt install default-jdk
    $ javac --version
    javac 11.0.11
    
    R
    아마 대본명 R일 거예요.3.6.3 늙은이.
    $ sudo apt install r-base
    $ R
    R version 3.6.3 (2020-02-29) -- "Holding the Windsock"
    
    R의 포장
    이것은 정말 위대하고 고생스럽다.정말 다 필요한 건 의문이야.그리고 다 설치되었는지도 확실하지 않다.
    sudo -i R
    
    이렇게 되면 R의 힌트가 나오기 때문에 아래의 포장을 설치했습니다.
    install.packages("ade4", dependencies=TRUE)
    install.packages("amap", dependencies=TRUE)
    install.packages("Cairo", dependencies=TRUE)
    install.packages("cluster", dependencies=TRUE)
    install.packages("codetools", dependencies=TRUE)
    install.packages("colorspace", dependencies=TRUE)
    install.packages("dichromat", dependencies=TRUE)
    install.packages("foreign", dependencies=TRUE)
    install.packages("ggdendro", dependencies=TRUE)
    install.packages("ggplot2", dependencies=TRUE)
    install.packages("ggnetwork", dependencies=TRUE)
    install.packages("ggsci", dependencies=TRUE)
    install.packages("gtable", dependencies=TRUE)
    install.packages("igraph", dependencies=TRUE)
    install.packages("KernSmooth", dependencies=TRUE)
    install.packages("lattice", dependencies=TRUE)
    install.packages("maptools", dependencies=TRUE)
    install.packages("MASS", dependencies=TRUE)
    install.packages("Matrix", dependencies=TRUE)
    install.packages("mgcv", dependencies=TRUE)
    install.packages("munsell", dependencies=TRUE)
    install.packages("nlme", dependencies=TRUE)
    install.packages("nnet", dependencies=TRUE)
    install.packages("permute", dependencies=TRUE)
    install.packages("pheatmap", dependencies=TRUE)
    install.packages("plyr", dependencies=TRUE)
    install.packages("proto", dependencies=TRUE)
    install.packages("RColorBrewer", dependencies=TRUE)
    install.packages("Rcpp", dependencies=TRUE)
    install.packages("reshape2", dependencies=TRUE)
    install.packages("rgl", dependencies=TRUE)
    install.packages("rpart", dependencies=TRUE)
    install.packages("scales", dependencies=TRUE)
    install.packages("scatterplot3d", dependencies=TRUE)
    install.packages("slam", dependencies=TRUE)
    install.packages("som", dependencies=TRUE)
    install.packages("sp", dependencies=TRUE)
    install.packages("spatial", dependencies=TRUE)
    install.packages("stringr", dependencies=TRUE)
    install.packages("survival", dependencies=TRUE)
    install.packages("vegan", dependencies=TRUE) 
    install.packages("wordcloud", dependencies=TRUE)
    
    이렇게 간단하게 쓰면 사실 하나하나 하면 부족한 착오가 많이 생길 수 있다.필요한 걸 적으실 수도 있어요.
    gtable が を  する
    $sudo apt install libcurl4-gnutls-dev
    $sudo apt install libcurl4-openssl-dev libssl-dev
    maptools が を  する
    $sudo apt install libgeos-dev
    rgl が を  する
    $sudo apt-get install libfontconfig1-dev
    $sudo apt install libv8-dev
    $sudo apt install libmagick++-dev
    $sudo apt install libharfbuzz-dev libfribidi-dev
    
    그리고 R이 켜질 때마다 LANG 오류가 발생해서 역겨워요.JP.UTF-8을 사용했습니다.LANG도 기본적으로 ja입니다.JP.UTF-8이 됐어요.
    $ sudo apt install language-pack-ja
    $ sudo update-locale LANG=ja_JP.UTF-8
    
    mecab
    처음에 채슨에 합류했지만 KH 코더는 제대로 작동하지 못했다.(chasen 이동).그 과정에서darts도 번역되었다.나중에 자세히 보면 appt get으로darts에 가입할 수 있습니다.그리고 미카비의 생일이 필요한지 모르겠다.
    $ sudo apt install mecab
    $ sudo apt install mecab-ipadic-utf8
    
    /etc/mecabrc 마지막으로 지정한 사전의 지정과Chasen 교환이 필요합니다.디디어가 처음 이상한 사전을 넣었기 때문에 변경할 필요가 있을 것 같아요.순서대로 넣으면 변경할 필요가 없어요.
    dicdir = /var/lib/mecab/dic/ipadic-utf8
    
    
    ; ChaSen
    node-format-chasen = %m\t%f[7]\t%f[6]\t%F-[0,1,2,3]\t%f[4]\t%f[5]\n
    unk-format-chasen  = %m\t%m\t%m\t%F-[0,1,2,3]\t\t\n
    eos-format-chasen  = EOS\n
    
    Perl 모듈
    두 번에 걸쳐 모듈 설치
    $sudo perl -MCPAN -e shell
    
    cpan> install Bundle::CPAN 
    
    여기서 힌트를 먼저 종료하겠습니다.
    $sudo perl -MCPAN -e shell
    
    cpan >
    install Jcode
    install Tk
    install DBI
    install DBD::CSV
      でテストについて かれるので y で  する 
    
    install File::BOM
    install Lingua::JA::Regular::Unicode
    install Net::Telnet
    install Excel::Writer::XLSX
    install DBD::mysql
    install Spreadsheet::ParseExcel::FmtJapan
    install Spreadsheet::ParseXLSX
    install Statistics::ChisqIndep
    install Statistics::Lite
    install Unicode::Escape
    install Algorithm::NaiveBayes
    install Lingua::Sentence
    install Proc::Background
    
    여기에 mysql 모듈이 설치되어 있습니다.mysql을 먼저 설치해야 할 수도 있습니다.그리고 뭘 설치한 줄 알았는데 설치를 안 했어, 여기 설치도 이상해
    mysql 5.6
    사실 그 전에 mysql의 8.0을 넣었어요.KH 코드가 움직이지 않습니다.5.6 설치는 메이크겠죠.16.04용 창고를 사용하면 5.6을 설치할 수 있기 때문에 그에 의존하는 좋지 않은 환경 구축 방법이다.
    $echo 'deb http://cz.archive.ubuntu.com/ubuntu xenial main' >> /etc/apt/sources.list
    $apt-get update
    $sudo apt-get install mysql-server-5.6
    
    위의 mysql5.6 설치 과정에서 비밀번호를 물어볼 수 있기 때문에 적당히 결정합니다.8.0 물어보지 않았는데 안전 관계에 변화가 생겼나 봐요.
    그리고 mysql5.6 서버를 시작해야 합니다.8.0을 먼저 넣은 관계로 환경이 엉망진창이 된 것이다.그냥 넣어두면 될 것 같아서요.
    KH Coder 다운로드, 설정 및 실행
    KH Coder 는 github 에서 clone 을 시작할 수 있습니다.
    $ git clone https://github.com/ko-ichi-h/khcoder
    
    khcoder에서perl을 실행하면 됩니다. 사실 그 전에 config/coder를 실행합니다.ini를 제대로 쓰지 않으면 잘 돌아가지 못한다.
    config/coder.ini는 최초로 존재하지 않았습니다. (왜요?)한번 실행하면 될 것 같은데.
    mecab_unicode   UTF-8
    mecabrc_path    /etc/mecabrc
    sql_username    root
    sql_password    mysql の root のパスワード
    
    내 환경에서 먼저 ssh로 아지트에 들어가 옆에 있는 리눅스의 X 윈도에서 공격수를 맡았다.
    $ ssh -X nn.nn.nn.nn
    
    $ cd khcoder
    $ perl ./kh_coder.pl
    
    인터넷을 통해서라 전개가 느리다.순조롭게 진행되면 입문한 하목가석의 마음을 분석할 수 있다.


    시행착오
    간단하게 썼지만 이틀이 걸려요.
    chasen
    결과는 소용없다.못 썼다든가.왜 사용할 수 없는지는 수수께끼다.utf-8로 시작하면 chasen-iw가 필요할 것 같은데 KH Coder를 고려하지 않았습니다.저는 셸 프로그램으로 그걸 피하려고 했어요.
    mecab로 이동하기 때문에 chasen이 필요 없습니다
    mecab 사전
    처음에는 어느 사이트에서 쓴 순서대로 mecab의 사전을 만들었다.이 사전은 훌륭해 보이지만 KH Coder가 구상한 Chasen이 교환한 정보를 제공할 수는 없다.mecab-ipadic-Neologd요?python 3부터 사용하는 게 좋을 것 같아요.-Ochasen에서 잘 안 되면 사전을 의심하세요.
    이곳의 정보가 작용했다.고맙습니다.
    https://kshi-kshi.hatenadiary.org/entry/20110102/1293920002
    MySQL
    원래 8.0이 설치되어 있습니다.이후 5.6을 설치했는데 환경이 나빠진 것 같아 시동이 잘 걸리지 않았다.많은 것을 닦았더니 잘 풀렸다.
    stanford postagger
    영어의 어성이기 때문에 필요 없어요.coder를 다운로드합니다.ini를 지정하면 영어를 해석할 수 있을 것 같습니다.

    좋은 웹페이지 즐겨찾기