ReNom TDA GUI를 사용하여 타이타닉 번호 데이터 분석

2497 단어 TDAReNomtitanic
개시하다
며칠 전 AI·인공지능 익스포에 갔을 때 GRID 부스에서 리넘 TDA에 대해 물었다.
데이터를 시각화하기 위해서, 나는 사용하기에 매우 편리하고 이해에 도움이 된다고 생각해서,github에서 가져왔다
한번 해봤어요.먼저 GUI를 사용하여 csv 파일을 분석해 봅니다.
차리다
리넘의 웹사이트에는 설치 절차와 사용 방법 등이 자세히 적혀 있다.
설치하다.
ReNom 호스트
http://www.renom.jp/ja/rsts/renomdl/main.html
ReNom TDA
http://www.renom.jp/ja/rsts/renomtda/main.html
ReNom TDA API의 예제 사용
http://www.renom.jp/ja/notebooks/tda/mnist-dataset-mapping/notebook.html
GUI의 사용 방법
http://www.renom.jp/ja/notebooks/tda/how-to-use-gui/notebook.html
GUI를 통한 데이터 분석의 핵심 사항
데이터 분석에서 유명한 티타닉의 데이터를 분석해 보기로 했다.그때 조금 반한 점은 다음과 같다.
  • Csv 파일은 설치된 ReNomTDA 이하의gui/data 이하로 복사해야 합니다.
  • 결손가가 있으면 원래load가 불가능하기 때문에 결손치가 있는 줄은 삭제
  • 텍스트는 분석 대상이 되지 않을 수 있으므로 수치로 대체합니다.예를 들어 sex는male=1과female=2등
  • 각 열의 이름 등 분석 대상 이외의 내용을 삭제
  • 이상은 대응하는 스크립트입니다.
    sed 's/"\([^"]*\)"/"pname"/' train.csv | cut -d, -f1,2,3,5,6,7,8,10,12 | sed '/,,/d' | sed 's/female/2/' | sed 's/male/1/' | sed 's/C/1/' | sed 's/Q/2/' | sed 's/S/3/' > train_noname.csv
    train_noname.csv를 읽으면 직사각형을 표시합니다.
    대상 데이터 Survived를 제외한 모든 계산에 사용이 선택됩니다.

    분석 결과
    먼저 일반적인 주성분을 분석하고 색깔이 서바이브드인지 살펴본다.
    생존자인지 아닌지 알 것 같은 경향이다.

    그런 다음 분석 모드를 TDA로 변경하여 분산도와 비교합니다.
    그림이 멋있는데 어떻게 보면 좋을까요?

    끝맺다
    사실대로 말하면, 나는 어떻게 읽어야 할지 모르겠다.
    TDA 자체를 이해할 필요가 있는 것 같다.

    좋은 웹페이지 즐겨찾기