H2O 시도해 보았습니다.

5235 단어 OSSh2o

소개



이전부터 오픈 소스의 기계 학습 플랫폼인 H2O가 신경이 쓰였으므로, 시험에 사용해 보았습니다. 데이터를 투입해 기계 학습 모델을 구축하는 곳까지를 소개하고 싶습니다.

환경



환경은 다음과 같습니다. H2O를 사용할 때 java를 사용하기 때문에 java 버전도 보여줍니다.
$sw_vers 
ProductName:    Mac OS X
ProductVersion: 10.13.6
BuildVersion:   17G9016

$java --version
java 10.0.2 2018-07-17
Java(TM) SE Runtime Environment 18.3 (build 10.0.2+13)
Java HotSpot(TM) 64-Bit Server VM 18.3 (build 10.0.2+13, mixed mode)

설치



1. 아래 URL에 액세스합니다.
htps //w w. h2 오. 아이 / 도 w 응 아 d / # h2 오

2. DOWNLOAD H2O 버튼을 클릭하여 다운로드합니다. 이번에 사용한 버전 3.28.0.1이라고 370MB 정도있었습니다.



3. 위 그림과 같이 unzipjava에서 실행합니다.

$ls
h2o-3.28.0.1.zip

$unzip h2o-3.28.0.1.zip 
Archive:  h2o-3.28.0.1.zip
   creating: h2o-3.28.0.1/
  inflating: h2o-3.28.0.1/h2o.jar    
   creating: h2o-3.28.0.1/bindings/
   creating: h2o-3.28.0.1/bindings/java/
 extracting: h2o-3.28.0.1/bindings/java/h2o-bindings-3.28.0.zip  
   creating: h2o-3.28.0.1/python/
  inflating: h2o-3.28.0.1/python/h2o-3.28.0.1-py2.py3-none-any.whl  
   creating: h2o-3.28.0.1/R/
  inflating: h2o-3.28.0.1/R/h2o_3.28.0.1.tar.gz  

$ls
h2o-3.28.0.1     h2o-3.28.0.1.zip

$java -jar h2o.jar 
(省略)
12-26 09:29:48.515 10.138.116.160:54321  9516   main      INFO: Registered: 186 REST APIs in: 785ms
12-26 09:29:48.517 10.138.116.160:54321  9516   main      INFO: Registered REST API extensions: [Amazon S3, XGBoost, Algos, AutoML, Core V3, TargetEncoder, Core V4]
12-26 09:29:49.113 10.138.116.160:54321  9516   main      INFO: Registered: 279 schemas in 591ms
12-26 09:29:49.113 10.138.116.160:54321  9516   main      INFO: H2O started in 3884ms
12-26 09:29:49.114 10.138.116.160:54321  9516   main      INFO: 
12-26 09:29:49.114 10.138.116.160:54321  9516   main      INFO: Open H2O Flow in your web browser: http://10.138.116.160:54321
12-26 09:29:49.114 10.138.116.160:54321  9516   main      INFO: 


4. 웹 브라우저에서 localhost:54321에 액세스하면 H2O 화면이 표시됩니다.



모델 구축



위 그림의 "Assistance"에서 "importFiles"를 클릭하십시오.
검색에 파일 경로를 입력합니다. 이번에는 YellowBrick을 소개한 기사에서 다룬 공유 자전거 데이터를 사용합니다.
그런 다음 가져오기를 클릭한 다음 Parse these files를 클릭합니다.



파일 로딩을 설정합니다. 이 시점에서 데이터의 각 항목과 처음 몇 줄의 내용을 볼 수 있습니다. 행과 열이 서로 바뀌는 것처럼 표시됩니다. 하단의 "Parse"를 클릭하십시오.



데이터의 기본 통계가 표시됩니다. type의 "real"은 요컨대 float일까 생각합니다.
이번에는 아무것도하지 않고 "Build Model"으로 진행합니다.



알고리즘을 선택하거나 목적 변수를 선택합니다. 이번에는 알고리즘에 XGBoost를, 목적 변수로 riders를 선택합니다.



덧붙여 알고리즘은 16개 준비되어 있습니다만, Word2Vec와 같은 자연 언어 처리로 사용하는 것도 준비되어 있었습니다.



이번에는 데이터량이 적은 탓인지 1,2분 만에 구축이 종료되었습니다.
학습시의 수렴해 가는 모습이나, 각 평가 지표를 확인할 수 있습니다.





요약



프로그래밍이 필요 없어 기계 학습 모델을 쉽게 구축할 수 있었습니다.
모델의 출력도 가능하기 때문에 모델을 배포하는 것도 간단하다고 생각했습니다.
앞으로 기회가 있으면 사용하고 싶습니다.

좋은 웹페이지 즐겨찾기