Twitter에서 NiFi로 데이터를 수집하고 데이터 흐름을 제어하고 Solr + Banana로 시각화해 봅시다.
7434 단어 bananaNiFiHortonworksSolrhadoop
Hortonworks의 전시 부스 등에서 보았을지도 모르지만 Twitter에서 데이터를 NiFi로 수집하고 Apache Solr + Banana에서 시각화하는 데모를 만드는 방법을 설명합니다. 환경으로서는, VMware, Virtual Box등에서도 만들 수 있습니다만, 이번은 Microsoft Azure상에 만들고 싶습니다.
사실, 이 자료는 영어 튜토리얼 Analyzing Social Media and Customer Sentiment With Apache NiFi and HDP Search이 원래 자료입니다.
Azure에서 Hortonworks Data Platform (HDP) 배포
Hadoop, Spark를 Azure의 Hortonworks Data Platform에서 사용해 보세요.을 참조하십시오.
Hortonworks DataFlow (HDF) 설정
kkitase$ scp ~/Downloads/HDF-2.0.0.0-579.tar.gz kkitase@ip-address:/home/kkitase
kkitase$ ssh <username>@<ip address>
[kkitase@sandbox ~]$ sudo yum install java-1.8.0-openjdk java-1.8.0-openjdk-devel
[kkitase@sandbox ~]$ mkdir hdf
[kkitase@sandbox ~]$ mv HDF-2.0.0.0-579.tar.gz hdf
[kkitase@sandbox ~]$ cd hdf
[kkitase@sandbox hdf]$ tar -xvf HDF-2.0.0.0-579.tar.gz
[kkitase@sandbox hdf]$ vi HDF-2.0.0.0/nifi/conf/nifi.properties
nifi.web.http.port=8080
↓変更
nifi.web.http.port=9090
[kkitase@sandbox hdf]$ ./HDF-2.0.0.0/nifi/bin/nifi.sh start
http://ip-address:9090/nifi에 액세스하면 NiFi UI가 표시됨
Solr 설정
[kkitase@sandbox ~]$ sudo chown -R solr:solr /opt/lucidworks-hdpsearch/solr
[kkitase@sandbox ~]$ sudo su solr
[solr@sandbox kkitase]$ cp -r /opt/lucidworks-hdpsearch/solr/server/solr/configsets/data_driven_schema_configs /opt/lucidworks-hdpsearch/solr/server/solr/configsets/tweet_configs
[solr@sandbox kkitase]$ vi /opt/lucidworks-hdpsearch/solr/server/solr/configsets/tweet_configs/conf/solrconfig.xml
<processor class="solr.ParseLongFieldUpdateProcessorFactory"/>
<processor class="solr.ParseDateFieldUpdateProcessorFactory">
<arr name="format">
<str>EEE MMM d HH:mm:ss Z yyyy</str> ★この行を追加
<str>yyyy-MM-dd'T'HH:mm:ss.SSSZ</str>
<str>yyyy-MM-dd'T'HH:mm:ss,SSSZ</str>
<str>yyyy-MM-dd'T'HH:mm:ss.SSS</str>
<str>yyyy-MM-dd'T'HH:mm:ss,SSS</str>
<str>yyyy-MM-dd'T'HH:mm:ssZ</str>
</arr>
</processor>
</processor>
[solr@sandbox kkitase]$ cd /opt/lucidworks-hdpsearch/solr/server/solr-webapp/webapp/banana/app/dashboards/
[solr@sandbox dashboards]$ mv default.json default.json.orig
[solr@sandbox dashboards]$ wget https://raw.githubusercontent.com/abajwa-hw/ambari-nifi-service/master/demofiles/default.json
[solr@sandbox dashboards]$ export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk.x86_64
[solr@sandbox dashboards]$ /opt/lucidworks-hdpsearch/solr/bin/solr start -c -z localhost:2181
[solr@sandbox dashboards]$ /opt/lucidworks-hdpsearch/solr/bin/solr create -c tweets -d tweet_configs -s 1 -rf 1
[solr@sandbox dashboards]$ exit
[kkitase@sandbox ~]$ sudo su -
[root@sandbox ~]# yum install -y ntp
[root@sandbox ~]# service ntpd stop
[root@sandbox ~]# ntpdate pool.ntp.org
[root@sandbox ~]# service ntpd start
http://ip-address:8983/solr/에 액세스하면 Solr UI가 표시됨
Twitter Apps 만들기
htps : // 아 ps. 라고 r. 코m/ 방문
Keys and Access Tokens에서 다음 값을 복사하십시오.
NiFi에서 흐름 설정
Solr 시각화 도구 Banana로 확인
http://ip-address:8983/solr/banana/index.html#/dashboard로 이동하여 올바르게 설정된 키워드가 시각화되었는지 확인
위에서 NiFi에서 Twitter에서 데이터를 수집하고 데이터 흐름을 제어하고 Solr에 데이터를 저장하고 Banana에서 시각화하는 데모 작성 절차에 대해 설명했습니다. 영어의 튜토리얼에는 계속이 있으므로, 다음에 또, 정리해 일본어로 해 보고 싶습니다.
Reference
이 문제에 관하여(Twitter에서 NiFi로 데이터를 수집하고 데이터 흐름을 제어하고 Solr + Banana로 시각화해 봅시다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kkitase/items/eedb273d6bfe2b8b6737텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)