elasticsearch 대량 인덱스 데이터

1563 단어 elasticsearch
Solr를 접촉한 지 얼마 되지 않아 그와 같은 등급의elasticsearch가 최근에 매우 인기가 있다는 것을 발견했다. 자신이 테스트를 설치한 후에 Solr보다 사용하기 좋다고 느꼈다. 적어도 Solr처럼 많은 설정(초급 인식)은 아니다.elasticsearch에 접촉하면 색인을 만드는 문제를 연구해야 한다. 현재 각 방면의 데이터 양이 끊임없이 증가하고 있기 때문에elasticsearch의 대량 색인에 매우 유용하다.
다음 대량 색인 코드:
Settings settings=ImmutableSettings.settingsBuilder()
		.put("client.transport.sniff",true).put("cluster.name","myelasticsearch").build();
// transport
		Client client=new TransportClient(settings).addTransportAddress(
				new InetSocketTransportAddress("192.168.1.100",9300));
// 
BulkRequestBuilder bulkRequest=client.prepareBulk();
				while(rs.next()){
// json 
					bulkRequest.add(client.prepareIndex("ryxx","tweet",rs.getString("id")).setSource(jsonBuilder().startObject()
														.field("name",rs.getString("name"))
							.field("age",rs.getString("age"))
							.field("address",rs.getString("address"))
							.field("phone",rs.getString("phone"))
							.endObject()
					));
				}
// 
				BulkResponse bulkResponse=bulkRequest.execute().actionGet();
// 
				if(bulkResponse.hasFailures()){
					System.out.println(bulkResponse.buildFailureMessage());
					
				}

데이터 제출 속도는 데이터베이스 조회 속도, 기계 설정 등과 관련이 있고 집단이라면 네트워크 대역폭과 관련이 있다.그리고 내 설정: index.number_of_shards:5 즉 5개의 분할 인덱스.number_of_replics:1 즉, 조각마다 백업이 있습니다.

좋은 웹페이지 즐겨찾기