webcrawler Watson Discovery에서 웹 크롤링 (2) 은 Watson Discovery에서 웹 크롤링을 시도하고 뉴스 기사를 Discovery에 넣어 보았습니다. 다만, 뉴스 기사 뿐만이 아니라, 주위의 메뉴등의 텍스트도 들어 버리고 있으므로, 이번은 Web 페이지의 필요한 개소만 잘라내는 방법에 대해서는 생각해 보고 싶습니다. Apatch Nutch는 플러그인에서 필요한 기능을 확장할 수 있는 메커니즘을 제공합니다. 이번에는 "웹 페이지의 필... WatsonDiscoverywebcrawler
Watson Discovery에서 웹 크롤링 (2) 은 Watson Discovery에서 웹 크롤링을 시도하고 뉴스 기사를 Discovery에 넣어 보았습니다. 다만, 뉴스 기사 뿐만이 아니라, 주위의 메뉴등의 텍스트도 들어 버리고 있으므로, 이번은 Web 페이지의 필요한 개소만 잘라내는 방법에 대해서는 생각해 보고 싶습니다. Apatch Nutch는 플러그인에서 필요한 기능을 확장할 수 있는 메커니즘을 제공합니다. 이번에는 "웹 페이지의 필... WatsonDiscoverywebcrawler