자바 읽 기 워드 는 몇 가지 방법 이 있 습 니까?
3705 단어 자바
선착순http://poi.apache.org/index.htmlpoi - bin - 3.2 - FINAL - 20081019. zip 압축 패 키 지 를 다운로드 하고 안에 있 는 세 개의 jar 를 프로젝트 에 추가 합 니 다.다음은 테스트 servlet 클래스 를 쓰 겠 습 니 다.예 를 들 어 href = "/ TestPOI / readword. do? doc = F: / test. doc" 를 요청 합 니 다.
public class ReadwordServlet extends HttpServlet {
static final private String CONTENT_TYPE = "text/html; charset=gb2312";
public void doPost(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
response.setContentType(CONTENT_TYPE);
response.setHeader("Content-Disposition", "test.doc");
String doc = request.getParameter("doc");
String text = null;
try {
text = readDoc(doc);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
PrintWriter out = response.getWriter();
result(request, out, text);
}
public void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
doPost(request,response);
}
private void result(HttpServletRequest request, PrintWriter out, String text)
throws ServletException, IOException {
out.println("<h3>DOCBEGIN</h3><br/>");
out.println(text);
out.println("<br/><h3>DOCEND</h3>");
out.close();
}
/// POI WordExtractor word
private String readDoc(String doc) throws Exception{
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extrator = new WordExtractor(in);
String text = extrator.getText();
return text;
}
}
2. POI 확장 팩 tm - extractors - 0.4. jar 사용
http://mirrors.ibiblio.org/pub/mirrors/maven2/org/textmining/tm-extractors/0.4/프로젝트 에 다운로드 하고 가입 하면 하나 면 됩 니 다. POI 를 사용 하지 않 아 도 됩 니 다.
원래 readDoc (String doc) 방법 을 바 꾸 면 됩 니 다.
private String readDoc(String doc) throws Exception{
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extrator = new WordExtractor();
String text = extrator.extractText(in);
return text;
}
3. FileInputStream 스 트림 을 사용 하 는 방법:
CONTENT TYPE 를 아래 로 교체 합 니 다.
static final private String CONTENT_TYPE = "application/msword; charset=gb2312";
doPost 방법 내용 을 아래 와 바 꿉 니 다.
response.setContentType(CONTENT_TYPE);
response.setHeader("Content-Disposition", "test.doc");
String doc = request.getParameter("doc");
FileInputStream fin = new FileInputStream(doc);
OutputStream out = response.getOutputStream();
byte[] bs = new byte[2048];
for(int i=fin.read(bs); i>-1; i=fin.read(bs)){
out.write(bs, 0, i);
}
fin.close();
out.close();
4. 미들웨어 를 사용 할 수 있 습 니 다. 효 과 는 물론 좋 지만 돈 을 써 야 합 니 다. 예 를 들 어 코 한 소프트웨어 의 마이크로소프트 오 피 스 네트워크 미들웨어. http://www.kehansoft.com/soaoffice/doclist.asp 아니면 NTKO Office 도 괜찮아 요.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Is Eclipse IDE dying?In 2014 the Eclipse IDE is the leading development environment for Java with a market share of approximately 65%. but ac...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.