자바 읽 기 워드 는 몇 가지 방법 이 있 습 니까?

3705 단어 자바
1. apache poi 구성 요소 사용
   선착순http://poi.apache.org/index.htmlpoi - bin - 3.2 - FINAL - 20081019. zip 압축 패 키 지 를 다운로드 하고 안에 있 는 세 개의 jar 를 프로젝트 에 추가 합 니 다.다음은 테스트 servlet 클래스 를 쓰 겠 습 니 다.예 를 들 어 href = "/ TestPOI / readword. do? doc = F: / test. doc" 를 요청 합 니 다.
    public class ReadwordServlet extends HttpServlet {
    static final private String CONTENT_TYPE = "text/html; charset=gb2312";
    public void doPost(HttpServletRequest request, HttpServletResponse response)
    throws ServletException, IOException {
            response.setContentType(CONTENT_TYPE);
            response.setHeader("Content-Disposition", "test.doc");
            String doc = request.getParameter("doc");
            
            String text = null;
            try {
                text = readDoc(doc);
            } catch (Exception e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
            PrintWriter out = response.getWriter();
            result(request, out, text);
    }
    public void doGet(HttpServletRequest request, HttpServletResponse response)
    throws ServletException, IOException {
            doPost(request,response);
    }
    private void result(HttpServletRequest request, PrintWriter out, String text)
    throws ServletException, IOException {
        out.println("<h3>DOCBEGIN</h3><br/>");
        out.println(text);
        out.println("<br/><h3>DOCEND</h3>");
        out.close();
    }
///  POI WordExtractor     word  
   private String readDoc(String doc) throws Exception{
      FileInputStream in = new FileInputStream(new File(doc));
       WordExtractor extrator = new WordExtractor(in);
    String text = extrator.getText();
    return text;
   }

}

 
2. POI 확장 팩 tm - extractors - 0.4. jar 사용
http://mirrors.ibiblio.org/pub/mirrors/maven2/org/textmining/tm-extractors/0.4/프로젝트 에 다운로드 하고 가입 하면 하나 면 됩 니 다. POI 를 사용 하지 않 아 도 됩 니 다.
원래 readDoc (String doc) 방법 을 바 꾸 면 됩 니 다.
    private String readDoc(String doc) throws Exception{
        FileInputStream in = new FileInputStream(new File(doc));
        WordExtractor extrator = new WordExtractor();
        String text = extrator.extractText(in);
        return text;
    }

 
3. FileInputStream 스 트림 을 사용 하 는 방법:
CONTENT TYPE 를 아래 로 교체 합 니 다.
static final private String CONTENT_TYPE = "application/msword; charset=gb2312";
doPost 방법 내용 을 아래 와 바 꿉 니 다.
 
response.setContentType(CONTENT_TYPE);
            response.setHeader("Content-Disposition", "test.doc");
            String doc = request.getParameter("doc");
   FileInputStream fin = new FileInputStream(doc);
           OutputStream out = response.getOutputStream();
           byte[] bs = new byte[2048];
           for(int i=fin.read(bs); i>-1; i=fin.read(bs)){
               out.write(bs, 0, i);
           }
           fin.close();
           out.close();

 
4. 미들웨어 를 사용 할 수 있 습 니 다. 효 과 는 물론 좋 지만 돈 을 써 야 합 니 다. 예 를 들 어 코 한 소프트웨어 의 마이크로소프트 오 피 스 네트워크 미들웨어.    http://www.kehansoft.com/soaoffice/doclist.asp    아니면 NTKO Office 도 괜찮아 요.

좋은 웹페이지 즐겨찾기