자바 는 poi 를 사용 하여 doc 와 docx 파일 의 구현 예 를 읽 습 니 다.

요 며칠 자바 오 류 를 공부 하 던 중 한 네티즌 이 블 로 그 를 보고 질문 을 했다.즉,그의 doc 문서 가 왜 내 가 말 한 방법 으로 죽 어 라 사 는 것 이 난 장 판 이 냐 는 것 이다.
나 는 처음에 그의 방법 문제 라 고 생각 했 는데,결국 스스로 시험 해 보 니 그의 결과 와 마찬가지 로 엉망 이 었 다.
그래서 인터넷 에서 한참 을 검색 한 후에 야 원래 doc 문 서 는 엑셀 과 마찬가지 로 일반적인 io 스 트림 방법 으로 읽 을 수 없고 poi 도 필요 하 다 는 것 을 알 게 되 었 다.그래서 시 도 를 한 후에 마침내 정확 한 인 코딩 형식 으로 이 doc 파일 을 읽 었 다.
인터넷 에서 검색 하 는 과정 에서 doc 와 docx 의 읽 기 방법 이 다르다 는 것 을 발견 하여 docx 파일 의 간단 한 읽 기 를 배 웠 습 니 다.
1.가방 안내:
doc 파일 을 읽 으 려 면 poi-scratchpad 의 jar 패키지 와 관련 의존 패 키 지 를 가 져 와 야 합 니 다:

docx 파일 을 읽 으 려 면 poi-ooxml 의 jar 패키지 와 관련 의존 패 키 지 를 가 져 와 야 합 니 다.

제 가 사용 하 는 것 은 Maven 구축 프로젝트 입 니 다.관련 의존 패 키 지 는 자동 으로 가 져 옵 니 다.Maven 패 키 지 는 다음 과 같 습 니 다.

 <dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>3.8</version>
  </dependency>
  <dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-scratchpad</artifactId>
    <version>3.8</version>
  </dependency>
2.파일 을 읽 는 코드:
1.doc 파일 읽 기 간단 한 예제:

public static void readAndWriterTest3() throws IOException {
    File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.doc");
    String str = "";
    try {
      FileInputStream fis = new FileInputStream(file);
      HWPFDocument doc = new HWPFDocument(fis);
      String doc1 = doc.getDocumentText();
      System.out.println(doc1);
      StringBuilder doc2 = doc.getText();
      System.out.println(doc2);
      Range rang = doc.getRange();
      String doc3 = rang.text();
      System.out.println(doc3);
      fis.close();
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
2.docx 파일 읽 기 간단 한 예제:

public static void readAndWriterTest4() throws IOException {
    File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.docx");
    String str = "";
    try {
      FileInputStream fis = new FileInputStream(file);
      XWPFDocument xdoc = new XWPFDocument(fis);
      XWPFWordExtractor extractor = new XWPFWordExtractor(xdoc);
      String doc1 = extractor.getText();
      System.out.println(doc1);
      fis.close();
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
나 는 업무 중 에 워드 를 조작 한 적 이 없다.이 블 로그 도 단지 일시적인 흥 행 일 뿐 이기 때문에 매우 간단하게 썼 다.
최근 에 친구 들 이 저 를 찾 아와 관련 된 질문 을 했 습 니 다.그 중 몇 명 은 가방 에 의존 하 는 것 이 어떤 것 이 있 는 지 물 었 습 니 다.이런 질문 에 거듭 대답 하지 않도록 가방 캡 처 에 의존 하 겠 습 니 다.

자바 가 poi 를 사용 하여 doc 와 docx 파일 을 읽 는 실현 예제 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.자바 poi 가 doc 와 docx 내용 을 읽 는 것 에 관 한 더 많은 것 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 많은 지원 바 랍 니 다!

좋은 웹페이지 즐겨찾기