자바 는 poi 를 사용 하여 doc 와 docx 파일 의 구현 예 를 읽 습 니 다.
나 는 처음에 그의 방법 문제 라 고 생각 했 는데,결국 스스로 시험 해 보 니 그의 결과 와 마찬가지 로 엉망 이 었 다.
그래서 인터넷 에서 한참 을 검색 한 후에 야 원래 doc 문 서 는 엑셀 과 마찬가지 로 일반적인 io 스 트림 방법 으로 읽 을 수 없고 poi 도 필요 하 다 는 것 을 알 게 되 었 다.그래서 시 도 를 한 후에 마침내 정확 한 인 코딩 형식 으로 이 doc 파일 을 읽 었 다.
인터넷 에서 검색 하 는 과정 에서 doc 와 docx 의 읽 기 방법 이 다르다 는 것 을 발견 하여 docx 파일 의 간단 한 읽 기 를 배 웠 습 니 다.
1.가방 안내:
doc 파일 을 읽 으 려 면 poi-scratchpad 의 jar 패키지 와 관련 의존 패 키 지 를 가 져 와 야 합 니 다:
docx 파일 을 읽 으 려 면 poi-ooxml 의 jar 패키지 와 관련 의존 패 키 지 를 가 져 와 야 합 니 다.
제 가 사용 하 는 것 은 Maven 구축 프로젝트 입 니 다.관련 의존 패 키 지 는 자동 으로 가 져 옵 니 다.Maven 패 키 지 는 다음 과 같 습 니 다.
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>3.8</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>3.8</version>
</dependency>
2.파일 을 읽 는 코드:1.doc 파일 읽 기 간단 한 예제:
public static void readAndWriterTest3() throws IOException {
File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.doc");
String str = "";
try {
FileInputStream fis = new FileInputStream(file);
HWPFDocument doc = new HWPFDocument(fis);
String doc1 = doc.getDocumentText();
System.out.println(doc1);
StringBuilder doc2 = doc.getText();
System.out.println(doc2);
Range rang = doc.getRange();
String doc3 = rang.text();
System.out.println(doc3);
fis.close();
} catch (Exception e) {
e.printStackTrace();
}
}
2.docx 파일 읽 기 간단 한 예제:
public static void readAndWriterTest4() throws IOException {
File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.docx");
String str = "";
try {
FileInputStream fis = new FileInputStream(file);
XWPFDocument xdoc = new XWPFDocument(fis);
XWPFWordExtractor extractor = new XWPFWordExtractor(xdoc);
String doc1 = extractor.getText();
System.out.println(doc1);
fis.close();
} catch (Exception e) {
e.printStackTrace();
}
}
나 는 업무 중 에 워드 를 조작 한 적 이 없다.이 블 로그 도 단지 일시적인 흥 행 일 뿐 이기 때문에 매우 간단하게 썼 다.최근 에 친구 들 이 저 를 찾 아와 관련 된 질문 을 했 습 니 다.그 중 몇 명 은 가방 에 의존 하 는 것 이 어떤 것 이 있 는 지 물 었 습 니 다.이런 질문 에 거듭 대답 하지 않도록 가방 캡 처 에 의존 하 겠 습 니 다.
자바 가 poi 를 사용 하여 doc 와 docx 파일 을 읽 는 실현 예제 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.자바 poi 가 doc 와 docx 내용 을 읽 는 것 에 관 한 더 많은 것 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 많은 지원 바 랍 니 다!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Is Eclipse IDE dying?In 2014 the Eclipse IDE is the leading development environment for Java with a market share of approximately 65%. but ac...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.