자바 프로 세 스 디자인-문서 유사 성 검사 시스템-문서 출력 문자열 류
과제 에 근거 하 다 문서 유사 성 검사 시스템(작업 검사 중)
txt 출력 이 비교적 쉽 고 doc 를 실현 하려 면 poi 컨트롤 을 사용 해 야 합 니 다.방법 은 itext,pdf 형식 으로 pdfbox 를 사용 할 수 있 습 니 다.
/*
* 。doc、txt、pdf
*
*/
import java.io.*;
import org.pdfbox.pdmodel.PDDocument;
import org.textmining.text.extraction.WordExtractor;
import org.pdfbox.pdfparser.PDFParser;
import org.pdfbox.util.PDFTextStripper;
public class wordortxt {
public static String readDoc(String docFilePath) throws Exception { //doc
// doc
File f1 = new File(docFilePath);
FileInputStream in = new FileInputStream(f1);
WordExtractor extractor = null;
String text = null;
// WordExtractor
extractor = new WordExtractor();
// doc
text = extractor.extractText(in);
return text;
}
public static String readtxt(String txtFilePath) throws Exception { //txt
File f = new File(txtFilePath);
FileInputStream inputstream = new FileInputStream(f);
StringBuffer buffer = new StringBuffer();
String line; //
InputStreamReader in=new InputStreamReader(inputstream);
BufferedReader bufferreader = new BufferedReader(in);
line = bufferreader.readLine(); //
while (line != null) { // line
buffer.append(line); // buffer
buffer.append("
"); //
line = bufferreader.readLine(); //
}
// buffer
inputstream.close();
String filetext = buffer.toString();
//inputstream.getEncoding()
//filetext
return filetext;
//System.out.print(filetext);
//System.out.print(in.getEncoding());*/
}
public static String readPDF (String PDFFilePath) { //PDF
String resultPDF = null;
FileInputStream is = null;
PDDocument document = null;
try{
is = new FileInputStream(PDFFilePath);
PDFParser p = new PDFParser(is); // PDF
p.parse(); // PDF
document = p.getPDDocument(); // PDF
PDFTextStripper stripper = new PDFTextStripper(); // PDF
resultPDF = stripper.getText(document);
} catch (FileNotFoundException e){
e.printStackTrace();
} catch (IOException e ){
e.printStackTrace();
} finally {
if (is != null){
try {
is.close();
}catch (IOException e){
e.printStackTrace();
}
}
if (document != null){
try {
document.close();
}catch (IOException e){
e.printStackTrace();
}
}
}
return resultPDF;
}
}
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
vue 단일 페이지에 여러 개의 echarts 도표가 있을 때의 공용 코드 쓰기html에서: 데이터 처리는 말할 필요가 없다.응, 직접 그림을 그려: 공통 섹션: 이 페이지를 떠날 때 파괴: 추가 정보: Vue + Echarts 차트 표시 및 동적 렌더링 준비 작업 echarts 의존 설치 n...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.