pdf 해석, 내용 얻기
inputFilePath는 파일 경로 + 파일 이름입니다.
File file = new File(this.inputFilePath);
InputStream is = new FileInputStream(file);
stream = new PDFTextStream(is, this.inputFilePath);
StringBuffer sb = new StringBuffer(); int w = 680; int h = 1600; for (int i = 0; i < this.stream.getPageCnt(); i++) { try { if (i > 0) { w = 580; } RegionOutputTarget tgt1 = new RegionOutputTarget(); tgt1.addRegion(1, 1, w, h, "all"); Page p1 = this.stream.getPage(i); p1.pipe(tgt1); sb.append(tgt1.getRegionText("all"));
allRows=allTxt로.split("");내용의 줄마다 수조의 원소로 만들고
문자열 키의 줄 위치를 지정해야 합니다.
allRows[m].toUpperCase().contains(key.toUpperCase());
문자열 키의 열 위치를 지정해야 합니다.
allRows[row].toUpperCase().indexOf(key.tuUpperCase());
어떤 위치의 면적을 얻다
getAreaValue(int startRow, int endRow, int beginPos,int endPos, String allTxt)
getAreaValue의 처리 방향:
for로 시작 줄부터 끝 줄까지 각각 가져오기
for (int i = startRow; i <= endRow && i < allRows.length;++i)
모든 줄에서 시작 열부터 끝 열까지의 문자열을 캡처합니다
allRows[i].substring(beginPos, tag_end);
문제 발생:
1. 중국어 문자를 어떻게 제거하는가
public static String pureAscii(String strTem) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < strTem.length(); i++) {
String str = strTem.substring(i, i + 1);
boolean ascii = true;
for (int j = 0; j < str.length(); j++) {
char ch = str.charAt(j);
if (ch >= 127 || ch < 0)
ascii = false;
}
if (ascii)
sb.append(strTem.substring(i, i + 1));
}
strTem = sb.toString();
return strTem;
}
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.