SpringBoot+Tess4j 가 강압 적 인 OCR 식별 도 구 를 실현 하 는 예시 코드

머리말
"바람 속 너의 볼 을 기다 릴 수 없어."
눈물 이 화기애애 할 정도 로 아름답다
숨 은 비가 내리 기 를 기다 릴 수 없다.
"내 눈물 이 너 에 게 들 켰 다."
반복 되 는 노래 를 들 으 며 오 랜 만 에 bug 라 고 쓰 여 있 습 니 다.그래,하루 야.마침 한 동료 가 공구 소 를 만들어 놀 까 하 는 말 을 했다.나 는 공구 소 를 마음대로 찾 아 보 니 문자 가 있 는 OCR 식별 기능 이 많다.그래서 예전 에 알 고 있 던 매우 유행 하 는 개원 의 OCR 대신 급 프로젝트 인 Tesseract OCR 이 생각 났 다.
간단 한 소개
홈 페이지 는 아래 와 같다.

tesseract-ocr.github.io/
간단명료 하 게 github 에 걸 린 사이트.

상세 한 것 은 더 이상 소개 하지 않 고 관심 이 있 는 것 은 동지 사이트 에 들 어 갈 수 있 습 니 다https://github.com/tesseract-ocr/tesseract학습 을 참관 할 수 있 습 니 다.
실습 준비
개발 에 사용 하려 면 해당 API 에 접속 해 야 합 니 다.

개발 자 에 게 Api 호출 을 위해 많은 Wrapper 를 제공 합 니 다.

자바 의 작은 개발 에 있어 서 tess4j 를 사용 하여 Api 로 사용 합 니 다.홈 페이지 는 다음 과 같 습 니 다.
tess4j.sourceforge.net/
jar 가방 을 직접 다운로드 하거나 Maven 의존 다운로드 로 다운로드 할 수 있 습 니 다.

<!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
<dependency>
  <groupId>net.sourceforge.tess4j</groupId>
  <artifactId>tess4j</artifactId>
  <version>4.5.3</version>
</dependency>
개발 실현
첫 번 째 생 성 프로젝트

두번째 추가 의존

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>

  <groupId>org.example</groupId>
  <artifactId>test-textocr</artifactId>
  <version>1.0-SNAPSHOT</version>
  <dependencies>
    <!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
    <dependency>
      <groupId>net.sourceforge.tess4j</groupId>
      <artifactId>tess4j</artifactId>
      <version>4.5.3</version>
    </dependency>

  </dependencies>

</project>
Third 클래스 파일 작성

package ocr;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;


/**
* ocr  .
*
* @author huc_  
* @since 2021/1/12 17:42
*/
public class TestTextOcr {

  public static void main(String[] args) throws IOException {
    //     
    ITesseract instance = new Tesseract();

    //       

    instance.setLanguage("chi_sim");

    //       

    instance.setOcrEngineMode(1);

    //     

    BufferedImage image = ImageIO.read(TestTextOcr.class.getResourceAsStream("/2.jpg"));
    try {

      //   

      String result = instance.doOCR(image);
      System.out.println(result);
   } catch (TesseractException e) {
      System.err.println(e.getMessage());
   }


 }
}

다섯 번 째 훈련 언어 환경 설정 추가

TESSDATA_PREFIX=F:\tessdata,변수 명,고정,값 은 홈 페이지 다운로드 파일https://github.com/tesseract-ocr/tessdata
여섯 번 째 실행
결 과 는 다음 과 같다.

이 가능 하 다,~할 수 있다,...

instance.setOcrEngineMode(0);

많이 편 해 졌 나 봐,하하.식별 율 이 순식간에 상승 하 다.
모두 스스로 테스트 할 수 있다.
총결산
자,오늘 은 여기까지 입 니 다.기술 은 고생 에 있다.많이 공부 해서 무장 하고 강해 져 라.
SpringBoot+Tess4j 가 강압 적 인 OCR 식별 도 구 를 실현 하 는 예제 코드 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 SpringBoot Tess4j OCR 식별 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 부탁드립니다!

좋은 웹페이지 즐겨찾기