Tesseract OCR 사용하기

오늘은 지금 진행 하고있는 프로젝트에 OCR기능을 추가하고 싶어서 찾아보았던 OCR인 Tesseract OCR 을 직접 코랩에서 실습해보며 간단한 사용법을 알아보려 한다!

Tesseract OCR?

테서랙트는 Apache2.0 라이선스에 사용할 수 있는 오픈 소스 텍스트 인식 엔진이다. UTF-8를 지원하며 100개 이상의 언어를 지원한다. 사용시 단점으로는 GPU:-1 즉 GPU를 사용하지 않아 속도가 느리다.

Python Tesseract?

Python Tesseract는 Google의 Tesseract-OCR Engine을 래핑한 라이브러리이다!

필수 프로그램 다운로드

Tesseract 다운로드

!sudo apt install tesseract-ocr

pytesseract 다운로드

!pip install pytesseract

import

import pytesseract
import cv2
import os
from PIL import Image
from google.colab.patches import cv2_imshow

code 실행부

#이미지를 불러와 gray 스케일로 변환해 준다.

image = cv2.imread('numbers.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

#pytesseract에서는 numpy array를 읽지 못하고 file을 읽기 때문에 os로 파일을 불러들여야 한다.
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)

#pytesseract의 image to string을 써준다. 
#숫자니까 lang = 'None'으로

text = pytesseract.image_to_string(Image.open(filename), lang = None)
os.remove(filename)

#결과를 보자.

print(text)
cv2_imshow(image)

결과

상당히 만족스러운 결과가 출력 되었음을 알 수 있다! :)

Author And Source

이 문제에 관하여(Tesseract OCR 사용하기), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@be1le/Tesseract-OCR-사용하기

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다