Python의 음성 인식

2163 단어 python

Python에서 음성 인식 패키지 설치



PyPI에는 많은 음성 인식 패키지가 있습니다. 그 중 일부는 다음과 같습니다.
  • apiai
  • 어셈블리아이
  • 구글 클라우드 스피치
  • 포켓스핑크스
  • 음성인식
  • watson-developer-cloud
  • 위트

  • 이 블로그에서는 주로 SpeechRecognition 모듈에 중점을 둘 것입니다.

    SpeechRecognition 라이브러리
    $ pip install SpeechRecognition
    그러면 Python에 음성 인식 패키지가 설치됩니다. 이제 이 패키지와 그 기능을 음성 인식에 사용할 수 있습니다. 그리고 Voice Assistant Creation에서 한 단계 더 나아갈 수 있습니다.

    음성 인식은 기계의 마이크를 사용하여 음성을 인식하고 문자열로 변환합니다. 이를 위해 PyAudio를 설치해야 합니다.

    pip install pyaudio 하면 오류가 발생하므로 이번에는 pipwin을 사용하여 pyaudio를 다운로드한 후 설치하여 설치합니다.

    링크에서 PyAudio .whl 파일을 다운로드합니다. 디렉토리를 다운로드한 파일로 변경합니다.

    PyAudio 설치



    $ pip install .\PyAudio-0.2.11-cp39-cp39-win_amd64.whl
    

    또 다른 해결 방법은 먼저 pipwin을 설치한 다음 pipwin을 사용하여 paudio를 설치하는 것입니다.

    $ pip install pipwin
    $ pipwin install pyaudio
    


    음성 인식에 필요한 패키지가 설치되었습니다. 이제 파이썬으로 음성 인식을 코딩할 수 있습니다.

    Python의 음성 인식




    import speech_recognition as sr
    
    recognizer = sr.Recognizer()
    with sr.Microphone() as source:
        print("Listening...")
        recognizer.adjust_for_ambient_noise(source)
        audio = recognizer.listen(source)
        try:
            print("Recognizing...")
            query = recognizer.recognize_google(audio)
        except sr.UnknownValueError:
            print("Could not understand audio")
        print(query.lower())
    


    코드를 한 줄씩 이해합시다.

    먼저 Speech_recognition 라이브러리를 가져옵니다. 이 경우 가져오기의 원래 이름이 상당히 길기 때문에 별칭으로 가져왔습니다.

    음성 인식 라이브러리의 인식기 클래스



    인식기 인스턴스

    recognizer = sr.Recognizer()
    


    가져온 후 첫 번째 단계는 Speech_recognition 라이브러리에 있는 인식기의 인스턴스를 만드는 것입니다.

    이제 Recognizer의 음성 인식 인스턴스를 포함하는 인식 변수를 사용하여 그 안의 모든 기능을 호출합니다.

    원본 게시물에서 전체 게시물Python Speech Recognition을 읽으십시오.

    좋은 웹페이지 즐겨찾기