오디오 파일을 텍스트로 변환 - Python

텍스트 형식으로 원하는 오디오 파일이 있습니다. 수동으로 듣고 입력하는 것은 번거로운 일입니다. 저는 프로그래머로서 오디오 파일을 텍스트로 변환하는 방법에 대해 빠르게 조사했습니다.
시작하자.

요구 사항


  • 음성 인식

  • pip install speech_recognition
    

    설치 후 패키지 가져오기



    import speech_recognition
    

    변환할 오디오 파일 가져오기



    audio_file = "sample.wav"
    

    음성 인식기 초기화



     sp = speech_recognition.Recognizer()
    

    오디오 파일 열기



    with speech_recognition.AudioFile(audio_file) as source:
    

    다음은 오디오 파일을 메모리에 로드하여 듣는 것입니다.



    audio_data = sp.record(source)
    

    메모리의 오디오를 텍스트로 변환



    converted_text = sp.recognize_google(audio_data)
    

    변환된 텍스트 출력



    print(converted_text)
    

    완료.

    This script works for short audio files and the file format should be .wav



    완전한 코드

    #import package
    import speech_recognition
    
    #import audio file
    audio_file = "sample.wav"
    
    # initialize the recognizer
    sp = speech_recognition.Recognizer()
    
    # open the file
    with speech_recognition.AudioFile(audio_file) as source:
        # load audio to memory
        audio_data = sp.record(source)
        # convert speech to text
        text = sp.recognize_google(audio_data)
        print(text)
    

    좋은 웹페이지 즐겨찾기