C\#FFmpeg 처리 오디 오 비디오 를 호출 하 는 예제

FFmpeg 오픈 소스,크로스 플랫폼,부피 가 작고 기능 이 강해 서 녹화,전환 과 스 트 리밍 영상의 완전한 해결 방안 을 제공 했다.
홈 페이지:https://www.ffmpeg.org/
백과:https://baike.baidu.com/item/ffmpeg/2665727?fr=aladdin
FFmpeg 응용 이 매우 광범 위 하여 로 컬 영상,심지어 인터넷 영상 을 재생 하고 음성 영상 정 보 를 조회 할 수 있 으 며 영상 에서 오디 오 를 추출 하고 음성 영상 파일 형식 을 바 꾸 는 데 도 사용 할 수 있다.본 고 는 주로 FFmpeg 를 어떻게 호출 하 는 지 소개 한다. 오디 오 영상 정보 보기,영상 에서 오디 오 추출,오디 오 영상 포맷 변환 등 을 한다.
1.FFmpeg 호출
호출 원 리 는 콘 솔 을 열 어 명령 을 입력 하 는 것 과 같 습 니 다.프로그램 에서 명령 파 라 메 터 를 조합 하여 패키지 할 뿐 입 니 다.다음은 시작 코드 입 니 다.

/// <summary>
    ///      、  ,    
    /// </summary>
    /// <param name="args"></param>
    /// <param name="finishiEvent"></param>
    public static void Start(string args, EventHandler finishiEvent)
    {
      LogHelper.LogInfoFormat("      ,   :{0}", args);
      FinishiEvent = finishiEvent;
      // ffmpeg.exe      
      string ffmpegPath = FFmpegBinariesHelper.RegisterFFmpegBinaries();
      string cmdType = args.Split(new string[] { " " }, StringSplitOptions.RemoveEmptyEntries)[0];
      ProcessStartInfo startInfo = new ProcessStartInfo(Path.Combine(ffmpegPath, cmdType));
      startInfo.WindowStyle = ProcessWindowStyle.Normal;
      startInfo.Arguments = args.Substring(cmdType.Length);
      startInfo.UseShellExecute = false;
      startInfo.CreateNoWindow = true;
      startInfo.RedirectStandardInput = true;
      startInfo.RedirectStandardOutput = true;
      startInfo.RedirectStandardError = true;// ffmpeg     error  
      p.StartInfo = startInfo;
      p.OutputDataReceived += P_OutputDataReceived; // ffmpeg      
      p.ErrorDataReceived += P_OutputDataReceived;
      Thread thread = new Thread(startffmpeg);
      thread.Start();
    }
실행 인터페이스:

2. 오디 오 비디오 정보 보기
명령 은 다음 과 같 습 니 다(주:pcm 파일 은 다음 명령 을 적용 하지 않 습 니 다).

  :ffprobe -print_format json -loglevel quiet -show_streams "    "

  :ffprobe -print_format json -loglevel quiet -show_streams "F:\mp4\3.TF      .mp4"
다음은 출력 된 파일 형식 등 정보 입 니 다.

{
  "streams": [
    {
      "index": 0,
      "codec_name": "h264",
      "codec_long_name": "H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10",
      "profile": "High",
      "codec_type": "video",
      "codec_time_base": "1046271/31388000",
      "codec_tag_string": "avc1",
      "codec_tag": "0x31637661",
      "width": 960,
      "height": 640,
      "coded_width": 960,
      "coded_height": 640,
      "has_b_frames": 0,
      "sample_aspect_ratio": "1:1",
      "display_aspect_ratio": "3:2",
      "pix_fmt": "yuv420p",
      "level": 31,
      "chroma_location": "left",
      "refs": 1,
      "is_avc": "true",
      "nal_length_size": "4",
      "r_frame_rate": "15/1",
      "avg_frame_rate": "15694000/1046271",
      "time_base": "1/90000",
      "start_pts": 0,
      "start_time": "0.000000",
      "duration_ts": 188328780,
      "duration": "2092.542000",
      "bit_rate": "358855",
      "bits_per_raw_sample": "8",
      "nb_frames": "31388",
      "disposition": {
        "default": 1,
        "dub": 0,
        "original": 0,
        "comment": 0,
        "lyrics": 0,
        "karaoke": 0,
        "forced": 0,
        "hearing_impaired": 0,
        "visual_impaired": 0,
        "clean_effects": 0,
        "attached_pic": 0,
        "timed_thumbnails": 0
      },
      "tags": {
        "creation_time": "2020-09-04T01:03:03.000000Z",
        "language": "und",
        "encoder": "JVT/AVC Coding"
      }
    },
    {
      "index": 1,
      "codec_name": "aac",
      "codec_long_name": "AAC (Advanced Audio Coding)",
      "profile": "LC",
      "codec_type": "audio",
      "codec_time_base": "1/48000",
      "codec_tag_string": "mp4a",
      "codec_tag": "0x6134706d",
      "sample_fmt": "fltp",
      "sample_rate": "48000",
      "channels": 1,
      "channel_layout": "mono",
      "bits_per_sample": 0,
      "r_frame_rate": "0/0",
      "avg_frame_rate": "0/0",
      "time_base": "1/48000",
      "start_pts": 0,
      "start_time": "0.000000",
      "duration_ts": 100440014,
      "duration": "2092.500292",
      "bit_rate": "64000",
      "max_bit_rate": "66584",
      "nb_frames": "98086",
      "disposition": {
        "default": 1,
        "dub": 0,
        "original": 0,
        "comment": 0,
        "lyrics": 0,
        "karaoke": 0,
        "forced": 0,
        "hearing_impaired": 0,
        "visual_impaired": 0,
        "clean_effects": 0,
        "attached_pic": 0,
        "timed_thumbnails": 0
      },
      "tags": {
        "creation_time": "2020-09-04T01:03:03.000000Z",
        "language": "und"
      }
    }
  ]
}
 streams 는 정 보 를 입력 합 니 다.한 파일 에 여러 개의 오디 오 나 비디오 가 있 으 면 배열 로 출력 합 니 다.자주 사용 하 는 매개 변 수 는 codec 입 니 다.name 표시 인 코딩,codectype type type,samplerate 샘플링 율,channels 채널,duration 시간(초)
3.비디오 에서 오디 오 파일 추출

  :ffmpeg -i "        " -vn -ar     "        "

  :ffmpeg -i "F:\mp4\3.TF      .mp4" -vn -ar 8000 "F:\mp4\3.TF      _201215172919_8k.m4a"
 다음은 처리 프로 세 스 출력 정보 입 니 다.

ffmpeg version git-2020-04-17-889ad93 Copyright (c) 2000-2020 the FFmpeg developers
 built with gcc 9.3.1 (GCC) 20200328
 configuration: --disable-static --enable-shared --enable-gpl --enable-version3 --enable-sdl2 --enable-fontconfig --enable-gnutls --enable-iconv --enable-libass --enable-libdav1d --enable-libbluray --enable-libfreetype --enable-libmp3lame --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable-libopus --enable-libshine --enable-libsnappy --enable-libsoxr --enable-libsrt --enable-libtheora --enable-libtwolame --enable-libvpx --enable-libwavpack --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxml2 --enable-libzimg --enable-lzma --enable-zlib --enable-gmp --enable-libvidstab --enable-libvmaf --enable-libvorbis --enable-libvo-amrwbenc --enable-libmysofa --enable-libspeex --enable-libxvid --enable-libaom --disable-w32threads --enable-libmfx --enable-ffnvcodec --enable-cuda-llvm --enable-cuvid --enable-d3d11va --enable-nvenc --enable-nvdec --enable-dxva2 --enable-avisynth --enable-libopenmpt --enable-amf
 libavutil   56. 42.102 / 56. 42.102
 libavcodec   58. 80.100 / 58. 80.100
 libavformat  58. 42.100 / 58. 42.100
 libavdevice  58. 9.103 / 58. 9.103
 libavfilter   7. 77.101 / 7. 77.101
 libswscale   5. 6.101 / 5. 6.101
 libswresample  3. 6.100 / 3. 6.100
 libpostproc  55. 6.100 / 55. 6.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'F:\mp4\3.TF ュ   .mp4':
 Metadata:
  major_brand   : mp42
  minor_version  : 0
  compatible_brands: mp42isom
  creation_time  : 2020-09-04T01:03:03.000000Z
 Duration: 00:34:52.54, start: 0.000000, bitrate: 425 kb/s
  Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 960x640 [SAR 1:1 DAR 3:2], 358 kb/s, 15 fps, 15 tbr, 90k tbn, 30 tbc (default)
  Metadata:
   creation_time  : 2020-09-04T01:03:03.000000Z
   encoder     : JVT/AVC Coding
  Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, mono, fltp, 64 kb/s (default)
  Metadata:
   creation_time  : 2020-09-04T01:03:03.000000Z
Stream mapping:
 Stream #0:1 -> #0:0 (aac (native) -> aac (native))
Press [q] to stop, [?] for help
[aac @ 042107c0] Too many bits 8832.000000 > 6144 per frame requested, clamping to max
Output #0, ipod, to 'F:\mp4\3.TF ュ   _201215172919_8k.m4a':
 Metadata:
  major_brand   : mp42
  minor_version  : 0
  compatible_brands: mp42isom
  encoder     : Lavf58.42.100
  Stream #0:0(und): Audio: aac (LC) (mp4a / 0x6134706D), 8000 Hz, mono, fltp, 48 kb/s (default)
  Metadata:
   creation_time  : 2020-09-04T01:03:03.000000Z
   encoder     : Lavc58.80.100 aac
size=   256kB time=00:01:42.40 bitrate= 20.5kbits/s speed= 204x  
size=   512kB time=00:03:28.64 bitrate= 20.1kbits/s speed= 208x  
size=   768kB time=00:05:12.19 bitrate= 20.2kbits/s speed= 208x  
size=  1280kB time=00:06:59.84 bitrate= 25.0kbits/s speed= 210x  
size=  1536kB time=00:08:38.52 bitrate= 24.3kbits/s speed= 207x  
size=  1792kB time=00:10:20.41 bitrate= 23.7kbits/s speed= 206x  
size=  2304kB time=00:12:11.77 bitrate= 25.8kbits/s speed= 209x  
size=  2560kB time=00:13:55.32 bitrate= 25.1kbits/s speed= 209x  
size=  2816kB time=00:15:40.41 bitrate= 24.5kbits/s speed= 209x  
size=  3072kB time=00:17:30.36 bitrate= 24.0kbits/s speed= 210x  
size=  3584kB time=00:19:17.12 bitrate= 25.4kbits/s speed= 210x  
size=  3840kB time=00:20:57.85 bitrate= 25.0kbits/s speed= 209x  
size=  4096kB time=00:22:44.73 bitrate= 24.6kbits/s speed= 210x  
size=  4608kB time=00:24:15.61 bitrate= 25.9kbits/s speed= 208x  
size=  4864kB time=00:25:52.63 bitrate= 25.7kbits/s speed= 207x  
size=  5120kB time=00:27:26.20 bitrate= 25.5kbits/s speed= 205x  
size=  5376kB time=00:29:04.38 bitrate= 25.2kbits/s speed= 205x  
size=  5632kB time=00:30:40.12 bitrate= 25.1kbits/s speed= 204x  
size=  6144kB time=00:32:20.47 bitrate= 25.9kbits/s speed= 204x  
size=  6400kB time=00:34:38.07 bitrate= 25.2kbits/s speed= 207x  
size=  6558kB time=00:34:52.54 bitrate= 25.7kbits/s speed= 209x  
video:0kB audio:6493kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.997352%
[aac @ 042107c0] Qavg: 65535.836
4.오디 오 형식 변환:

  :ffmpeg -i "     " -acodec pcm_s16le -f s16le -ar         "      "

  :ffmpeg -i "F:\mp4\3.TF      _201215172919_8k.m4a" -acodec pcm_s16le -f s16le -ar 8000 "F:\mp4\3.TF      _201215172919_8k_201215173520_8k.pcm"
처리 프로 세 스 출력 정보:

ffmpeg version git-2020-04-17-889ad93 Copyright (c) 2000-2020 the FFmpeg developers
 built with gcc 9.3.1 (GCC) 20200328
 configuration: --disable-static --enable-shared --enable-gpl --enable-version3 --enable-sdl2 --enable-fontconfig --enable-gnutls --enable-iconv --enable-libass --enable-libdav1d --enable-libbluray --enable-libfreetype --enable-libmp3lame --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable-libopus --enable-libshine --enable-libsnappy --enable-libsoxr --enable-libsrt --enable-libtheora --enable-libtwolame --enable-libvpx --enable-libwavpack --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxml2 --enable-libzimg --enable-lzma --enable-zlib --enable-gmp --enable-libvidstab --enable-libvmaf --enable-libvorbis --enable-libvo-amrwbenc --enable-libmysofa --enable-libspeex --enable-libxvid --enable-libaom --disable-w32threads --enable-libmfx --enable-ffnvcodec --enable-cuda-llvm --enable-cuvid --enable-d3d11va --enable-nvenc --enable-nvdec --enable-dxva2 --enable-avisynth --enable-libopenmpt --enable-amf
 libavutil   56. 42.102 / 56. 42.102
 libavcodec   58. 80.100 / 58. 80.100
 libavformat  58. 42.100 / 58. 42.100
 libavdevice  58. 9.103 / 58. 9.103
 libavfilter   7. 77.101 / 7. 77.101
 libswscale   5. 6.101 / 5. 6.101
 libswresample  3. 6.100 / 3. 6.100
 libpostproc  55. 6.100 / 55. 6.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'F:\mp4\3.TF ュ   _201215172919_8k.m4a':
 Metadata:
  major_brand   : M4A 
  minor_version  : 512
  compatible_brands: M4A isomiso2
  encoder     : Lavf58.42.100
 Duration: 00:34:52.63, start: 0.000000, bitrate: 25 kb/s
  Stream #0:0(und): Audio: aac (LC) (mp4a / 0x6134706D), 8000 Hz, mono, fltp, 25 kb/s (default)
  Metadata:
   handler_name  : SoundHandler
Stream mapping:
 Stream #0:0 -> #0:0 (aac (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
Output #0, s16le, to 'F:\mp4\3.TF ュ   _201215172919_8k_201215173520_8k.pcm':
 Metadata:
  major_brand   : M4A 
  minor_version  : 512
  compatible_brands: M4A isomiso2
  encoder     : Lavf58.42.100
  Stream #0:0(und): Audio: pcm_s16le, 8000 Hz, mono, s16, 128 kb/s (default)
  Metadata:
   handler_name  : SoundHandler
   encoder     : Lavc58.80.100 pcm_s16le
size=  32696kB time=00:34:52.54 bitrate= 128.0kbits/s speed=8.63e+03x  
video:0kB audio:32696kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.000000%
5.패키지 다운로드(상기 호출 과정 과 매개 변 수 는 이미 봉인 처리 되 었 고 소프트웨어 의 목적 은 바 이 두 오디 오 인식 API 를 호출 하여 영상의 오디 오 를 문자 로 바 꾸 는 것 이다)
소프트웨어 소스 코드 주소(프로젝트 통합 문자 인식,음성 합성,음성 인식):https://gitee.com/bidev_admin/river-int-ai.git
패키지 다운로드 주소 실행(.Net Framework 4.5):  https://pan.baidu.com/s/1z-WFDGHhEP8tqLqwp9I0Mw   추출 코드:  r3sk 
저자:목석 비 키
출처:http://www.cnblogs.com/EasyInvoice
이상 은 C\#FFmpeg 로 음성 동 영상 을 처리 하 는 예제 의 상세 한 내용 입 니 다.c\#음성 동 영상 처리 에 관 한 자 료 는 저희 의 다른 관련 글 을 주목 하 세 요!

좋은 웹페이지 즐겨찾기