文章

tools - ffmpeg多媒体工具

tools - ffmpeg多媒体工具

ffmpeg多媒体工具

格式转换

音频

原音频mp3例子:

1
2
3
4
5
6
7
8
9
10
11
12
brew install mediainfo
mediainfo Male-0001.mp3 
 
#out:
# Bit rate  : 128 kb/s 比特率
# Channel(s)   : 1 channel 声道
#Sampling rate  : 16.0 kHz  采样率
#计算得到 bit_depth = 128/(16*1) = 8bit
#要把 bit_depth 提高到16bit,增加两倍Bit rate
ffmpeg -i Male-0001.mp3 -acodec pcm_s16le wfy.wav
ffmpeg -y -i wfy.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 wfy.pcm
speexenc wfy.pcm --rate 16000  --quality 7  wfy.spx

目标格式: pcm(pcm_s16le),wav,speex(speex-wb)

采样率为16000 或者 8000. 推荐使用16000,比特率为16bit 单声道

1
2
3
4
ffmpeg -i Male-0001.mp3 -b:a 128k Male-0001-03.mp3
ffmpeg -y -i Male-0001-03.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 Male-0001-03.pcm

speexenc Male-0001-03.pcm --rate 16000  --quality 7  Male-0001-03.spx

``` ffmpeg -y -i Male-0001.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 Male-0001.pcm

speexenc Male-0001.pcm –rate 16000 –quality 7 Male-0001.spx

ffmpeg -y -i Male-0001.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 1600 0 -b:a 256k Male-0001.pcm

-b:a 256k 修改比特率为256k

1

curl -F “file=@Male-0001.pcm”
http://127.0.0.1:8101/api/v1/nexus/speech/text

– curl -F “file=@Male-0001.spx”
-F “speex_size=60” -F “encoding=speex-wb”
http://127.0.0.1:8101/api/v1/nexus/speech/text

1
2
> speex压缩

#speex压缩 speexenc Male-0001.pcm –rate 16000 –quality 7 Male-0001.spx

1

#speex curl -F “file=@/Users/wangfuyu/Documents/Male-0001-02.spx”
-F “speex_size=60” -F “encoding=speex-wb” http://127.0.0.1:8101/api/v1/nexus/speech/text ```

使用对接讯飞:

https://www.xfyun.cn/doc/asr/voicedictation/API.html#%E6%8E%A5%E5%8F%A3%E8%AF%B4%E6%98%8E

验证一下:压缩后的编码 、比特率、等。

本文由作者按照 CC BY 4.0 进行授权

© wangfuyu. 保留部分权利。

本站采用 Jekyll 主题 Chirpy