tools - ffmpeg多媒体工具
ffmpeg多媒体工具
格式转换
音频
原音频mp3例子:
1
2
3
4
5
6
7
8
9
10
11
12
brew install mediainfo
mediainfo Male-0001.mp3
#out:
# Bit rate : 128 kb/s 比特率
# Channel(s) : 1 channel 声道
#Sampling rate : 16.0 kHz 采样率
#计算得到 bit_depth = 128/(16*1) = 8bit
#要把 bit_depth 提高到16bit,增加两倍Bit rate
ffmpeg -i Male-0001.mp3 -acodec pcm_s16le wfy.wav
ffmpeg -y -i wfy.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 wfy.pcm
speexenc wfy.pcm --rate 16000 --quality 7 wfy.spx
目标格式: pcm(pcm_s16le),wav,speex(speex-wb)
采样率为16000 或者 8000. 推荐使用16000,比特率为16bit 单声道
1 2 3 4 ffmpeg -i Male-0001.mp3 -b:a 128k Male-0001-03.mp3 ffmpeg -y -i Male-0001-03.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 Male-0001-03.pcm speexenc Male-0001-03.pcm --rate 16000 --quality 7 Male-0001-03.spx``` ffmpeg -y -i Male-0001.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 Male-0001.pcm
speexenc Male-0001.pcm –rate 16000 –quality 7 Male-0001.spx
ffmpeg -y -i Male-0001.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 1600 0 -b:a 256k Male-0001.pcm
-b:a 256k 修改比特率为256k
1
curl -F “file=@Male-0001.pcm”
http://127.0.0.1:8101/api/v1/nexus/speech/text
– curl -F “file=@Male-0001.spx”
-F “speex_size=60” -F “encoding=speex-wb”
http://127.0.0.1:8101/api/v1/nexus/speech/text
1
2
> speex压缩
#speex压缩 speexenc Male-0001.pcm –rate 16000 –quality 7 Male-0001.spx
1
#speex curl -F “file=@/Users/wangfuyu/Documents/Male-0001-02.spx”
-F “speex_size=60” -F “encoding=speex-wb” http://127.0.0.1:8101/api/v1/nexus/speech/text ```
使用对接讯飞:
https://www.xfyun.cn/doc/asr/voicedictation/API.html#%E6%8E%A5%E5%8F%A3%E8%AF%B4%E6%98%8E
验证一下:压缩后的编码 、比特率、等。