文章

learn - 字幕

learn - 字幕

字幕(视频字幕分离与合并)

我在研究如何加快我们团队对内容上的信息完整度而调研的一些知识记录。

字幕分离

  1. FlyCut Caption — 免费,在线 OR 可以本地搭建

    一个强大的 AI 驱动的视频字幕编辑工具,专注于智能字幕生成、编辑和视频裁剪。

    相关git地址: https://github.com/x007xyz/flycut-caption/tree/main

    能对无字幕的音频增加字幕。

  2. 阿里云-文字识别 – 付费版,按量扣费 OCR

    类型描述
    公测期能力公测期能力限并发数,免费调用。仅支持上海地区。
    付费能力车牌识别、驾驶证识别、行驶证识别、VIN码识别、通用文字识别、身份证识别、银行卡识别、营业执照识别、定额发票识别和增值税发票卷票识别、出租车发票识别、火车票识别、表格识别、按量付费价格低至0.009元/次,二维码识别按量付费价格低至0.034元/次,增值税发票识别和PDF识别按量付费价格低至0.036元/次,同时支持预付费资源包购买,仅支持上海地区购买,具体价格查看详情。
    付费能力视频文字识别按时长付费,根据视频分辨率和每秒采集帧数有不同定价,价格低至0.01元/秒,具体价格查看详情。
  3. Openai-whisper

    本地未安装成功,暂无.

    whisper

    1
    2
    
    whisper output.aac --model large-v3 --language zh --output_format srt
       
    

    关键参数:

    • --model:指定模型大小(tinylarge-v3,越大精度越高)
    • --language:显式指定语言(如zh中文)可提升准确率
    • --output_format srt:输出SRT格式字幕
  4. 阿里云-语音识别 - VCR

  5. 阿里云-视频转码点播服务 –播放加密

本文由作者按照 CC BY 4.0 进行授权