上传的图像用于项目: '光典档案室-8.0'
  1. 光典档案室-8.0
  2. GDDA8-3782

Q4 - 增加音频文件的内容提取转文字,并记录对应锚点,实现关键字搜索音频内容并定位播放功能

    详情

    • 类型: 技术探索
    • 状态: 待处理
    • 优先级: 一般
    • 解决结果: 未解决
    • 影响版本:
    • 修复的版本: 需求池
    • 标签:
    • 需求分类:
      产品通用需求
    • 严重程度:
      一般

      描述

      可以考虑 VOSK: 开源的语音识别工具包

      需要 Python3环境

      介绍:https://zhuanlan.zhihu.com/p/413205362
      集成:https://www.jb51.net/article/254571.htm
      官网:https://alphacephei.com/cn/

        附件

          活动日志

            人员

            • 经办人:
              mayurong 马玉荣
              报告人:
              wanglianwei 王链玮
            • 管理关注列表:
              1 开始关注这个问题

              日期

              • 创建日期:
                已更新:
                要求解决日期: