前言
前段时间手机上面一大把博主在推荐通义听悟,但在我体验过一段时间后觉得通义听悟言过其实了。
介绍
通义听悟已开启公测,公测期(2023年6月1日至30日)用户可体验所有AI功能,含全文概要、章节速览、发言总结等高阶AI功能。通过阿里云主账号登录,可享受以下权益:
每日登录通义听悟,自动获得2小时转写时长;
每邀请1名好友注册并登录通义听悟账号,邀请者可获得2小时转写时长;
输入口令即可获得额外的转写时长;
通义听悟绑定阿里云盘账号,共享云盘超大存储空间。
链接
通义听悟:传送门
使用文档:了解通义听悟 - 通义听悟 (aliyun.com)
功能
🚀实时记录交流内容,同步翻译
🚀批量转写音视频文件,区分发言人
🚀智能提炼全文概要、章节速览、发言总结
🚀自动提取关键词、问题、待办事项
🚀编辑整理笔记,导出记录
体验
我选择了影视飓风的视频【比画面更重要?这也许是拍视频最容易忽略的因素!】,作为转写对象来测试通义听悟的能力。
上传视频到通义听悟,这边既可以选择本地上传,也可以选择上传阿里网盘里面的视频文件。
我们可以发现他的上传速度和转写的速度还是很快的
整个过程大约花费三分钟(实际用时可能会受到视频长度的影响),这边就可以在工作台看见视频已经转写好了。
这边完成了视频的章节的标注和内容大纲的梳理,先不看他是否有误,能让人清晰明了知道视频讲述了什么。
这边我也是一个个给他挑错....
还(而)有着良好声音体验的前提
麦克风的你(秘密)
热血(热靴)MI接口麦克风
并且带动产生(唱针)震动(振动)
还有96千赫兹则相当于更高分辨率的8K或者16K的音箱(影像)
接下来我们将分别介绍在室内户外短片拍摄以及目录(Vlog)
心情(心型)或者是超新型(超心型)指向型麦克风也能够有效的降低声音的混响
那这样的全指向型WBT(W2BT)无线领夹麦克风也是一个很好的选择
就是用parallel麦克风(Parabolic Microphone)
问题1
字幕的断句在一些地方非常奇怪,会改变原有意思产生歧义
通义听悟:通过首创的热血MI接口麦克风,能够直接在相机上输出数字信号
正确表达:通过首创的热靴MI接口,麦克风能够直接在相机上输出数字信号
问题2
章节速览不够全面,分得也不够清楚。
发言总结过于片面,重点内容往往没有凸显出来。(例:介绍麦克风的视频TIM提醒我要保护好听力?!)
后记
总的来说,通义听悟的识别能力和识别速度在同类转写程序中是有一定优势的,但是对于一些专有名词,一些句子的逻辑他并不是完全理解。
对于专有名词,可以根据文档设置自有词汇以提高转写的精度。
对于章节速览与发言总结等AI功能出现的理解有误、逻辑错误与侧重点错误我推测是因为通义听悟并没有真正理解语句的意思。我也使用过网易见外工作台,同样的转写能力但阿里的AI功能并没有为我提供更多更好的帮助,这是阿里之后需要改进的地方。
如果你对于通义听悟有什么看法,欢迎在评论区进行交流!