望言OCR-视频硬字幕提取
Photo & Video
Only for Mac
Free · In-App Purchases
《望言OCR》是AI时代下的新一代硬字幕(内嵌字幕)提取工具,可帮助您将视频中嵌入的硬字幕转换为独立字幕文件。
- 支持MP4、AVI、MKV、RMVB等绝大多数视频格式。
- 支持导出SRT、ASS、TXT等字幕格式。
- 提取算法经过精心优化,可充分利用您电脑的性能,以快如闪电的速度完成提取,为您节约时间。
使用条款——遵循Apple标准使用条款(Terms of Use):https://www.apple.com/legal/internet-services/itunes/dev/stdeula/
more 新功能:
- 全新 VAD 时间轴:支持缩放、拖动字幕块、播放头红线跟随与跳转(在字幕详情页点击「人声检测」开启)
- 全新音频波形可视化:完整展示音频峰值,字幕内容直接叠加在波形上,定位更直观
- 字幕支持框选批量操作
- 新增倍速播放
体验优化:
- 字幕列表滑块重构,拖动更顺滑
- 可设置点击后直接跳转到字幕中间位置(而非开头)
- 按行标识识别错误,问题字幕一目了然
- 大模型识别保留疑似重复内容,避免误删
- 多语言翻译全面完善
安全与稳定性:
- 修复若干闪退问题
3.5.8 May 23
- 修复鼠标无法多选字幕的问题
- 支持设置视频时间范围
3.5.6 Apr 22
- 支持视频预览播放,音画同步。
- 优化大模型页面,支持记住“显示全部 AI 校验字幕”,并改进分页、失败重试和结果确认体验。
- 移除文本大模型模式,统一为视觉大模型方案。
- 批量替换新增“仅显示将要替换的字幕”预览模式。
- 导出新增“将一条字幕内多行合并为一行”选项。
- 修复历史记录导入失败的部分场景。
- 修复任务页快捷键和部分编辑区交互细节问题。
3.5.5 Apr 21
本次更新包含了一系列优化:
- 提取流程容错增强,遇到部分解码异常时会尽量继续提取;同时改善了部分视频在开头位置就中断的问题。
- 重构底层识别内核与预览链路,迁移到Rust,提升稳定性与跨平台兼容性。
- 优化大模型字幕页面,新增分页能力,并修复多项显示、编辑和交互问题。
- 升级历史记录格式为 V2,改善历史数据的保存、读取和兼容处理。
- 新增分语种识别结果优先选择,提升多语言场景下的结果可用性。
- 支持字幕配置改名,多套配置管理更直观。
- 新增画面增强参数一键应用,常用增强设置可快速套用。
- 优化黄色字幕同步问题,改善字幕对齐效果。
- 新增“默认视频画面增强”设置,可为新导入视频默认启用通用增强、黑白检出增强或彩色字幕增强。
- 优化“视频画面增强”的性能
- 新增“丢弃空的识别结果”选项,减少空白字幕单独占行的情况。
- 大模型页面继续优化:更强调视觉模型使用,切换纯文本模型时增加提醒,暗色模式显示更清晰。
- 快捷键和编辑体验也做了优化,新增部分标记类快捷键,并增加快捷键冲突提示。
3.5.4 Mar 31
(Urgent Bug Fix) 修复上个版本更新后,软件字体过于巨大的问题。
3.5.2 Mar 1
- 添加对av1格式视频的支持
- 修复一部分可能导致主页白屏的bug
- (UI)支持将字幕框切换为屏蔽框(鼠标点击)
- (UI)第三方识别测试失败时,将显示失败详情
- (UI)大模型页面删除字幕支持“不再提示”,且支持Ctrl+Z撤回
- (UI)修复大模型页面切换结果时字幕可能变化的bug
- (UI)优化部分设置项显示的位置
3.5.1 Feb 28
- 优化sup简易识别模式
- 优化几处可能导致闪退的问题
3.5.0 Feb 12
- 为SUP图形字幕添加“简易识别”模式, 可提升在简单场景下的识别效果。
3.4.9 Feb 11
- 视频字幕设置支持保存和加载。
- 优化设置逻辑,在设置优先选择某个模型后, 不会再因为投票而修改识别结果。
- 全面升级了sup图形字幕解析逻辑,现在解析的sup时间轴问题更少。如您更喜欢老版本的解析逻辑,可在设置开启”对SUP启用兼容格式解析“
- 修复mac历史记录视频路径不存在时频繁弹窗的问题
- 大模型校验,支持为字幕图片设置固定长宽
- 大模型校验,现在支持中途打断取消
- 优化大模型校验页面,当字幕非常多时,减少内存占用和卡顿问题
- 大模型校验页面,可设置显示”全部校验结果“,而不仅仅是有变化的校验结果。
- 大模型校验支持手动重新提交校验失败的字幕
- 修复部分情况下画面显示不全的问题
3.4.8 Feb 10
- (新增)为“在线识别”和“大模型”页面添加文档链接
- (新增)为“大模型”处理失败的情况显示失败详细信息
- (优化)优化字幕列表多选操作逻辑
- (优化)支持手动为字幕打上重复或报错标记
3.4.7 Jan 28
- 第三方识别添加对”讯飞手写OCR“的支持
- 修复暗黑模式下某些字体不清晰的问题
- 大模型页面现在支持保存和恢复多个配置
- 修复第三方识别的部分BUG
3.4.6 Jan 24
- (功能)新支持第三方识别厂商:讯飞OCR、有道OCR
- (功能)大模型检验当模型具有视觉时,不再要求必须至少有2个识别结果进行检验。
- (UI)整数输入框现在可以通过键盘上下键来调整数值
- (UI)“隐藏检测框”按键现在可以设置具体要隐藏哪些(右键点击进行设置)
- (UI)修复当“仅显示不可靠字幕”时无法正常跳转下一条字幕的问题。
3.4.5 Jan 20
- 正在修改的字幕支持自动保存(默认为每分钟)
- 修复一个sup字幕时间轴问题
3.4.4 Jan 14
- 字幕列表支持多选删除和合并(Command/Shift + 鼠标左键)
- 导出文件支持自定义命名
3.4.3 Jan 10
- 修复当“仅显示不可靠字幕”时,字幕修改后不再显示的问题。
- 新增”统一空格“选项,可将识别到的空格统一为半角符号或全角符号。
3.4.2 Jan 5
- 现在可以设置检测框的纵向拓展系数,改善检测框纵向检测不全的问题
- 对于连续字幕,现在可以设置最小间隔(1ms)
- 对于重复字幕,可以设置在导出时增加前缀
3.4.1 Jan 3
本次更新添加了一些优化用户体验的改动:
- AI校对页面右下角新增返回顶部按钮
- 主页面右侧字幕列表现在可以“仅显示不可靠字幕”
- 导出txt时,会添加额外的换行符来区分不同字幕
- 设置优化:默认设置下,会检验空格并屏蔽PaddleOCR的识别结果。
3.3.9 2025-12-31
- 图形字幕现在支持绘制字幕框和屏蔽框。
- 优化繁体/拉丁语系识别速度,相关语种可在设置中选择开启或关闭”部分语种高精识别“(建议保持默认)。
- 支持屏蔽一部分本地识别结果,可在设置中开启”屏蔽本地识别结果“并详细设置。
3.3.8 2025-12-23
- 增加多种字幕语言的识别支持
- 修复部分已知问题
3.3.7 2025-12-18
- 支持idx/sub和sup图形字幕
- 修复图形字幕时间戳偶尔不正确的问题
- 修复部分已知问题
请注意:3.3.5版本重置了软件设置,您需要在设置页面重新调整您喜爱的设置。
3.3.5 2025-12-12
- 改善第三方识别体验,并支持更多第三方在线识别接口。当前已支持:苹果OCR、百度OCR(普通及高精)、腾讯OCR(普通及高精)、阿里OCR。
- 增加了更多快捷键
- 修复部分已知bug
请注意:3.3.3版本与之前的历史纪录格式不兼容,无法读取之前的历史记录。如有未完成的工作建议先使用低版本完成后再升级此版本。
3.3.3 2025-12-06
修复删除字幕时画面不更新的问题。
3.3.2 2025-11-05
- (Feat) 新增对俄/法/德/意/西/葡语言的识别支持。
- (Feat) 当视频路径失效时,仍然允许导入历史记录。
- (Feat) 主页左侧任务列表鼠标悬停时显示视频全名。
- (Bug fix) 字幕文本修改后无法撤回的bug。
3.3.1 2025-11-04
1.添加了对SUP/PGS格式图形字幕文件的OCR支持。
2.修复了人为修正字幕后仍有红色提示的BUG。
3.3.0 2025-10-28
- 误删的字幕支持撤回(Ctrl+Z)。
- 正在编辑的字幕支持保存到历史记录(Ctrl+S);该功能需要先启用历史记录。
- 优化界面算法,改善切换字幕时的延迟。
3.2.7 2025-09-28
新功能:
- 全新 VAD 时间轴:支持缩放、拖动字幕块、播放头红线跟随与跳转(在字幕详情页点击「人声检测」开启)
- 全新音频波形可视化:完整展示音频峰值,字幕内容直接叠加在波形上,定位更直观
- 字幕支持框选批量操作
- 新增倍速播放
体验优化:
- 字幕列表滑块重构,拖动更顺滑
- 可设置点击后直接跳转到字幕中间位置(而非开头)
- 按行标识识别错误,问题字幕一目了然
- 大模型识别保留疑似重复内容,避免误删
- 多语言翻译全面完善
安全与稳定性:
- 修复若干闪退问题
more Version 3.5.8 May 23
Data Not Collected The developer does not collect any data from this app.