2023-05-29 www.dnxtw.com
4月24日消息 谷歌产品经理Sagar最近报道说 在最近在北京举行的视频电话会议上,Savla向与会媒体介绍了一项免费的Android服务,旨在通过自动字幕技术减少现实世界中的对话障碍——“Live Transcribe"!感兴趣的朋友,不妨来了解一下。
据报道,通过自动语音识别技术 (ASR),由Google云提供的技术支持,计算机可以检测有声语言,并将其现场转录为阅读文本,Live Transcribe可实时转录对话字幕,支持70多种语言,覆盖全球80%以上的人口。
Sagar Savla说,虽然依靠云ASR可以为我们提供更高的准确性,但谷歌希望减少Live Transcribe所需的网络流量消耗。为此,Google在Audioset之前的工作基础上,实现了基于神经网络的设备语音检测器。该网络是一种图像模型,类似于我们之前发布的VGGish模型。它可以检测语音,自动管理与云ASR引擎的网络连接,最大限度地减少长期使用过程中的数据流量消耗。
据了解,谷歌考虑了几种不同的模式:计算机、平板电脑、智能手机、小型投影仪,以迭代的方式显示听觉信息和字幕。
软件使用量热图
最终,Sagar Savla的团队决定专注于智能手机模式,因为这些设备无处不在,功能越来越强大!此外,世界卫生组织预计到2055年,全球将有9亿人听力受损,谷歌的软件可以给他们带来便利,在亚洲非常受欢迎。
11-12178
11-12206