
STT赋能的语音控制应用程序于2017年启动,为视频生成字幕,并在其他功能中处理每个月超过十亿分钟的语音。
Google Cloud现在发布了一个新的神经序列到序列模型,用于语音识别,该模型在不同的用例,噪声环境,声学条件和词汇量方面进行了测试。
新模型基础架构基于尖端的机器学习技术,该技术使用户可以更有效地利用语音培训数据。
Google Cloud Speech Team杰出科学家Fran?oiseBeaufays在博客文章中说:
“使用STTAPI时,企业和开发人员都会立即看到盒子外质量的改进,尽管您始终可以调整模型以提高性能,但可以在无需任何初始调整下即可感受到这种新体系结构的好处。”
“随着模型对各种声音,噪声环境和声学条件的扩展支持,您可以在更多的上下文中产生更准确的输出,从而使您更快,轻松,有效地将语音技术嵌入在应用程序中。”
随着模型的扩展支持,用户现在可以更自然地对其智能家居设备使用更长的句子说话。
声明:版权所有 非合作媒体谢绝转载