4倍速输入神器!腾讯混元自研ASR登陆ima,复杂场景照单全收

AI ToolBox
AI ToolBox
2025年7月23日

语音输入新体验,效率提升显著

7月22日,腾讯混元正式将其自主研发的ASR(语音识别)大模型应用于ima平台,首次在手机App端实现语音输入功能,为用户带来"出口成章"的便捷体验。 用户现在可通过语音直接提出问题或记录灵感,无需手动输入,显著提升效率。

强大性能,精准识别

该ASR大模型凭借敏锐的听觉与智能理解能力,在复杂环境中仍能准确识别语音内容,每分钟可识别300字,速度是手动输入的4倍,识别结果更自然精准。 采用业界首个基于双编码器的流式架构,语义理解能力大幅提升,尤其在中英文混合场景下表现突出。

多场景覆盖,功能实用便捷

ima平台此次上线的语音输入功能,广泛应用于知识库问答、笔记创作等多个场景:

  • 长问题查询可直接语音输入,无需打字;
  • 笔记撰写时如同配备语音助手,支持语音创作与续写;
  • iOS用户还可通过桌面小组件实现快速提问。

未来规划清晰,技术持续升级

腾讯混元团队表示,未来将持续优化ASR模型,增强方言与多语言识别能力,拓展支持语言种类,满足多样使用场景。 此次语音输入功能的上线,不仅彰显了其在语音识别领域的技术实力,也推动了更高效、更智能的交互方式落地。