苹果发布降噪大模型DLM，纠正ASR系统中的错误

米塔之家 · 2024-05-28 17:21:06

品玩5月28日讯，据 Analytics indiamag报道，苹果公司近日推出降噪语音模型 DLM，这是一种使用大量合成数据训练的按比例纠错模型实现了 SOTA 自动语音识别 (ASR) 性能。单个 DLM 可应用于不同的 ASR，其性能大大优于传统的基于 LM 的波束搜索重排。这些结果表明，设计良好的纠错模型有可能取代传统的 LM，从而将 ASR 系统的准确性提高到一个新的水平。纠错模型面临的一个重大挑战是需要大量有监督的训练示例，而典型的 ASR 数据集中的训练示例数量有限。DLM 通过使用 TTS 系统生成合成音频来解决这一问题，然后将合成音频输入 ASR 系统，创建与原始文本配对的假设，形成训练数据集。这种方法允许使用更大的语言语料库来扩展训练数据。

点赞(0) 打赏

上一篇 > 售价约3471元，Rokid AR Lite已众筹超230万元
下一篇 > 赛峰集团宣布RAVE机上娱乐（IFE）系统将支持AR/VR/MR设备

苹果发布降噪大模型DLM，纠正ASR系统中的错误

DeepSeek V4发布后，全球Agent换上“中国大脑”

【京东科技与元隆雅图旗下UOVAMETA达成战略合作】

蘑菇车联迎前滴滴高管付强任总裁，加速 AI 商业化落地

Perplexity CEO 告别 PPT：用 AI 重构投资者路演