编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

阿里达摩院开源语音识别模型DFSMN,准确率达96.04%

wxchong 2024-08-27 23:14:26 开源技术 11 ℃ 0 评论
Amoy 发自 凹非寺 量子位 报道 | 公众号 QbitAI

阿里巴巴达摩院又有新开源模型,这次是语音识别模型DFSMN。

近日,阿里达摩院机器智能实验室开源了新一代语音识别模型DFSMN,基于世界最大的免费语音识别数据库LibriSpeech,该模型将全球语音识别准确率纪录提高至96.04%。

阿里方面称,对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快、识别准确率更高。

而采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了3倍,语音识别速度提高了2倍。

相关详情可移步开源地址:

https://github.com/tramphero/kaldi

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

?'?' ? 追踪AI技术和产品新动态

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表