编程开源技术交流，分享技术与知识

网站首页 > 开源技术正文

阿里达摩院开源语音识别模型DFSMN，准确率达96.04%

wxchong 2024-08-27 23:14:26 开源技术 57 ℃ 0 评论

Amoy 发自凹非寺量子位报道 | 公众号 QbitAI

阿里巴巴达摩院又有新开源模型，这次是语音识别模型DFSMN。

近日，阿里达摩院机器智能实验室开源了新一代语音识别模型DFSMN，基于世界最大的免费语音识别数据库LibriSpeech，该模型将全球语音识别准确率纪录提高至96.04%。

阿里方面称，对比目前业界使用最为广泛的LSTM模型，DFSMN模型训练速度更快、识别准确率更高。

而采用全新DFSMN模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了3倍，语音识别速度提高了2倍。

相关详情可移步开源地址：

https://github.com/tramphero/kaldi

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

?'?' ? 追踪AI技术和产品新动态

上一篇：银联国际与DFS合作提升消费者购物体验
下一篇： DFS集团推出“送上欢乐”佳节好礼

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

0℃应用宝安装下载（应用宝安装下载软件手机版）

最近发表