网站首页 > 开源技术 正文
kaldi官方正式合并了基于HI-MIA数据集的唤醒recipe方案。此唤醒的recipe方案由北京希尔贝壳科技,西北工业大学音频语音与语言处理研究组,AISHELL Foundation合作完成。
此recipe方案基于北京希尔贝壳科技在openslr上开源的HI-MIA多通道固定词唤醒数据(https://www.openslr.org/85/)。
提供了2个不同的模型应用方法,第一个是借鉴snip、MobvoiHotwords的chain方案,chain方案由@freewym在arxiv上提出了论文(https://arxiv.org/pdf/2005.08347.pdf),参考论文可以获取更多的信息。效果很好的,大家多去学习。
第二个是唤醒的通用做法,即分别基于deep-KWS和keyword-filler的方案。本次HI-MIA的recipe方案中数据的对齐模型采用开源数据库AISHELL-1,并重新训练一个含唤醒词的声学模型,最后基于后验概率平滑或基于keyword-filler的fst图(可选择)方法。
对语音唤醒有兴趣的可以了解下。
地址:https://github.com/kaldi-asr/kaldi/tree/master/egs/hi_mia/v1
猜你喜欢
- 2024-10-11 kaldi三音素GMM学习笔记(kaldi三音素GMM学习笔记2023年)
 - 2024-10-11 萌妹的最爱,又可爱又好喝的KALDI 限定低酒精水果味鸡尾酒
 - 2024-10-11 kaldi语音识别工具集(kaldi中文语音识别)
 - 2024-10-11 Vosk开源语音识别引擎kaldi的开发套件支持Asterisk
 - 2024-07-05 语音识别工具包Kaldi的学习和使用(二):安装前的准备
 - 2024-07-05 kaldi合并出门问问唤醒recipe(hello和hi的区别)
 - 2024-07-05 纯PyTorch语音工具包开源,Kaldi:我压力有点大
 - 2024-07-05 日本零食分享第二弹:KALDI(日本,零食)
 
欢迎 你 发表评论:
- 1588℃北京那些看上去很牛的车牌们!(北京厉害车牌)
 - 1107℃2025年度视频去水印软件TOP5对比:哪款最值得用
 - 683℃《我的世界》不同版本的差异 ——新手向
 - 595℃新疆话里的“虫子”
 - 515℃中兴光猫 Telnet下设置大全(中兴光猫命令大全)
 - 513℃蓝牙设备配对失败的系统性解决方案与技术解析
 - 508℃未备份电脑文件数据恢复的七种方法
 - 488℃工艺管道常用英文缩写 英汉对照
 
- 最近发表
 
- 标签列表
 - 
- jdk (81)
 - putty (66)
 - rufus (78)
 - 内网穿透 (89)
 - okhttp (70)
 - powertoys (74)
 - windowsterminal (81)
 - netcat (65)
 - ghostscript (65)
 - veracrypt (65)
 - asp.netcore (70)
 - wrk (67)
 - aspose.words (80)
 - itk (80)
 - ajaxfileupload.js (66)
 - sqlhelper (67)
 - express.js (67)
 - phpmailer (67)
 - xjar (70)
 - redisclient (78)
 - wakeonlan (66)
 - tinygo (85)
 - startbbs (72)
 - webftp (82)
 - vsvim (79)
 
 

本文暂时没有评论,来添加一个吧(●'◡'●)