首页资讯流行娱乐体育明星时尚游戏旅游生活母婴营销邮箱商业视频财经健康段子消费汽车购物科技

首页 > 资讯 > 正文

Qzone

微博

微信

数据堂开源1505小时中文普通话语音数据集

资讯 TOM 2019-05-21 14:56

5月20日，数据堂推出AI数据开源计划，面向高校和学术机构等非商业组织群体，首次开源的数据集为：1505小时中文普通话语音数据集。

该数据集的录音内容，由6408名来自中国不同地区的录音人参与录制，有超过30万条口语化句子。句准确率达98%以上。

从评测效果来看，通过运行GMM-HMM混合模型和DNN-HMM混合模型，基于数据堂开源数据集【1505小时中文普通话语音数据集】的语音识别基准实验完成，其识别准确率如下所示：

aidatatang_1505zh(完整的1505小时中文普通话语音数据集)

数据堂开源1505小时中文普通话语音数据集

Aidatatang_200zh(基于完整数据集精选的200小时中文普通话语音数据集)

数据堂开源1505小时中文普通话语音数据集

注：

CER(Character Error Rate)指字识别错误率。

SER(Sentence Error Rate)指句识别错误率。

GMM-HMM指混合高斯模型-隐马尔科夫模型。

TDNN(Time-delay Neural Networks)指时延神经网络模型。

CHAIN(Chain model)是指链式模型。

基于1505小时中文普通话语音数据集，数据堂精选了200小时中文普通话语音数据在OpenSLR发布，并在Kaldi平台提供了训练代码，对应的训练方法也在github平台发布。

据了解，数据堂将持续提供面向学术研究领域开源不同领域、不同应用场景的AI数据集。

开源数据获取方式：数据获取请登录数据堂官方网站

责任编辑： WY-BD

责任编辑： WY-BD

———— 分享到 ————

相关推荐

兼容Meta Quest 2、开源操控方案，Kinerse推出VR运动模拟器

兼容Meta Quest 2、开源操控方案，Kinerse推出VR运动模拟器

兼容Meta Quest 2、开源操控方案，Kinerse推出VR运动模拟器

兼容Meta Quest 2、开源操控方案，Kinerse推出VR运动模拟器

93913网

05-12 08:58

500000人研究发现：每天看电视少于一小时，可预防冠心病

05-25 16:05

500000人研究发现：每天看电视少于一小时，可预防冠心病

科学家发现新方法，可在数小时内分解这种致癌物质

05-24 15:48

科学家发现新方法，可在数小时内分解这种致癌物质

科学家开发提取氢气的新技术：3小时内实现99%的产率

05-25 09:06

科学家开发提取氢气的新技术：3小时内实现99%的产率

太阳能快充最快2.5小时充满，电小二Jackery纽约发布全新光充户外电源2000 Pro

太阳能快充最快2.5小时充满，电小二Jackery纽约发布全新光充户外电源2000 Pro

太阳能快充最快2.5小时充满，电小二Jackery纽约发布全新光充户外电源2000 Pro

太阳能快充最快2.5小时充满，电小二Jackery纽约发布全新光充户外电源2000 Pro

TOM

05-16 17:59

热点精选

雷军：Note11T Pro+将普及120W快充
安兔兔2022-05-25 20:4405-25 20:44

电影《目中无人》曝首支预告高质感古装犯罪动作爽片引期待
娱乐中国2022-05-25 20:2805-25 20:28

周二票房报收830万《暗恋·橘生淮南》定档端午《花束般的恋爱》延长上映
电影界2022-05-25 20:1905-25 20:19

电影《逃狱兄弟3》官宣定档，5月28日爱奇艺云影院首映系列最终章
电影界2022-05-25 20:1505-25 20:15

塞缪尔·杰克逊加盟索尼动画电影《加菲猫》与“星爵”合作配音父子
电影界2022-05-25 20:1505-25 20:15

《欢迎光临》持续热播白宇帆爆发式演技引热议
新娱在线2022-05-25 20:1005-25 20:10

刘强演唱的原创歌曲《Slow Down》正式发行上线
南方娱乐网2022-05-25 20:0605-25 20:06

爱情悬疑电影《分手的决心》台湾定档朴赞郁执导汤唯朴海日主演
电影界2022-05-25 19:5705-25 19:57

网剧《真探秦先生》正式杀青首发剧照悬疑感爆棚

京娱网2022-05-25 19:4905-25 19:49

一定要去源头工厂买家具！至少帮你省下一辆车钱！

TOM2022-05-25 18:2005-25 18:20

人家也是有底线的啦~

相关推荐

兼容Meta Quest 2、开源操控方案，Kinerse推出VR运动模拟器

500000人研究发现：每天看电视少于一小时，可预防冠心病

科学家发现新方法，可在数小时内分解这种致癌物质

科学家开发提取氢气的新技术：3小时内实现99%的产率

太阳能快充最快2.5小时充满，电小二Jackery纽约发布全新光充户外电源2000 Pro

广告

电信与信息服务业务经营许可证京ICP证 010287号

广播电视节目制作许可证(京) 字第00713号

信息网络传播视听节目许可证号 0105093号

增值电信业务经营许可证B2-20090011号

北京地区网站联合辟谣平台

违法和不良信息举报电话：010-85181169

TOM集团邮乐购物合作伙伴广告服务加入TOM

Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明

违法信息/未成年人举报：010-85181169 举报邮箱/未成年人举报：jubao@tomonline-inc.com