首页 > 资讯 > 正文
Qzone
微博
微信

告别数据单一问题 百度AI开放数据集为高校研究加速

资讯 TOM    2018-02-01 12:28

在2017百度世界大会AI技术与平台论坛上,百度3D视觉首席科学家杨睿刚宣布推出目前全球规模最大的“BROAD”百度AI公开数据集计划(Baidu Research Open-Access Dataset),面向公众开放室外场景理解、视频精彩片段、阅读理解在内的三项数据集。其中针对高校普及、推广这三大数据集,是该计划落地实施的重要一步。

告别数据单一问题 百度AI开放数据集为高校研究加速

共享海量优质数据 百度AI公开数据集计划寓意深远

近日,百度正式开始践行这一举措,重点面向海内外高校科研学子推广使用AI数据集。作为“BROAD”计划的重要组成部分,AI数据集走进高校将显著降低机器学习、深度学习的门槛,进一步吸引、挖掘高校环境中潜在的AI开发者,同时为已有的高校开发团队提供数据助力,形成新的行业生态效应。

当云计算逐步普及减轻了计算能力的成本负担,横亘在科研机构和个人AI开发者面前的最大障碍,是数据数量和质量的缺失。很多高校教师表示,当前,国内特别是高校能接触到的数据非常有限,学生获取数据的方式主要是通过大量阅读国外文献,看到某篇文章引用了某个数据,再查找来源,这种方式非常单一、滞后,对于研究的前瞻性与先进性造成了很大影响。

作为全球最大的中文搜索引擎,百度在AI领域持续深耕,不仅在数据采集方面拥有得天独厚的优势,而且具备世界前沿的AI技术储备。此次百度着力在高校推广的AI数据集规模巨大、种类丰富,贴近开发场景,可为AI开发中的机器学习提供海量数据支持。

三大数据集全面开放 计划覆盖百所知名高校

据悉,此次百度将向高校开放室外场景理解、视频精彩片段、阅读理解三大数据集。室外场景理解数据集来源于百度自动驾驶事业部,其中包括世界上第一个带像素级语义标签的室外3D视频。而首次亮相的百度阅读理解数据集DuReader,则是迄今为止规模最大的中文开放领域阅读理解数据集。对此,已经下载使用过的高校教师表示,相比于之前使用的国外高校实验室与海外企业的数据集,百度此次发布的数据集数据量大、类型丰富,具有先进性,能够满足高校科研、教学的实际需要。

目前,百度AI数据集已吸引海内外近160所高校关注、下载使用,其中既有清华大学、北京大学、浙江大学、中国科学技术大学等国内重点院校,也包括斯坦福大学、加州大学洛杉矶分校、美麻省理工学院等海外知名学府。通过多层次、有重点的宣传、普及活动,百度BROAD计划将切实落地于自然语言处理、机器学习、计算机视觉等AI新兴热门学科研究,填补高校科研环境中开发数据来源不足的问题。

百度校企合作层次丰富 助力打造AI研发重地

如果说数据是个体机器学习时必备的原料,那么人才就是驱动AI全行业发展的助燃剂,高校则是发掘与培养未来AI人才的基地。

此次百度面向高校推广AI数据集,正是开启了多层次、影响深远的校企合作。开源的数据集有效缓解了当下高校师生的数据缺失难题,师生获取测试数据也更加方便、及时,大大加速了相关领域问题研究的探索进度与先进性;同时对高校日常教学产生深远影响,越来越多的学生能够在日常教学中便能获得实打实的开发训练、在国内外学术界及时发表新的学术研究成果。对于未来的校企合作形式,多所高校教师表示,希望百度能够开放更多领域的AI数据集,并且开源计算接口与基于云计算平台的虚拟设备。

本次以开源数据集为主题的校企合作,是百度拓展校企合作形式的重要一步。通过更加深层次的资源共享与合作,不仅使得高校更好地借助开放平台完成人工智能的相关研究,推进人工智能相关学科建设,加速人工智能在高校的普及与发展,使高校成为未来人工智能的研发重地;还为人工智能行业提供了富有活力的人才储备,加速推进我国人工智能人才向更高层次发展,以最终实现校企双方在人工智能研发领域的历史性新跨越。 【广告】

责任编辑: 3858NCY

责任编辑: 3858NCY
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com