2月以来,由美国人工智能公司OpenAI推出的大语言模型ChatGPT席卷全球,其背后的AIGC也被推到了风口浪尖之上,掀起了一波新的人工智能热潮。AIGC 将如何影响 AI 产业,对于各行各业又将带来哪些改变?火热背后,AIGC又对科技治理带来了哪些挑战?
近日,标贝科技副总裁穆向禹博士受邀做客InfoQ《极客有约》直播间,以AI语音产业为实例,深度探讨数实融合创作时代,“AIGC”这一前沿科技趋势的技术现状和产业实践,发展机遇与未来挑战等问题。
从字面来看,AIGC并不难理解,也并非是近几年才出现的新概念。AIGC全称为AI Generated Content,对应互联网的PGC(专业生产内容)、UGC(用户生成内容)、PUGC(专业用户生成内容)等概念,就是通过 AI 技术来自动或辅助生成内容。
事实上AIGC在音乐、视频、音频、数字人、游戏等领域都进行了一定程度的渗透。直至今年2月份,ChatGPT超乎预期的体验,打开了普通用户对AI技术的崭新认知,再次把AIGC推上热搜。
ChatGPT技术突破了以往弱人工智能的水平,将人工智能的数字内容创作能力进一步的得到了提升,给用户带来越来越好的交互体验。而AIGC作为新的生产力引擎,也代表着AI技术从感知、理解世界跨越到生成、创造世界的阶段。
对于国内音频产业而言,随着多场景消费用户的占比越来越多,加之音频行业整体的渗透潜力,AI技术已经成为重要竞争力。一方面,AI技术让声音内容的生产和分发更为高效,另一方面,随着技术的迭代更新,AI对于内容的参与逐渐深入,带动着音频行业以语音合成技术为基础的AIGC内容生产需求增多。
为进一步丰富音频内容生产模式,满足不同场景下的声音需求,标贝科技持续拓展合成语音的技术深度,推出高品质通用语音方案和特色语音定制服务,包括声音复刻、声音转换、情感合成、标准化音色定制等方案,客户可以根据具体的业务场景,快速定制相匹配的合成声音,极大降低音频创作门槛,简化数字新闻的生产流程,让内容生产更加高质高效。
对于人工智能产业来说,数据、算力、算法是其发展三大基础要素。在ChatGPT引发的新一轮AI浪潮下,标贝科技作为一家技术创新驱动的企业,在核心算法、基础数据、算力支撑等方面建立了坚实保障,积极探索AIGC落地应用。
在数据层面来说,ChatGPT之所以能够和用户高质量同频对话,离不开海量数据的“喂养”。传统数据公司更多是做基础的、标准化的一些数据采集标注。而ChatGPT对话式的聊天引入了人类的反馈,对于数据标注有更高要求。例如要求标注员的知识层次、对专业领域的了解等,通过一个更优秀的综合反应能力,对于文本数据给出合理的观点和看法,这些观点和看法不断地被大模型学习,才能呈现出最后流畅的多轮对话。
聚焦AI数据服务领域多年,标贝科技基于坚实的AI数据基地团队,打造了先进的场景化数据采集能力以及高精度的数据标注能力。同时伴随AI产业纵深发展,应用场景越来越广泛,标贝科技不断在数据服务领域进行技术创新和落地实践,对于专业性极强的垂类领域,提供多个行业定向优化的数据方案,快速高效靶定用户痛点、解决问题。
在语音技术方面,当前AI合成声音不仅是一项基本人机交互能力,更被赋予了很多情感属性。随着AIGC开始在语音克隆、数字虚拟人的声音定制等领域得到应用,交互性、实时性进一步增强,对于合成声音的要求也越来越多。
标贝科技将加大布局在合成声音深层次的产品体验,通过技术迭代和产品演进,提高语言的迁移能力以及情感表现力,能够实现千人千面的个性化声音定制平台能力;另一方面,通过自动化、平台化来实现声音定制低门槛、低成本,为音频内容创作提供更多的助力。
发展总是与挑战并生,AIGC迎来发展蓝海,同时也面临知识产权、数据安全等问题的挑战。实际上,随着近几年数字经济发展,国家对虚拟资产和网络数字版权保护措施加强,《数据安全法》以及《个人信息保护法》一一出台,数据安全治理、数据安全保障、数据安全体系建设势在必行。标贝科技始终积极承担履行企业安全管理主体责任,极遵守国家的法律法规,遵守互联网相关的规范。
此外,标贝科技还建立了有效的数据安全防御体系,实行《个人信息分类分级管理计划》,遵循最小够用原则、个人同意原则进行数据采集,以此保护数据主体及用户数据隐私安全;采取控制和安全措施保障用户数据的安全合法,采取内容识别、内容溯源等技术确保的可靠来源。
随着AI技术的持续进步,AIGC应用场景将更加多元化。标贝科技也将继续在AI数据和智能语音领域积极布局AIGC,加大研发投入与技术成果落地,为推动数字化内容生产提供持久的驱动力。