随着5G网络技术的发展以及视频创作门槛的降低,以哔哩哔哩为代表的长视频平台和以抖音为代表的短视频平台在内容创作者数量、视频数量上都得到了爆发式增长。在这样的背景下,企业发现涉及自身品牌和产品的视频内容,特别是存在一定风险的视频内容,其难度日益增大。跨模态多语言智能检索平台——蜜度索骥运用人工智能前沿技术,助力企业全方位感知风险。
传统的视频检索,是通过匹配查询语句的关键词与视频标签来实现的。这一检索方式的不足之处在于,由于缺乏对语义的理解,检索过程高度依赖关键词和视频标签,对于未添加相关标签的视频内容,则容易出现漏检、误检等状况,导致相关部门或企业不能及时发现风险视频。
以短视频平台较为常见的“卖货视频”为例,不法商家通过恶意剪辑,将知名主播或明星的带货视频嫁接至自己的产品,而在发布这类视频时并不添加原有带货品牌标签。在这种情况下,该品牌负责人难以通过品牌关键词检索到这个视频,错失洞察品牌风险的机会。
随着深度学习技术在计算机视觉和自然语言领域的高速发展,文本跨模态检索技术能够理解文字和视频的内容,从而实现视频与文本的匹配,在某种程度来说扩大了视频检索的全面性。
相比传统检索方法,基于内容理解的视频检索也更加接近人类的思考逻辑。智能检索方法不依靠文本标签和视频关键词,而是通过将视频、音频、图片、文本等不同模态信息在统一语义空间中,跨越不同模态内容间的语义鸿沟,跨模态检索技术可以自动理解、关联多模态间的关键要素,通过输入关键信息便可找到最符合描述的视频。
蜜度自主研发MiduCMR跨模态检索引擎
CV(计算机视觉)、OCR(光学字符识别)技术应用于视频检索领域,进一步助力提升检索的“全面性”。利用CV、OCR技术可对视频画面进行识别、检测、分析、滤除干扰,自动感知视频内事件及主体的关键信息,并自动生成视频内容及索引。在一定程度上扩大了检索内容范围,提高了检索的精准度,也能够更好地覆盖存在内容风险的视频。
蜜度索骥作为一款运用跨模态检索技术、CV技术、OCR技术等多项前沿技术的跨模态多语言智能检索平台,能够提升视频信息检索的全面性。这一智能检索应用不仅可以通过“与、或、非”的逻辑关系自由搭配“关键词”进行常规的内容检索,还可以通过跨模态检索功能帮助特定内容的发现。同时,蜜度索骥运用CV等人工智能技术可以对视频中的场景、字幕、弹幕、背景、商标等元素进行识别,帮助企业“定位”自身相关信息。
蜜度索骥轻松检索海量视频信息
蜜度索骥还对100+个政务部门、近300个特殊场景进行加强训练,在社会治理、品牌洞察、经营决策及风险感知等多个场景中展开应用实践。例如,对车祸场景这类视频内容,蜜度索骥可以进行加强训练,做到事发早知道,检索更全面。
此外,蜜度索骥依托先进的自然语言处理技术,在多语言检索方面同样体现了全面性。目前,蜜度索骥支持英语、韩语、日语、印尼语、印地语、亚美尼亚语等200+语种自动检测。
蜜度索骥跨模态多语言智能检索平台
蜜度索骥助力解决数字世界短视频内容的风险难题。在未来,蜜度索骥将继续深耕智能检索领域,以扎实的技术、便捷的功能、全方位的服务为多模态数字内容保驾护航。