颜永红:AI+算法,为音视频产业带来“新动能”
发布时间:2022-04-26 11:07
近日,2021世界计算大会专题活动——由芒果TV联合马栏山视频文创园举办的第二届“马栏山杯”国际音视频算法大赛颁奖盛典暨高峰论坛,在长沙举行。活动现场,芒果TV颁发了本届算法大赛视频补全、视频推荐与音乐节拍检测三大赛题的冠亚季军奖,并公布了芒果TV首个虚拟主持人“YAOYAO”。 
“在我看来,本次大赛一方面有一些比较贴近现实的应用,让大学生可以接触到一些功能性的模块,提升学生对人工智能的兴趣;另一方面主办单位芒果TV本身处于音视频行业中,让大赛在新媒体方面更能成为风向标。”在活动现场,中科院声学所首席科学家、中国科学院核心骨干特聘研究员颜永红在接受科技日报记者采访时表示。
音视频产业更需要AI+算法的加持
“音视频算法近两年的研究大趋势在于把对标签数据的需求给降下来,这是一个比较大的进步,而且已经看到这些成果在语音和视频方面都得到了一些实际的应用和效果。”颜永红说。
颜永红认为,这个趋势是由于科研永远都是朝着解决现实应用中的瓶颈问题而展开,需要用更小的计算复杂度、更小更少的前期投入来达到更高的精度。
近年来,随着“北有中关村、南有马栏山”定位的逐步推进落实,湖南的音视频产业迅速发展,芒果TV在内容与技术领域也不断取得突破。
在颜永红看来,音视频产业更需要AI+算法的加持。
“比方说,一个小时的节目里,用户可能只是对某一个片段,某个人的表演部分特别感兴趣。有了AI的智能算法,就可以让用户直接就跳到想看的片段。比如,踢一场足球90分钟,如果你只想看5分钟,如果通过人工方法来确定肯定要投入人力,但有了这种计算的能力,可能瞬间就能把这部分的内容给摘出来。”颜永红说。
“另外,AI技术本身就可以直接介入内容制作,起到辅助作用。比如,拍电影拍错了一个片段,过去可能得完全重拍,现在用AI技术修正,降低了制作成本,缓解了人力需求。”颜永红举例。
赛题契合音视频行业的实际需求
在前沿学术研究价值之外,本次大赛的赛题也契合了音视频行业实际的业务需求,相关方案将在很大程度上解决目前的行业痛点。例如,“视频补全”可以利用算法实现视频内元素的自动抹除与替换,极大减轻视频行业后期工作人员的重复性工作负担。
同时,作为一道可以不断更新与精进的经典赛题,“视频推荐”已逐步运用在芒果TV站内内容的显示与排序,为用户和内容做更好的匹配。
在相对“小而美”的音乐节拍检测赛题,则有望在未来产出更多实际应用在C端的“轻型”产品,进一步降低普通用户对音视频产品进行编辑与再创造的门槛。
在本次大赛中,颜永红对一些参赛作品印象深刻。“我看见此次参赛的一个方案,如果视频拍错了,马上就可以把人或者背景进行替换修改。不需要再等到后期修正。”
不仅如此,一些方案已经实际应用。在活动现场的互动展上,颜永红体验了4D观影技术。“视频播放时手机也会随着节奏节拍震动,辅以声光特效。除了听觉视觉,还多了触觉的感受。”根据了解,这些节奏识别就是通过算法自动完成的。
颜永红还提到了芒果TV的全景声,“让人瞬间有了沉浸的感觉。”颜永红说,“我觉得特别贴近人的生活。也许背后的技术本身并不是那么高精尖,但是非常实用,给用户体验确实是加分不少。”
算法大赛带动产学研正向循环
通过开放大量真实、高价值的脱敏数据,两届算法大赛吸引了大量的算法一线研究者与工作者参与。
今年,1959支队伍参加比赛,比去年增加51.4%。选手来自阿里、腾讯、小米、华为等100多家知名企业,以及美国麻省理工学院、纽约大学、清华大学、北京大学、复旦大学等100多所全球顶尖高校。
经过45天的角逐,这些算法精英们将三道赛题相关技术水准提高到国内领先水平。芒果超媒副总经理、芒果TV副总裁梁德平代表芒果TV与其中的优秀选手陈搏、梁超签约。同时,马栏山视频文创园也与盘古智库长沙研究院项目、马栏山视频先进技术研究院项目等6个项目签约。
“我看到已经有6个项目跟马栏山文创园签约,而且这些获奖的选手也有可能跟芒果TV合作。颜永红说。“主办方同时又是需求方,他们了解这个行业的痛点,所以我认为此次的‘马栏山杯’国际音视频算法大赛,确实是需求牵引的。”他认为,“在产学研用这一块,这是一个很好的正向循环的例子。既提高了青年学子对算法的兴趣,同时也给他们的成果提供了一种可能落地的机会,非常值得倡导。”
随着人工智能越来越广泛的应用,音视频产业已进入全新的时代。算法大赛以比赛带动技术转化,又以真实需求促进技术研发,带动产学研正向循环。 
(来源:科技日报)