搜索图标

中文/English

芒果TV拿下全球顶级算法大赛世界冠军

2022-08-17 00:00

分享到

来源:芒果TV


       “解题”


与全球高手同台竞技,拿到国际顶级比赛的冠军,是种什么体验?


三年了,马栏山的夏天总有“算法”的一份子。


昨天,第三届马栏山杯国际音视频算法大赛正赛阶段A榜正式结束。外部的好消息,已经抢先一步到来——


在推荐系统领域与音视频领域的两大顶级算法赛事ACM Recsys Challenge 2022与CVPR2022中,芒果TV与全球顶级的算法工程师们巅峰对决,夺取了一冠一亚两季军的历史最佳战绩。


ACM Recsys Challenge关注“推荐”这一算法应用范围最广的领域。今年的赛题是一道来自“时尚领域”的商品序列推荐:给定一些用户浏览商品的行为数据,然后判断用户将会对哪个商品下单。


随着AI技术的迅猛发展,推荐系统在各大互联网平台得到了广泛应用,各种算法不断推陈出新。实际工作中,像天猫、京东这样的在线购物平台,一直在持续优化这方面的技术。


比赛的难点在于,给到的序列较短,数据规模较大,也不全面——对于AI来说,可学习的材料不够多,更考验方案的可用性。参赛的芒果TV智能算法团队,甚至为让比赛使用的方案得到更明确与权威的认证,专门投递了相关论文进行诠释。


事实证明,“破坏式”创新的能量,打破了原有的格局。依靠对赛题数据的详尽分析和一整套高效解决方案,第一次参加该赛事的芒果TV推荐算法团队,打败了前两届的大赛的冠军和全世界各地的顶级人工智能专业团队,拿到了芒果TV智能算法部在国际顶级赛事中的第一个全球冠军。

图片


这也正是今年芒果TV算法部门踊跃参与国际顶级赛事的缩影。ACM Recsys Challenge 2022折桂之外,芒果TV派出了3支小分队,参与了视觉领域的国际顶级会议CVPR2022的不同挑战赛。


2021年的CVPR,第一次参赛的芒果TV就在视频人体时空定位赛事中一举拿下全球亚军。今年,图像分割、图像识别、图像补全……各个领域都开花结果。智能算法部门的陈凌驰、余意、王心莹带领的团队,分别获得了不同赛道的一个亚军与两个季军。

图片

图片



这些惯常与代码打交道,关心服务器算力是否能支持他们的方案的GEEK们,擅长各种“解题”——今年的比赛,是时尚推荐、盲人图片问答、足球赛事直播的相机标定等等五花八门的“难题”。而解题之后,落地应用才是一件更务实、更受关注的事。



       “落地”

不明觉厉的技术,都会用在哪里?


如果没有可接触的产品和实际体验,“算法”,好像更接近一种玄妙。


往年,CVPR各个研讨会的主题大部分固定,每个主题也伴随着各自固定的竞赛。随着AI进一步渗透传统领域甚至形成一些颠覆,今年,CVPR的各个研讨会也进行了相应拓宽,引入了更多全新的赛题。


前沿领域探讨的课题,终究要在实践中得到检验。对于追求经世致用的湖南人来说,再好再先进的技术,也会优先考虑落地应用的问题。


去年,拿到CVPR2021视频人体时空定位赛道亚军之后,芒果TV智能算法部开发了芒果TV的首个二创平台,通过AI赋能,让算法自动生成大量新颖、有趣的二创视频,大大降低了人工制作的成本,提升了视频自动投放的效率。


今年,在ACM Recsys Challenge 2022和CVPR2022中用到的这些技术,应用范围更广了——


芒果TV推荐算法团队的方案,首先可以应用于小芒电商,当新用户行为较少、部分活跃用户兴趣变化较快时,都能进一步提升推荐效果。


另一方面,在内容平台,“下滑”观看下一个,已经成为用户的固定使用习惯。推荐团队的新模型,也有利于提升用户喜好的命中率,让推荐内容更符合用户的实际需求,带给其更沉浸的体验。


其他的技术也同步服务于产品本身——


在用户端,陈凌驰的图像分割技术,可以用于弹幕防挡、人像分割等场景。刷剧刷综艺时,既能配合弹幕使用,又能让弹幕不挡脸、自动屏蔽不友好言论,这些算法自动完成的事,不仅提升了用户体验,也让内容核验工作更智能省时,大大减轻了人工审核的工作量。而除了这些基础性工作,这一模型还能介入智能生产,在短视频特效等领域,实现关键的“促活”效果。


在产业端,余意的多模态深度学习模型,支持了更智能的搜索-投放流程。根据一段文本关键词,就能从芒果TV已制成的海量素材中自动锚定相关视频场景,这不仅大幅度降低了资料搜索的难度,对于广告投放来说,这样的产品也将指数级增加投放定点、提升投放效率。对于盈利模式与营销产品都较为单一的长视频平台来说,这一技术直接指向营收提升,是最具有现实价值的业务之一。



       “生根

不仅向外输出,更要深耕自身


当下,今年的ACM Recsys Challenge和CVPR都已经告一段落。客场对战,芒果TV拿下一冠一亚两季军的优异成绩;现在,终于轮到主场时间——结赛之后,今年的三维视觉、推荐、画质评价三个赛道,即将角逐出今年的优胜者。


当马栏山的算法大赛来到第三届,出什么考题,大约就能预测到芒果TV接下来在算法领域的主攻方向,更能从技术需求,推测出芒果TV正在布局的未来产品形态。

图片


今年的命题,也有传承、有创新。一方面,画质评价与推荐,都是视频平台算法应用的经典赛题,数据均来自于芒果TV真实业务场景,具有高探索价值。曾经的参赛者,陆续成为后来的出题人,也让这项技术,逐步改变了芒果TV站内的内容运营,荐产品,已经成为命中用户偏好、提升用户留存、促进用户对芒果TV内容认可的重要助力。


另一方面,三维视觉这一元宇宙“敲门砖”式的基础技术作为赛题首次出现,也对应着芒果TV在元宇宙领域持续进行的技术储备。依靠芒果TV初步搭建的光场系统所积累的数据,参与这道赛题的选手,将获得极其稀缺且真实的数据来源——当有了好的实验材料与标本,好的成绩自然更容易出现。


2020年以来,随着“马栏山杯”算法大赛的举办,总是以内容手艺人自居的芒果TV,打通了通往算法这个小圈子的“桥梁”。也正是从这一年起,居于中部省份、在相关配套上优势并不明显的长沙,持续引入了一百多位一线算法人才,让芒果TV的算法技术革新进入到全新的阶段。


2019年,在视频化的巨大浪潮之下,芒果TV智能算法部初建,为实现机器从文本到视频的内容理解与深度学习而增强技术研发,同时,也为未来的内容智能生产竞争做技术储备。短短三年后,芒果TV已研发出足以问鼎全球冠军的技术与方案,并且通过自主举办的算法大赛,紧紧把握住最新的算法技术与最前沿的人才。