分享

无损压缩,解决卡顿,《硅谷》技术正被字节跳动海外团队逐步实现

 rhl1020 2021-03-07

看过《硅谷》的朋友可能还记得,这部电视剧在开篇虚构了一项开创性的压缩算法,文件被在线压缩至一半大小后,清晰度没有折损。

影视情节体现了人们对未来科技的遐想,而计算机科学家们正在将这些梦想带进现实。最近,字节跳动的海外技术团队发起了一项提案,不仅可以优化压缩质量,而且比起业界最先进的编码平台,还可以节约至少13%的存储和带宽成本。

视觉无损压缩

有报告显示,人类产生的数据近年加速上升,2021年总量将超过600万亿亿字节。如果把这些数据全部存在DVD中,光盘叠加起来的高度将是地球和月球距离的10倍。

一些“极客”们一直在寻找降低存储成本的办法,像处理固体垃圾那样,将数据压缩成更小的模块。

如果使用字节跳动的压缩技术提案,结合最新的国际标准H.266/VVC,将下面这张《囧妈》剧照压缩5344倍,肉眼几乎看不出差异。这其中的变化,好比孙悟空的金箍棒从定海神针缩小到一根银针,但细纹依然清晰可见。

无损压缩,解决卡顿,《硅谷》技术正被字节跳动海外团队逐步实现

左为原图,右为压缩5344倍的版本,肉眼几乎看不出差异

压缩技术直接影响着视频编解码的效率,最终决定了存储空间和用户观影体验。《囧妈》时长约为2小时,按照最新的国际标准,类似长度电影的1080P高清版本需要2GB的存储空间。而字节跳动的技术提案可以节约13%,只需要不到1.8GB。

负责这项研究的字节跳动先进视频团队隶属于火山引擎多媒体实验室,成员既包括来自高通、微软、英特尔等科技公司的资深研究员,也有出身海内外顶级院校的新生代力量。

在新一代国际视频编码标准H.266/VVC制定过程中,字节跳动近半数的技术提案被采纳,远超采纳率的平均值(15%)。据知识产权领域权威媒体报道,在这个最新标准的技术贡献排名中,字节跳动名列全球第三,仅次于高通和华为。

无损压缩,解决卡顿,《硅谷》技术正被字节跳动海外团队逐步实现

字节跳动排名第三,仅次于高通和华为 图/《知识产权资产管理》

值得一提的是,字节跳动项目团队在H.266/VVC标准化工作启动之后才开始组建,错过了技术积累的黄金期,但仍然弥补了差距,实现弯道超车。

解决卡顿

除了无损压缩,很多用户还关心的一个问题是,何时才能攻克播放卡顿的难题。这其中的关键是压缩效率,涉及到视频编解码的优化与传输。视频编码器是这些技术的载体,在视频软件、视频会议、直播、云游戏等场景中应用广泛。

说到视频编码器,字节跳动先进视频团队同样有着丰富的经验。此前,火山引擎多媒体实验室研发了视频编码器「BVC1」,将带宽需求降低了30%。而先进视频团队在过去一年让这款编码器节约了20%的码率。

在优化编码器的过程中,技术人员训练了一套智能编码技术,可以对人眼在看视频时的兴趣点进行针对性的优化。现实中,人们在观看画作或是视频的时候,信息的分布常常并不均匀,这导致了注意力和兴趣点的差异。智能编码技术可以提高人眼关注部分的画质,弱化人眼不容易注意到的区域,可以保证在码率降低10%的情况下,避免视觉体验的折损。

无损压缩,解决卡顿,《硅谷》技术正被字节跳动海外团队逐步实现

视觉兴趣点很容易集中到长颈鹿上 图/《地球脉动》

在「BVC1」的基础上,先进视频团队进一步迭代,并研发出「BVC2.0」编码器。2020年12月,这款编码器在国际视频编码器大赛上首次亮相,并在离线赛道的全部4项评分标准中包揽第一。离线赛道意味着,即使信号不好,用户也可以用正常网速看视频,减少播放卡顿。这对于经常在地铁上看视频的上班族来说,绝对是一个好消息。

无损压缩,解决卡顿,《硅谷》技术正被字节跳动海外团队逐步实现

左为BVC2.0处理后的图像,右为现行标准处理后的图像,左边画质更清晰

早在2018年11月,BVC2.0的研发就开始了。初始阶段只有1个员工全职参与。一年半之后,项目团队扩展到10个人。由于负责研发的团队成员多在美国办公,且分散在多个城市,受疫情影响,只能线上交流,每两天对齐一次进度,迭代一个新的版本。在一个多月的时间里,项目团队完成了一般团队近半年的工作量,最终在比赛中取得优异成绩。

团队负责人介绍,这款全新的编码器接下来会在抖音、西瓜视频等字节跳动视频产品上应用,这将进一步降低创作成本,显著提升广大用户的观影体验。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多