启闳半导体科技(江苏)有限公司QiHong Semicon TECHNOLOGY (JIANGSU) CO.,LTD
过去几年来,在需求的推动下,互联网造芯早已家喻户晓。尤其是过去几年云计算、数据中心和人工智能的火热,全球领先的互联网企业似乎都殊途同归,走向了AI芯片、CPU和DPU等芯片的自研道路。与此同时,他们还会根据各自业务的不同,针对性地打造了不同的芯片矩阵。
在我们还对互联网造芯近年发展之快感到惊叹之余,诸如谷歌、Meta、字节跳动和腾讯等互联网公司又都无一例外地盯上了一款芯片:那就是视频处理芯片VPU(Video Processing Unit)。
谷歌、腾讯、字节和Facebook
均已着手自研
2021年4月,谷歌发布了自研的Argos VCU(VCU是谷歌的称法)。Argos有10个用于处理视频的内核,这些内核放置在一个相当大的散热器下,每块板上放置两个芯片。谷歌声称它可以将计算效率提高20到33倍,以往处理4K视频要几天,现在只需数小时就行。Argos的研发成功替代了多达数千万颗英特尔CPU,仅CPU就节省超过200亿人民币的资金投入规模。在构建这个芯片的过程中,谷歌甚至创造了他们自己的EDA工具,叫做Taffel。
谷歌Argos VCU
我们正在进入一个音视频蓬勃发展时代,表现为视频用户数激增、视频产生量巨大,视频越来越难以被压缩和处理。从2003年发展至今,有许多不同的视频标准和编解码器(如下图所示),如果编解码器在压缩视频时的效率越高,那么最终的文件尺寸更小,流更小。
图源:谷歌在Hot Chips 33 上的演讲内容
谷歌的Argos芯片能助力其使用VP9的视频编码器,相比前一代H.264,其视频压缩效率提高了40%。VP9是一种更复杂的视频编解码器,它允许视频文件变得更小并保持相同的图片质量,它还可以存储相同大小但质量更高的视频。VP9允许Google节省大量带宽,这些带宽通过他们的内容交付网络从数据中心流出给消费者,这反过来又大大降低了他们的成本。AV1是更高级别的视频编码方式,将比VP9再提高30%-40%。更高级别的压缩通常需要更多的计算。
根据SemiAnalysis的消息来源,下一代Argos已经在开发中。它将能够实现在CPU或GPU 上难以支持的 AV1 格式,将实现进一步的存储和带宽节省。此外,他们还计划开始在新芯片上添加机器学习推理硬件。最后,他们还将在附加卡本身上添加网络,以提高效率并减少与主机 CPU 的通信。这将允许他们自动生成视频字幕,检查是否违反服务条款,甚至允许在 YouTube 和 Google 照片上启用视频搜索。