在万众瞩目的英伟达年度GTC大会中,黄仁勋告诉台下的上万名参会者:新一代AI革命是百万亿美元的市场,而他的赌注在远方。 01 英伟达GTC 2024英伟达,2024财年四季度营收是前一年同期水平的3.5倍。 利润是前一年同期水平的9倍。 股价在16个月内上涨了6倍。 AI浪潮给予英伟达的荣耀让这家公司坐上了全球市值第三的位置,也吸引了上万人来到英伟达在美国时间3月18日到21日举办的2024年度GTC大会现场,包括作为受邀媒体参会的我们硅谷101。 我们在参会前非常好奇,已经成为AI芯片霸主的英伟达在接下来面对AMD、英特尔以及Groq等众多竞争对手的追击,以及英伟达的大客户们,包括谷歌、Meta、亚马逊等等科技巨头都正在自研芯片的压力下,它如何向市场传达出,英伟达能守住霸主地位并且这个市场在未来还有巨大增长潜力的信号,来继续激励华尔街和硅谷。 我们经过四天的参会、逛展会、听论坛和分析师采访,带大家云参会2024年英伟达GTC,也顺便聊聊,作为AI芯片市场绝对霸主的英伟达想要传达出的野心和布局。 在今 年英伟达GTC大会中,有四大板块和议程是我们非常关注的,分别是: 1)英伟达创始人和CEO黄仁勋在第一天的重磅演讲keynote中将传达出的信号; 2)第三天议程中,黄仁勋会主持一场座谈panel,邀请了当今生成式AI浪潮的奠基石论文Transformer架构的Attention Is All You Need论文8位作者到场,这8位作者当年都在谷歌,但后来都纷纷出来自己创业,所以这会是第一次他们8人再聚在一起讨论AI的未来,非常是历史性一刻; 3)前来参展的各家英伟达合作公司,因为这显示出英伟达的业务前景,以及软硬件落地的实际效果我们能有一个很直观的感受; 4)就是分别在这四天中英伟达请来的演讲和论坛嘉宾,从各个科技巨头和AI独角兽的科技领袖分享中,大家对AI行业传递出的信号。 接下来,我们就结合以上四点来聊聊我们对这次GTC的观察。 02 芯片架构更新Blackwell黄仁勋的整场演讲从下午1点到3点,持续两个小时,其中涵盖了英伟达的硬件和软件的各类产品更新,现场PPT和视频效果非常震撼。 老黄非常善于演讲,没有请任何的嘉宾,就一个人在台上讲了两个小时,很会控场也有幽默,台下的效果和观众反应都很热烈,特别是最后讲到英伟达机器人业务那一块,老黄把迪士尼正在研发的Wall-E小机器人请到台上互动,开了些小玩笑,简直太可爱了,效果非常好。 整体来说,除了有几个段子没响之外,气氛都拉到了顶点,很多人看了keynote出来之后都直呼兴奋。 这场万众聚焦的GTC演讲的重点之一就是:重磅GPU架构更新,所以黄仁勋把很大一部分演讲重点放在了名为Blackwell的下一代GPU架构。 他告诉台下观众们:“如今AI训练需要更大的算力,那么就需要研发出更大的AI芯片来支持训练”。 (我们很快会上线一个和业内人士一起逐帧讲解这个动画的视频,详细讲讲每一步,英伟达在Blackwell系列芯片硬件更新上做了哪些设计优化,以及接下来对AI芯片产业将带来如何的影响。) 总的来说,新的架构下,Blackwell系列包括三个型号:B100、B200 和Grace-Blackwell Superchip(GB200)将是下一代更强大的芯片性能更新,也继续实现着黄仁勋之前制定的黄氏定律Huang’s Law – 也就是,GPU将推动AI性能实现逐年翻倍。 黄仁勋,NVIDIA创始人兼首席执行官:
这里还有几个值得注意的点:对于新一代的B100、B200 和 GB200,这些芯片的工作功率范围在700W到1200W之间。随着新一代芯片的功率和性能都大幅度升级,在AI数据中心领域,想要发挥Blackwell的最大潜力,转向液态冷却几乎成为必须,这也给超微电脑Super Micro等数据中心硬件供应商提出了新的挑战。 陈茜,硅谷101联合创始人:
Chiawei Chen博士,Senior Director, Super Micro Computer:
另外,芯片的产能问题也一直是困扰英伟达的一个方面,因为虽然发布了B200,但是市面上能配置到H200的公司都不多。在这次大会上,英伟达也试图直面这个问题,包括台积电TSMC 和Synopsys将 NVIDIA合作,将在生产中使用 NVIDIA 计算光刻平台,希望在加速芯片制造速度的同时,也加快了对未来最新一代NVIDIA Blackwell架构GPU的支持。 03 华尔街“暂不接招”整体来说,黄仁勋的keynote期间在硬件上的发布效果还是非常好的,但是,从GTC这几天的股价震荡就可以看出来,华尔街并不觉得惊喜,因为之前在2月公布财报的时候,利好都已经出尽了,市场已经知道英伟达会出新的芯片,这些硬件的更新已经被市场提前消化了。 Yang Ren,Senior Analyst&Partner at Jirong Investment Management (济容投资):
陈茜,硅谷101联合创始人:
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (济容投资):
所以,在这次GTC上,硬件的发布更新固然重要,但我们能强烈感觉到,黄仁勋想要强调的是,英伟达不仅仅是一家GPU公司,英伟达想要通过软件的升级,不仅仅是已经成功变成英伟达牢固护城河的CUDA,还有更远的布局。 黄仁勋在他的keynote中强调的很清楚,他眼中的新一代市值100万亿美元的新工业革命市场,英伟达是这样布局的:除了Blackwell硬件算力平台,黄仁勋还着重推出NIMs,帮助企业级客户接入AI。 NVIDIA NIM是经过优化的推理微服务,用于大规模部署 AI 模型,为开发AI驱动的企业应用程序和在生产中部署AI模型提供了比较便捷和简化的路径。也就是说,企业想要部署AI,英伟达在生态上已经给你提供了各种api和基础大模型,让企业更快的上手。 此外的生态重点是英伟达的AI foundry和NeMo。去年英伟达发布的AI foundry 具备三个要素:英伟达的AI基础模型,NVIDIA NeMo 框架和工具、用于构建、自定义和部署生成式AI 模型,以及NVIDIA DGX 云AI 超级计算服务。这样依赖,AI foundry就可以用于为企业软件、电信、媒体等各个行业的生成式AI 应用定制模型。而在今年,英伟达进一步在这样的AI foundry生态上继续更新各种基础模型和生态服务。 下一个重点就是英伟达的Omniverse,也就是物理模拟反馈的平台,通过模拟与物理世界中各种互动的过程,来训练AI。我们在之前讲机器人那一集的时候就着重提过,AI机器人在模拟环境中的训练非常重要,而现在来看,不仅仅是AI机器人,还有无人驾驶,气候模拟,药物发现,计算生物学,乃至于Vision Pro所构建的XR生态,英伟达的Omniverse都已经在布局。 这次GTC上,英伟达宣布了Omniverse Cloud API接口,让开发者能够轻松地将Omniverse的核心技术直接集成到现有的数字孪生设计与自动化软件应用中,或是集成到用于测试和验证机器人或自动驾驶汽车等自主机器的仿真工作流中。 同时在keynote中,黄仁勋进一步强调Isaac Sim,这个基于Omniverse平台之上的机器人培训与模拟系统,这相当于给机器人构建了一个全新的“操作系统”,同时,英伟达还宣布了一个名为GROOT的机器人通用基础大模型,和新型计算机Jetson Thor来加速机器人训练。 而且,黄仁勋的一对儿女都在Omniver部门就职,女儿Madison Huang是Omniverse部门的高级产品营销经理,儿子Spencer Huang是Omniverse旗下机器人仿真和扩展组的产品经理,可见老黄对这个Omniverse这项业务的重视程度。 而从英伟达邀请的这四天的分享嘉宾中,我们能从现场就感受到,公司在软件生态上的布局和发力。在各个panel和分享会上,我们也很直观的感受到英伟达软件生态的升级,给各个行业带来的助力,这包括大语言模型赋能自动驾驶技术上,英伟达的数字孪生的模拟技术能让自动驾驶继续在模拟器中得以更好更快更有效率的训练。 另外,在具身智能专家李飞飞和波士顿动力机器人的分享环节中,嘉宾也都强调了深度机器学习给机器人技术带来的巨大潜力,包括在模拟环境中的训练,以及在周一,黄仁勋也宣布了一个通用人形机器人基础模型的新平台,来和波士顿动力等等机器人公司合作,加速机器人的发展。 然而,虽然我身边一些做软件和研究的科学家和博士朋友们都对Omniverse以及数字孪生的升级有很大的期待,但无论是从昨天黄仁勋的演讲现场,还是今天的分享会上,我们的感受和观察是,软件上的升级似乎并没有给外界带来非常大的兴奋值,包括在昨天的keynote演讲中,特别在软件环节,黄仁勋好几个讲的笑话和梗现场的观众都没有理解到,好几度比较冷场。 陈茜,硅谷101联合创始人:
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (济容投资):
陈茜,硅谷101联合创始人:
Qindong Liu,Portfolio Manager&Partner at Jirong Investment Management (济容投资):
华尔街总是难以讨好的,硬件升级,华尔街并不惊喜,因为之前报财报的时候已经被市场消化了,而软件布局,华尔街没有看到即刻的营收价值,目前也没有买账。但这并不影响黄仁勋的长期主义和未来布局,毕竟,加速计算他布局了20年,CUDA软件布局了10多年。 04 权力与野心无论华尔街是否在现在买账,黄仁勋管理下的英伟达正在动用一切的努力去加固自己的护城河,也毫不掩饰的展示出未来朝着更多领域提供服务的野心。 最近一个黄仁勋在斯坦福的演讲中,他说:他的目标是就算竞争对手的芯片免费送,也不如英伟达的划算。非常大的口气。 黄仁勋,NVIDIA创始人兼首席执行官:
所以,更高的护城河,更大的生态系统,是黄仁勋追求的。 一篇华尔街日报里面写到的细节,说风险投资公司Thomvest Ventures的董事总经理Umesh Padval说他和黄仁勋一起去投资布局一些初创公司的时候,黄仁勋毫不掩饰并且以来就比较aggressively、比较激进的直接问:“我需要做什么才能建立生态系统,以便我可以销售更多的芯片和系统?” 所以,我们看到,目前英伟达参与了很多的初创公司投资,除了上面说的这家Thomvest和英伟达一起投资的基础模型AI公司Cohere之外,英伟达还投资了云计算公司CoreWeave。华尔街日报报道, 在上一财年中,英伟达所持其他公司的股份价值增长了五倍多,截至2024年1月底达到约 15.5 亿美元。而英伟达在 2023 年总共投资了超过35家初创公司,这个投资量级是上一年的三倍多。 所以,在这些人工智能、机器人、自动化、医疗保健公司等等赛道,黄仁勋都在布局。也许这些赛道还没有爆发,也许还需要很长的时间,但就像黄仁勋20年前就开始布局加速计算、10多年前就开始布局CUDA一样,这些产业被老黄称为“Zero-billion dollar markets”,就是目前市场有限、但在未来可能会爆发的市场,黄仁勋在一如既往的提前布局他遥远的野心。 而黄仁勋在目前是有资本进行布局的:股价一路上涨、手握大量现金不说,另外一个原因我们在跟硅谷一个VC聊天的时候对方说:现在VC去抢好项目,明星AI公司看的不是你给的估值有多好,而是看你有没有买GPU的渠道。而这个渠道的权力,有谁抢得过英伟达本身呢? 所以,英伟达如今抢占各个明星AI项目的席位,也是非常顺理成章。而这样的市场绝对霸主地位带来的权力让英伟达有着很大的话语权。 华尔街日报同样的一篇文章中写到:甲骨文创始人兼董事长Larry Ellison在去年9月的一次公司会议上讲述了他和马斯克与黄仁勋在硅谷Palo Alto的Nobu日本餐厅吃晚餐。Larry Ellison回忆说,描述这顿饭最贴切的方式是:一个小时的寿司和乞讨。 原文真的用的乞讨(begging)这个词。所以,我们用了“绝对霸主的权力”和“遥远的野心”作为视频的主题,我觉得还挺能概括目前英伟达的状态的。 但是并不是说英伟达就没有挑战了。英伟达可能面对的最大威胁,正是自己。 如果生成式AI像自动驾驶一样发展到瓶颈期,或者最终证明transformer这个架构并不是将人类带向AGI,那么英伟达将面临非常大的危机。 可能这也是为什么黄仁勋将本次GTC大会上,将Transformer论文作者聚集在一起的原因之一。 05 Transformer七子:AI的未来最后,再来说说本次GTC大会上的一个大热门环节:由黄仁勋亲自主持,邀请了Transformer这篇论文的几位作者到场。 2017年,8位谷歌的研究员发表了一篇论文叫做Attention is all you need,这篇论文提出了一种新的简单网络架构,这就是Transformer,它完全基于Attention注意力机制,完全摒弃了之前的RNN和卷积CNN等机制。 而正是因为这篇论文,刚成立的OpenAI开始用transformer的架构开始训练GPT路线,开始走堆算力和堆参数的AI训练方法,之后才造就了今天我们所看到的生成式AI革命。所以这8位研究员可以称为如今生成式AI的大功臣,而他们在意识到transformer架构的潜力之后,也相继的离开了谷歌,开始投身于不同的初创公司和项目当中。 这里面其实有两个很有意思的点: 1)Transformer架构是谷歌最先推出的,但这几位研究元老一位都没有留住,他们在分享中也说道,因为方法有了,接下来最重要的就是快速的出应用,接触用户,完善产品,寻求市场反馈,然后再快速的推进,但显然,谷歌陷入的所谓的“大公司创新陷阱”里,很难在公司内部来快速推进,所以大家只能纷纷叛逃,出来自己做初创公司,这8位从前的研究员,如今的创业者,全部都是这样。 2)他们也看到了如今AI浪潮所带来的机会,而他们本身的光环就足够能吸引融资和人才人脉加入他们。在硅谷,人们都想创业,都想自己推出产品,主导创新,而就像黄仁勋说的,接下来10年将是黄金10年的机会,所以也难怪8位研究员都出来自己单干。很有意思的是,他们之前从来都没有聚在一起过,之前都是线上合作办公,而这一次,除了一位女性研究员Niki Parmar 因为有家里急事没有来之外,其它七位研究员都来到了现场,可以说是非常有历史纪念意义的一个瞬间了。 整个会场从很早就开始排队,差不多接近2000人的会场都坐满了,黄仁勋也提前来到现场和大家打招呼合影,之后介绍每位研究员上场。 他们分别是AI角色扮演对话公司Character AI联合创始人兼首席执行官Noam Shazeer; 我们上面提到的基础模型AI创业公司,Cohere联合创始人兼首席执行官Aidan Gomez; Ashish Vaswani和缺席的Niki Parmar两人联合创立了Essential AI这家基于大模型的全栈型智能产品开发商,Essential AI开发了一项名为“企业大脑”的技术,可以利用AI执行企业职能,比如说数据分析,并自动执行单调的任务。 此外,Llion Jones在日本东京创建了Sakana AI,这是一家AI技术研发商,专注于为基础模型创建新架构; Illia Polosukhin联合创立的使用区块链为AI 赋能的Near Protocol公司; 此外,Jakob Uskhoreit是Inceptive的联合创始人兼首席执行官,这家公司将人工智能用于mRNA疫苗开发; 同时英伟达也投资了他们;最后是Lukasz Kaiser,加入了OpenAI,而黄仁勋介绍他上台时开玩笑说,这是8位作者中唯一一位还在做工程师的技术人员。 而在座谈会上,大家分享了自己从事的公司方向,以及对技术的理解。大家认为,模型还需要进一步的优化,无论是在技术还是在推理上,我们还需要看到技术的继续突破,甚至需要有比transformer更好的框架。 Aidan Gomez,Cohere联合创始人兼首席执行官:
而一个比transformer更好的模型或者框架,英伟达的GPU是否还是必不可少的呢?这其实是一个问号,也是英伟达最大的危机所在。 但无论如何,目前算力是紧缺的,七位作者也一致认为,接下来,自适应计算(adaptive computation),也就是如何在特定的问题上分配合适的计算量,也是接下来的着力点之一。 换句话说,如果我们把2+2=4这个问题输入现有模型,计算机需要使用一万亿参数解答这个问题,而这个问题的价值就不如问“2+2为什么等于4”,所以之后我们如何去集中算力解决更有价值的问题、更合理分配算力,也是接下来需要推动的方向。 同时,七位作者也认为,AI下一个更重要的方向是训练AI的推理和自主决策能力,因为AI的推理能力越强,所需要的数据训练量就越少,届时用于训练的数据质量会更加重要,人机交互会更加深度,而接下来 如何去训练更高质量的数据、私人的数据,将是接下来发展的重点和挑战。 而随着AI技术迅速往前更迭,创业者以及创业赛道都面临着巨大的不确定性。所以今年2024年GTC给我的唯一确定性就是,AI还是继续发展和变化。 最后,问大家一个问题,大家知道GTC的全称是什么吗? 公布答案:GTC大会的全称是“GPU Technology Conference”。 第一届是2009年,此前都是非常GPU非常硬件的会议,但之后随着英伟达公布CUDA,公布软件布局,如今,GTC已经不止是GPU,而是更大的生态,以及将会影响人类未来的各种可能性。 本文来自微信公众号“硅谷101”(ID:TheValley101),作者:陈茜inTheValley,36氪经授权发布。 |
|
来自: mrjiangkai > 《我的图书馆》