分享

谷歌Gemini大模型预示三大AI机会方向

 天人合一1007 2023-12-11 发布于河南

我们在Gemini大模型发布前的本周周报《ChatGPT一周年:AI盛宴才刚刚开始》首次指出多模态AI应用、算力国产化、AI终端重构是新的三大AI机会方向,恰是Gemini大模型此次发布所代表的新趋势:

1)多模态AI应用:Gemini大模型最核心亮点在于对视频多模态的理解能力,拥有视频数据与应用卡位的企业或有重估机遇。

2)算力国产化:Gemini并没有依赖英伟达芯片算力,是由Google自研TPU v4和TPU v5e训练出来的大模型,值得关注的是谷歌设计的TPU细节的论文《数据中心的TPU效能解析》大量引用致敬我国【寒武纪】的研究工作,一方面给予我们国产算力崛起的信心,另一方面国内真正大客户互联网巨头开始批量采购华为昇腾、寒武纪为代表国产AI芯片拐点已经到来。

3)AI终端重构:谷歌同时发布Gemini Nano这一专门为移动设备训练的模型。针对不同内存的设备,训练了两个版本,参数量分别是18亿和32.5亿。大模型重构各类终端的趋势再度确认,我们将迎来前所未有终端硬件创新潮。

投资建议:

1.建议关注芯片基础算力国产化与一体机相关标的:华为昇腾一体机:科大讯飞、云从科技、软通动力、恒为科技、安恒信息;国产核心算力:寒武纪、浪潮信息、海光信息、超讯通信、汇纳科技

2.从AI PC到AI pin的AI终端变革:大模型重构有望从AI PC开始共振,逐步延伸至汽车、手机与机器人等各类终端,或将迎来全面一轮的AI终端硬件创新潮,建议关注充分布局AI终端相关标的:中科创达、萤石网络、漫步者等。

3.海外在大模型持续赋能下,已明确其商业化规模落地的成功之路。国内在各大模型基本具备GPT3.5水平能力下,以及政策的持续推动,AI应用有望复制海外的成功路径,建议关注相关AI应用标的:效率办公-金山办公、AI司法-金桥信息、GPTs分发渠道-梦网科技、AI空间计算-超图软件、AIGC创作-万兴科技、超讯通信、教育-佳发教育、邮箱-彩讯股份、社交-掌阅科技

1.1谷歌发布全球首个端到端多模态大模型——Gemini

Gemini系列模型是一开始就使用多模态数据(包括文字、音频、图片、视频、PDF文件等)训练的大模型,其中视频数据训练是通过将视频编码为一系列帧序列,视频帧(图像)可以与文本或音频实现混合训练。

图1: Gemini大模型架构图

资料来源:谷歌Gemini技术报告,民生证券研究院

Gemini系列模型分为Ultra、Pro、Nano三个版本,都支持上下文32K理解,其中:

1)Ultra版本是性能最强的版本,在对应的TPU基础设施中能够展现出最高效率,在多项测试中Ultra版本性能超过GPT4V(后文有详细测试结果);

2)Pro版本是性价比优化的版本,在推理、多模态等方面有较强能力,Pro版本具有良好延展性,可以在几周内完成预训练,在多项测试中仅次于GPT4V,强于PaLM2、Claude2、LLaMA2、GPT3.5等主流大模型;

3)Nano是通过对其他模型蒸馏得来的4位模型,有1.8B和3.25B两个版本,分别针对低内存和高内存设备,支持在本地部署

Gemini Ultra版本在32个学术基准中,有30个超过GPT4V处于全球最先进水平。据谷歌黑板报,Gemini Ultra 的得分率为 90.0%,是第一个在 MMLU(大规模多任务语言理解)测试中超过人类专家的模型,MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目,用于测试世界知识和解决问题的能力,在包括文本和编码在内的一系列基准测试中,Gemini 的性能都超过了当前最先进的水平。

图2:Gemini Ultra在文本领域各类测试表现

资料来源:谷歌黑板报微信公众号,民生证券研究院

介绍其自行设计的AI芯片TPU细节的论文《数据中心的 TPU 效能解析》(In-Datacenter Performance Analysis of a Tensor Processing Unit),共同作者多达 70 人,领衔第一作者是计算机体系架构硬件大师 Norman Jouppi。令人震惊的是,这篇 详细介绍TPU细节的 论文引用了国内刚刚刚成立不久的AI芯片公司寒武纪团队成员前期发表的 6 篇学术论文,并有专门段落回顾一系列学术工作显示尊重,这在几乎由美国垄断的计算机基础体系架构设计领域,在全球范围内都是极为罕见的。

1.2.1 谷歌TPU与中国AI芯片企业寒武纪有着微妙联系:

2012年,陈天石等中科院计算所的科研人员,与首次提出“AI加速器”概念的法国教授Olivier Temam,共同启动神经网络处理器(AI芯片)项目进行了一系列开拓性学术工作,已经成为全球AI芯片领域引用次数最多的学术论文,成为世界范围内研发智能芯片必读的文献。这也是寒武纪的技术来源。

2014年12月,DaDianNao(又称寒武纪2号神经网络处理器,面向大规模神经网络的应用)荣获2014年度Micro最佳论文,这也是Micro自1963年创办以来,第一次由美国以外的研究者摘得该奖项。

2017年,美国人工智能的领军企业谷歌首次发表了详细介绍其自行设计的AI芯片TPU细节的论文《数据中心的 TPU 效能解析》(In-Datacenter Performance Analysis of a Tensor Processing Unit),共同作者多达 70 人,领衔第一作者是计算机体系架构硬件大师 Norman Jouppi。令人震惊的是,这篇 详细介绍TPU细节的 论文引用了国内刚刚刚成立不久的AI芯片公司寒武纪团队成员前期发表的 6 篇学术论文,并有专门段落回顾一系列学术工作显示尊重,这在几乎由美国垄断的计算机基础体系架构设计领域,在全球范围内都是极为罕见的。

图6:2017年4月谷歌首次发表了详细介绍其自行设计的AI芯片TPU细节的论文《数据中心的 TPU 效能解析》

资料来源:集微网,民生证券研究院

据CSDN,TPU相比GPU通用性更弱,但特定任务的处理速度和能耗优化程度将显著领先,AI时代TPU商业化能力的一大前瞻指标为TPU适配大模型情况:

1)谷歌TPU:据谷歌云官网,AI大模型客户、Huggingface等;

2)寒武纪:据英伟达官网,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,寒武纪思元(MLU)系列产品性能均达到国际主流产品的水平;

1.3模态AI应用浪潮或开启

谷歌Gemini演示视频所有用户提示和输出都是真实的,只是为了简洁起见进行了缩短。据CSDN,Gemini演示视频中仿佛可以实时观察人类的行为,如观察人类在做什么,并给予反馈:例如,Gemini看到一只鸭子从草图到填色的整个过程,可实时给出解释和反馈,还能在换杯游戏中追踪纸团、辨别各种手势、重新排列行星草图等;后续,针对网络质疑,谷歌DeepMind研究副总裁Oriol Vinyals追加补充视频中的所有用户提示和输出都是真实的,只是为了简洁起见进行了缩短。

Gemini开始在谷歌多种产品和平台推出。据谷歌黑板报, Bard 将使用 Gemini Pro 的微调版本来进行更高级的推理、规划和理解等;Pixel 8 Pro 是首款搭载 Gemini Nano 的智能手机,它可以支持录音应用中的“总结”等新功能,并在 Gboard 中推出“智能回复”功能,从 WhatsApp 开始,明年还将推出更多信息应用;未来几个月,Gemini 将应用于我们更多的产品和服务,如 Search、Ads、Chrome 和 Duet AI;公司已经开始在Search中试验 Gemini,它能够为用户提供更快的搜索生成体验(SGE),用户在美国的英语搜索延迟降低了 40%,同时在质量方面也有所提高。

领衔第一作者是计算机体系架构硬件大师 Norman Jouppi。令人震惊的是,这篇 详细介绍TPU细节的 论文引用了国内刚刚刚成立不久的AI芯片公司寒武纪团队成员前期发表的 6 篇学术论文,并有专门段落回顾一系列学术工作显示尊重,这在几乎由美国垄断的计算机基础体系架构设计领域,在全球范围内都是极为罕见的。

图6:2017年4月谷歌首次发表了详细介绍其自行设计的AI芯片TPU细节的论文《数据中心的 TPU 效能解析》

资料来源:集微网,民生证券研究院

据CSDN,TPU相比GPU通用性更弱,但特定任务的处理速度和能耗优化程度将显著领先,AI时代TPU商业化能力的一大前瞻指标为TPU适配大模型情况:

1)谷歌TPU:据谷歌云官网,AI大模型客户、Huggingface等;

2)寒武纪:据英伟达官网,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,寒武纪思元(MLU)系列产品性能均达到国际主流产品的水平;

1.3模态AI应用浪潮或开启

谷歌Gemini演示视频所有用户提示和输出都是真实的,只是为了简洁起见进行了缩短。据CSDN,Gemini演示视频中仿佛可以实时观察人类的行为,如观察人类在做什么,并给予反馈:例如,Gemini看到一只鸭子从草图到填色的整个过程,可实时给出解释和反馈,还能在换杯游戏中追踪纸团、辨别各种手势、重新排列行星草图等;后续,针对网络质疑,谷歌DeepMind研究副总裁Oriol Vinyals追加补充视频中的所有用户提示和输出都是真实的,只是为了简洁起见进行了缩短。

Gemini开始在谷歌多种产品和平台推出。据谷歌黑板报, Bard 将使用 Gemini Pro 的微调版本来进行更高级的推理、规划和理解等;Pixel 8 Pro 是首款搭载 Gemini Nano 的智能手机,它可以支持录音应用中的“总结”等新功能,并在 Gboard 中推出“智能回复”功能,从 WhatsApp 开始,明年还将推出更多信息应用;未来几个月,Gemini 将应用于我们更多的产品和服务,如 Search、Ads、Chrome 和 Duet AI;公司已经开始在Search中试验 Gemini,它能够为用户提供更快的搜索生成体验(SGE),用户在美国的英语搜索延迟降低了 40%,同时在质量方面也有所提高。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多