多家头部厂商押注AI手机，未来手机什么样？

板桥胡同37号 2024-03-04 发布于天津

展开全文

目前“AI手机”只是附加了AI功能的智能手机，革命性的改变尚未来临

文｜杨柳

编辑｜郭丽琴

农历新年复工后，多家手机厂商铺开了面向市场的新故事：全力押注AI手机。这不由让人追问，AIGC能否在手机端找到可持续盈利的技术和商业模式。

先是OPPO CEO陈明永发布的内部信断言，AI手机将成为继功能机、智能手机之后的第三阶段，OPPO专门成立了AI中心。同一天，魅族宣布进行战略调整，停止传统智能手机新项目的开发，全力投入“明日设备”。

这股吹向手机厂商的大模型劲风，从2023年下半年便逐步蓄势。手机厂商纷纷自研大模型，随后推出AI手机新款。受制于调用云端大模型服务的高成本等因素，这些AI手机追求在本地设备端搭载运行大模型。OPPO、vivo、荣耀、三星、谷歌等，成为快速抢滩的安卓阵营厂商。苹果动作稍缓，但据媒体报道，苹果即将升级的操作系统iOS18将引入大模型支持语音助手Siri。

“生成式AI和手机的结合是'双向奔赴’。”市场分析机构Counterpoint Research智能手机业分析师Archie Zhang向《财经》表示，作为目前市场最大的消费电子产品，手机与AI结合，有助于将AI技术普及至千家万户；同时，近十年来，智能手机交互逻辑和生态变化不大，生成式AI技术（AIGC）有潜力革新目前的手机生态和交互方式。

智能硬件AI化，是当前大模型商业化落地的主流方向之一。当前，传统智能手机市场已陷入疲态，Counterpoint Research报告显示，2023年全球智能手机出货量降至十年来的低点，同比收缩5%。智能手机市场能否借助大模型实现产品迭代，形成新的增长曲线，尚待观望。但咨询机构IDC近日已给出预测，2024年全球市场AI手机的出货量将达到1.7亿部，约占智能手机整体出货量的15%；中国市场到2027年，AI手机有望达到1.5亿台，占智能手机市场份额超过50%。

那么，要成为生成式AI技术的载体，并形成可持续盈利的商业模式，现在的AI手机技术已经做到了哪些？又在哪些方面仍存较大差距？

如何定义一台“AI手机”？

2月20日的一场AI战略发布会上，OPPO首席产品官刘作虎率先给出了AI手机的特征解释。具体而言分为四项特征：要能高效地利用计算资源，以满足生成式AI的计算需要；要能敏锐地感知真实世界，了解用户与环境的复杂信息；拥有强大的自主学习能力；具备更充沛的创作能力，为用户提供持续的灵感与知识支持。

其中，为实现计算资源的高效利用，各家手机厂商投向大模型端侧化部署的路径。通俗来讲，就是将大模型直接内置在手机设备，而不是从云端调用服务，意味着即便断网也能使用本地化部署的大模型服务。

综合手机厂商以及受访分析师和行业人士的解释来看，端侧部署的原因包括：优化用户的使用体验、提供产品卖点和降低手机厂商的服务成本。

咨询机构Canalys研究分析师钟晓磊告诉《财经》，从用户层面讲，端侧大模型具有更强的隐私性以及实时性，能够在保证隐私的前提下进一步拓展应用场景，如实时翻译，断网状态下的语音助手等。

某些用户使用场景，也离不开端侧部署。2月20日OPPO AI战略发布会后接受群访时，刘作虎举例说，一般人用云相册的实际比例比较低，还是习惯把照片保留在手机本地，如果需要针对相册提供某些AI功能，无法强迫用户必须把相册传到云上才能体验，而只能做端侧部署。

从行业及厂商角度来看，钟晓磊分析说，端侧大模型对SoC（系统级芯片）性能、DRAM（一种存储芯片）等提出了更高的要求，目前市面上能满足该需求的机型供应较少，渗透率低且均价高，因而具有差异化的端侧大模型体验，有望加速整体换机周期。相比而言，与云端大模型相关的5G、WIFI-7等概念，目前看来能够提供的价值量增长空间仍不如前者。并且，大模型的端侧运行亦能帮助厂商节省运营成本。

“如果仅作云端部署，这个成本没有一家手机厂商能扛得住。”一位曾在华为和OPPO技术研发部门从业多年的行业人士向《财经》表示，大模型的推理面临成本压力，现在头部品牌都有几亿的用户，如果每天调用云端大模型十次，成本将不堪重负。据vivo副总裁周围公开披露的具体成本，目前调用一次云端大模型的平均成本在0.012-0.015元。如果以0.012元/次计算，一亿用户每天调用十次的成本高达1200万元。

端侧部署并不意味着不再需要云端大模型，按照手机厂商的思路，这只是一种分配计算资源的优化选择，必要时刻仍需云端的配合。

“参数小的'轻模型’和参数大的'重模型’的混搭，是非常常见的设计思路。”前述手机行业技术研发人士说，“轻模型”用于处理紧急、实时的一些需求，“重模型”用来查缺补漏。

钟晓磊介绍，模态单一、有一定隐私以及实时性需求的场景较多通过端侧AI实现，例如实时翻译、通话转录；而涉及到视频、图像等对算力要求较高的多模态场景，大多还是通过云端大模型去完成。但随着模型优化以及硬件算力的提升，有望在未来看到更多此类多模态场景在端侧运行。

手机端采用大模型“压缩版”

端侧部署的前提，是将“重模型”轻量化。钟晓磊说，由于手机算力等的限制，手机端侧大模型的参数规模最好控制在10B（100亿）以内，较为考验厂商如何在有限的参数规模下对模型进行调优，保证输出质量。

市场上新推出的AI手机，其端侧大模型参数多处在70亿的水平。例如，OPPO在1月8日发布的Find X7系列，荣耀1月11日发布的Magic6系列，以及vivo在2023年11月上线的X100系列，搭载的手机端模型均为70亿参数。

芯片厂商也抓住这轮AI手机热潮，改进手机芯片性能，为大模型本地化运行提供算力底座。

高通2023年10月发布的骁龙8 Gen3，和联发科同年10月面世的天玑9300，是目前市面上两款主流的支持生成式AI的移动端SoC芯片。最新AI手机纷纷配置了这些迭代的移动芯片完成大模型端侧落地，比如OPPO Find X7系列搭载联发科天玑9300，荣耀Magic6系列集成的则是高通骁龙8 Gen3。高通公司介绍，骁龙8 Gen3支持在终端设备上运行100亿参数的模型，并且针对70亿参数大模型，每秒能够生成20个token，上市初期支持20多种AI模型。

前述手机行业技术研发人士认为，芯片AI能力的加强后，大家对每秒10-20个token的推理速度是可以接受的，可以预计未来1-2年内，高通和联发科肯定会进一步加强各自移动芯片的AI推理能力，提升手机端侧大模型运转的算力条件。

除了“吃算力”，大模型端侧部署还“吃内存”。vivo副总裁黄韬在一场手机发布会上曾介绍，大模型对手机运行内存性能的要求，起码是8G起步。咨询机构IDC近日预测，16GB内存（RAM）对于新一代AI手机将属于最低要求。

距离“AI智能体”还有多远？

虽然OPPO CEO陈明永将AI手机视为与功能机、智能手机并列的第三个手机发展阶段，但就《财经》在各品牌门店对初代AI手机的使用体验而言，仍然只是附加了AI功能的智能手机，革命性的改变尚未来临。

各个厂商的AI手机，大多围绕图片优化、文本创作、知识问答等功能展开。以搭载荣耀“魔法大模型”的Magic6系列手机为例，用户可通过唤醒语音助手“YOYO助理”，体验相关AI功能。该款手机可以根据生成特定主题视频的prompt（提示），自动查找本地相册符合该主题的图像素材并生成对应视频；以及简单创作美食探店、小红书种草等场景下的文案等。OPPO Find X7系列手机，则主打“AI消除”，清除用户在照片圈选的对象，并自动修复清除后遗留的画面。

OPPO AI消除功能

OPPO AI中心产品总监张峻在2月20日接受群访时，用“高效、创作和专属”三个关键词概括了AI手机的应用场景，即提高用户手机体验的效率、进行多模态内容生成、利用用户画像和智能体记忆能力打造个性化的AI助理。

生成式AI落地应用层，目前仍少见跑通的标杆案例，充斥着不确定性。但手机厂商在受访时对手机这一成熟消费电子的前景具有十足把握，相当于在一个确定性的产品基础上试验不确定性的技术。

刘作虎称，往后虽然会诞生凭借听觉感官进行交互的创新产品，但视觉仍是人们获取信息的最主要渠道。基于这一底层逻辑，他认为理想的交互方式依旧依靠屏幕，“手机至少在10年之内肯定是一个人最不可离开的设备，它的形态有可能会发生一些变化，但不会发生根本性的变化。”

大模型和手机的结合，当前集中在功能应用和服务层面，前述手机行业技术研发人士认为，大模型并没有深入底层的安卓系统，对操作系统没有直接的交互，因此并没有改变使用不同应用服务仍需跳转到相应App的现状。该人士称，未来大模型肯定要做在系统层，如果操作系统和大模型能打通，那么大模型可以帮助用户直接操作不同应用程序，真正成为用户的生活助理。

“手机厂商不应仅仅是将AI作为简单的功能堆砌，而是要深入挖掘用户需求，将AI技术与操作系统、实际应用场景进行深度融合。”分析师Archie Zhang举例说，比如准确感知用户的意图，让用户可以一键或是一个指令即可得到想要的内容和功能。

早有互联网大厂的研发人员看到用AI Agent（智能体）自主操作App的潜力。2023年12月，腾讯的研发人员开发了一款AppAgent的产品，直接模拟人类的操作，与手机的图形用户界面（GUI）交互。2024年1月底，阿里的团队发布一篇论文，介绍了其研发的手机操纵智能体框架Mobile-Agent，可以根据用户指令自主完成刷视频点赞评论、在电商平台下单等任务。

Mobile-Agent自主留言评论

王君阳是Mobile-Agent的研发者之一，他告诉《财经》，与腾讯团队的AppAgent需要从安卓系统调用XML文件不同，Mobile-Agent无需权限去访问这种底层代码，而是利用视觉感知工具来准确识别和定位App前端界面中的视觉和文本元素，实现对App的自动规划操作。这类自动化操作的智能体，在完成机械性工作，以及面向老年人、残障人士群体，有不错的市场前景。

但王君阳介绍说，还没有把Mobile-Agent做成产品的想法，现在还难以克服安全性的问题，作为一个手机助手，智能体需要时刻关注屏幕上的内容，可能会看到用户手机界面一些敏感的信息。

将手机终端变成一个AI智能体，自然也被纳入到手机厂商的战略规划。按照刘作虎的说法，“每一个人都应该有一个超级助理，一站式地把所有需求搞定”。这背后还潜藏着手机厂商搅动现有超级App厂商地位的野心和利益冲突，“未来可以直接跟它（手机终端）对话，我为什么还要再进到一个所谓的超级App里面去？”刘作虎说。