分享

华为云派出200个博士,开辟了一个新战场

 中山春天奏鸣曲 2023-09-23


今年AI人工智能的火热程度,让所有企业都惊呼,再不上车就要被时代抛弃。不论国内外、不论什么行业,厂商们都纷纷尝试入局AI,几乎所有业务的创新“言必称AI,行必有大模型”。

在2016年,华为“心声社区”曾刊载任正非的一篇内部讲话稿,他将人工智能形容为做饭,“就像东北那个乱炖,管他什么都炖进去,不知道谁能炖出味道来。瞄准未来,生物学的萝卜拿来炖一下,牙医的萝卜拿来炖一下,还有好多学科的萝卜,要敞开一个很大的人才喇叭口。”

在任正非看来,华为所处ICT行业,但并不是一味地只招通信、计算机和软件人才,也要有懂医学、气象、煤矿、交通等各行各业的博士专家……

正如他曾讲过的那句名言,“桃子树上如何才能结出西瓜,你们要去好好思考。”

如今,华为的这一人才理念,终于让我们看到了任正非所描述的景象,即在华为云这颗“桃子树”上,结出了千行万业领域的“西瓜”:

在自动驾驶领域,盘古汽车大模型通过构建数字孪生空间,生成复杂场景样本,让自动驾驶学习新复杂场景的周期从两周以上缩短到2天内;在矿山领域,盘古矿山大模型全面覆盖采、掘、机、运、通、洗选等9大业务系统、21个场景,帮助煤矿每年多产8000吨精煤;在气象方面,不仅台风的风云变化可测,对于暴雨的降雨量预报精度还提升了20%以上……

在这些原来跟华为八杆子打不着的领域,层出不穷的专业创新成果,都有华为云参与其中。这些成果的背后,是华为人持之以恒攻坚克难、攀爬珠峰北坡的故事。

01

华为唯有坚持爬北坡

这几年,华为喜欢用一架二战时的飞机来比喻自己。这架被打得满身是洞、浑身弹痕累累的伊尔2轰炸机,在战斗后依然坚持飞行,安全返航。海报还经常配上一句话:

“没有伤痕累累,哪来皮糙肉厚,英雄自古多磨难”。

作为局外人,我们很难理解这种冰火两重天的冲击和落差。本以为即将迈过万亿营收大关准备举杯相庆的时刻,迎来的却是生死存亡的凶险,偌大一个华为命悬一线。5G设备、芯片、操作系统、各种开发工具、各条业务战线,都遭遇了纷至沓来的外部挑战。

华为一直是一个站着活的企业。其第一个动作就是“备胎”转正。消费者看到的是,华为将手机的安卓操作系统切换到自己开发的鸿蒙操作系统。在其背后,是华为用三年时间内完成13000+颗器件的替代开发、4000+电路板的反复换板开发,实现根技术突破。

说起根技术,除了芯片、操作系统等大众所熟知的,还有非常多不为人关注的关键技术。在过去几年,华为的研发团队就默默地攻坚克难“爬北坡”,解决了一系列难题:

1、用自己开发的GaussDB数据库,替代使用27年之久的Oracle数据库。

GaussDB是华为云全新研发的云原生分布式数据库,这一数据库的开发并不是近年才开始的,而是基于华为20余年的战略投入。GaussDB不仅全面替代了华为使用27年之久的Oracle数据库,还具备比Oracle更好的高可用、高性能、高弹性,双集群双活切换数据0丢失,故障恢复时间缩短10倍。GaussDB数据库,已在银行、保险、证券、能源等关键基础行业得到验证和广泛应用。

2、持续研发了78款软硬件开发工具,破解业务连续性卡脖子问题。

华为云软件开发工具开发团队自2018年就开始布局,努力打造软件从编码、编译、测试、安全、构建、发布到部署等全套工具链,很快突破根技术,引进新架构,解决整个软件开发领域的卡脖子难题。

在硬件开发工具上,联合20多家合作伙伴,发布了云原生的原理图工具、PCB版图工具、结构设计工具,让电子工业的硬件开发工具连续性得到有效保障。目前,每月有20多万软件开发人员、19.7万硬件开发人员在使用这些工具。

华为将开发工具的突破,形容为当年横在红军前进突破乌江天险,实现战略的“乌江突围”,打造出从矿石和沙子到产品的领先产品开发工具软件,彻底摆脱开发工具软件的外部依赖。

3、15小时完成全球88家子公司MetaERP大规模切换。

2019年“516”之后,华为开始启动ERP连续性变革项目。华为的业务场景极为复杂,需要面向不同的国家、不同的客户、不同的交易场景、不同的会计准则和税则差异,老ERP支撑了全球170+国家每年数千亿产值的销售、供应、采购、交付、财经等业务,支撑全球多样化业务正常开展,是华为MetaERP能不能成功的关键要素。

经过几年的努力,2021年9月首先在马来西亚试点成功,2022年7月在华为技术等核心子公司上线。2023年5月份进行首批大规模切换,涉及亚太、欧洲、中东中亚、南部非洲、拉美5个地区部、6个账务共享中心、75个国家,合计88家子公司,业务涵盖ICT、华为云、终端等多个产业。

在技术研发投入上,华为始终坚持着“爬北坡”的研发精神。十年研发投入近万亿,投入占比从13%提升到了25%,常年位居中国首位。

爬北坡,爬的是技术创新的珠峰之巅。解难题,解决的是业务发展的关键挑战。

02

一个没有硝烟的战场

2023年7月7日,华为云发布盘古大模型3.0。我们今天就以盘古大模型看华为如何攀爬另一座珠峰。

图片

有人惊呼,华为怎么也开始跟风了。跟ChatGPT等市面上的通用大模型相比,盘古大模型是一个TO B性质的大模型,跟C端几乎不产生关系,它解决的是行业生产经营中最难的业务问题。

华为在2021年4月就正式发布了盘古大模型(NLP大模型和CV大模型);2023年7月7日发布盘古大模型3.0。为什么我们在2023年7月这个时点才关注到华为的盘古大模型,是因为ChatGPT的发布引发了我们的好奇心,即对一切大模型开始感兴趣。但华为这个“理工男”既不宣传,也不争辩。

图片

盘古大模型3.0,是一个面向行业的大模型系列,包括5+N+X三层架构:L0提供5大基础模型,包括语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,提供满足行业场景中的多种技能;L1是基于基础大模型+行业知识,提供适配行业特征的N个行业大模型,包括政务、金融、制造、药物分子、矿山、轨道、气象等。L2提供X个场景模型服务,更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。

简单概括就是,基础大模型+行业大模型+场景。

图片

华为常务董事、华为云CEO张平安

也就是华为常务董事、华为云CEO张平安说的:不做诗,只做事。

ChatGPT能构建行业大模型吗?理论上当然可以。但“行业+场景”这两只脚要长出来,就不是对话、写诗、做图那么简单了。

有人将AI大模型技术比喻为计算机科学历史“三山叠峦” 的第三次浪潮,前两次是计算机的出现、互联网的兴起。其对各个国家的战略意义可见一斑。

AI大模型的背后是大算力、强算法、大数据。这是底座,是基础设施,是珠峰北坡,是长年累月的爬坡过程。

首先说说华为云如何通过系统架构创新、数据中心等基础设施建设、云服务开放让企业自建大模型变成可感知的现实。

大模型必然涉及到AI算力,AI算力对数据中心要求极高。华为预计,到2030年通用计算能力将增长10倍,AI计算能力将增长500倍。然而,由于AI服务器的功率密度远超通用服务器,单机柜功耗是传统机柜的6至8倍,并需专用液冷系统散热,且大模型训练需要百卡、千卡甚至万卡,服务器之间的互联、时延、可靠性、运维极为复杂,自建AI数据中心面临诸多挑战。

华为云不仅能提供足够的AI算力,能便捷到企业只需要就近接入华为云,即可随取随用云上AI算力,不用再费时费力自建或改造传统数据中心,数据安全方面也能得到足够的保障。同时,华为云AI云服务是开放的云服务,能适配业界主流的近一百个开源大模型,如LLAMA,Stable Diffusion等。

这一创新的昇腾AI云服务,在9月21日已经正式上线。

为了适配各行业需要,华为云今年继续加码,再派出200多个博士,双脚沾泥,走田头、跑工地、下矿井、进车间,因为大模型必须有切实的落地场景才能展现其真正的价值。有数据统计,华为云目前已经帮助超过1000家企业落地智能化创新项目。

在大模型解决千行万业难题的背后,他们是谁?

祝博士,美国密歇根州立统计学博士。负责盘古金融行业大模型产品和行业落地解决方案。

他说,如何通过大模型解决人力密集型场景如网点业务、坐席等问题?当评估网点问答效果和问题分析场景时,会涉及到大量的银行业务,银行术语。印象非常深刻的是,和银行领导交流时他表示,大模型对于效率提升比较突出,但是从企业的角度不希望员工被大模型取代,而应该是大模型带来新的机会,能够提升服务质量、提升员工工作效率、释放员工做更多高价值的事情。在某大型国有银行,大模型从2023年7月上线,陆续推广了300多个网点,调用次数1万3千多次,答案采纳率超过85%。大大解决了金融行业知识难,制度多,知识分散的问题,提高了运营的效率。法律部利用大模型辅助编写投诉报告,2周服务全行近8万笔,已触达1万多家机构、1.6万名员工,平均采纳率稳定在80%,节省时间12分钟。

金博士,中科院计算所博士。华为云人工智能算法专家。

他说,自动驾驶行业技术链条非常长,硬件层面包含车辆硬件、视觉和雷达等多传感器的选型、传感器的布局安装等;软件层面包含数据采集、数据清洗、数据标注、感知算法、定位算法、决策规划和执行控制等;每个模块都有对应的专业团队。初次进入自动驾驶行业,感受到的是这个行业技术体系的庞大。为了找到华为云盘古大模型和自动驾驶行业的切入点,深入传统车企、造车新势力、自动驾驶科技公司等不同类型行业客户一线,和客户内部数据、标注、算法等多个技术团队进行交流和请教,逐步梳理行业业务和技术痛点。影响高阶自动驾驶落地的关键因素不再是解决常见的一般案例,而是让模型快速学习各类不常见但不断出现的“长尾问题”。通过盘古大模型,自动扩充路采数据、并可控生成Corner case场景,显著提高数据闭环效率。华为云推出基于大模型的自动驾驶场景数据生成解决方案,支持位姿偏移自动修正,实现多旅程重建、并进一步仿真和生成新行驶轨迹数据;支持通过环拍数据进行3D物体重建、并将重建的交通参与者添加到原场景中。

乔博士,中国科学院博士。联合业内专家和医疗团队,以盘古药物分子大模型打造了制药行业的EDA软件:盘古辅助制药平台,为药物研发机构提供SaaS化软件服务。

他说,我从事医药行业,自己的背景也是医药行业出身,遇到的最难的问题是如何让医药行业的专家认可AI的价值,解决的方法是将AI技术进行更好的产品化。医学领域的知识体系繁多,应用复杂,数据难以获得,通用NLP大模型仅通过公开数据的学习能力非常有限。盘古医学大模型系统收集了大量的医学数据,并定义了大量的医学任务教会NLP大模型学习医学的知识和场景,从而能够更好的解决医学问题。最自豪的事情是将我们自己研发的盘古药物分子大模型用到药物研发项目上,在和西交大合作中,我们一起发现并命名了一类全新的抗生素,叫做肉桂酰菌素。

毕博士,清华大学钱班博士,2020年进入华为。

他说,2021年底,一次偶然的机会发现中期气象预报可能是AI很好的运用场景。但摆在我面前有三个问题:第一个问题是天量的数据,欧洲开放了2000TB的全球气象数据,但是对我们来说这个数据量太大了;第二个问题是不均匀的经纬度网格和扭曲的等压面。和其他AI任务不一样,气象预报的数据是经纬度网格分布的,在北极密集而在赤道上稀疏;第三个问题是不断累积的迭代误差。AI模型并没有闭环的数学形式,预测的系统误差会随着预测时间的增加而迅速增加。工作中遇到的最大困难,大概就是一直保持着“热情且连续的状态”,连续的意思是,思维、想法、愿景、目标都不中断,例如出差或者开会回来可能思维就不连续了;一组实验完全不符合预期,可能目标就中断了;一系列实验都不符合预期,可能愿景就改变了。

03

盘古大模型究竟能干嘛

大家还在关注ChatGPT、争论谁是中国的 OpenAI 时,盘古大模型针对铁路、汽车、医疗、数字人、软件研发、政务、矿山、气象等领域,解决了一些以前非常难以突破的难题,为千行万业真正创造价值。下面举些例子:

图片

在矿山领域,精煤产率是困扰业界多年的难题。山东能源集团把盘古矿山大模型全面应用到采、掘、机、运、通、洗选等9大业务系统、21个场景中,引入预测大模型能力用于煤矿洗选。在盘古的助力下,济宁二号煤矿每年能多产出8000吨精煤,精煤产率提升千分之二,增收约2000万元。目前,盘古矿山大模型在全国8个矿井已开始规模使用。

在政务领域,城市治理是一项复杂的系统工程,通常需协同超过40个业务部门、应对4000多个开放场景。通过感知网络,城市充电桩、环境检测、燃气表等上百种传感信号每天产生的海量数据可接入到盘古政务大模型。盘古通过NLP与CV的多模态融合训练,实现文本、视频、图像的动态解析和理解,分析现象并找到正确的责任部门,并生成专业的处理建议,将城市治理的效率提升50%以上,实现城市政务的升级与重塑。

图片

在汽车领域,自动驾驶训练难于遍历各种复杂场景。盘古汽车大模型通过构建数字孪生空间,生成复杂场景样本,让自动驾驶学习新复杂场景的周期从两周以上缩短到2天内。在商专车场景中,盘古可模拟矿区环境扬尘飞扬、上下长坡、大曲率转弯等场景并进行自动标注,4人月即可适配新的重卡车型。目前,新疆疆纳和内蒙古伊敏露天煤矿使用了华为商专车自动驾驶云服务,可实现60吨的重卡横向误差小于0.2米、精准停靠误差小于0.1米。

图片

在气象领域,暴雨预测是气象领域最难的工作之一,每年全球由于暴雨造成的经济损失高达数千亿元。华为云研发团队结合全球40年气象数据和10年卫星降水数据,通过3D EST-3地球空间网络训练优化,打造全新的具备降水预测能力的盘古气象大模型,可实现对未来6小时、24小时的短期和中期降水预报,模型的降雨量预报精度提升了20%以上。

图片

在医学领域,盘古医学大模型学习了1600万学术期刊等海量高质量数据和100多万结构化知识图谱,具备医学临床辅助能力,有效支撑医学检验、临床辅助诊疗、个人健康管理等场景AI应用,成为医生和患者有力的医学助手。在医学检验场景,医学检验场景病症复杂、指标众多、临床经验差异,容易造成疏漏。未来,基于盘古大模型研发的润达医疗大模型 · 良医小慧,将走进4000家医院,辅助医生进行报告解读和诊断,加速医疗普惠。

图片

在数字人领域,直播助农正在为乡村产业带来广阔的市场空间。盘古数字人大模型可快速地为人们打造自己的数字人,通过文本、语音驱动数字人准确流利地介绍产品,与观众实时互动。同时,只需用母语训练一次,即可使用20多国语言直播。盘古数字人大模型正加快农特产走出大山,让全世界了解中国的优质商品。

图片

在软件研发领域,全新升级的CodeArts Snap,加强了代码检视和代码优化能力,并接入到CodeArts软件开发生产线的全流程23个开发工具中。CodeArts Snap让研发整体效能提升30%,并让代码更符合编程规范和代码可信。同时,盘古研发大模型还接入到Astro低代码平台,覆盖了可视化大屏应用、工作流、复杂应用、智能助手等多种开发场景,帮助开发者实现一句对话轻松生成应用,全面重塑软件开发。

“把诗意留给诗人,把难题留给盘古。” 张平安在华为全联接大会2023主题演讲中说,盘古大模型一定会重塑千行万业,让每个行业、每家企业、每个人工作更高效、更轻松。

04

结   语

赛迪顾问数据显示,截至2023年7月,中国累计已经有130个大模型问世,大模型推动了新一轮人工智能的发展浪潮。在科技树的路口分野,AI大模型又开辟了一个新的赛道,也是一个新的战场。这一点,相比美国来说,中国并没有落后多少。

但我们必须看到,在最上层的大模型应用之下,是海量的稳定算力、大规模并行训练、以及整体的架构设计和硬件支持。各个环节的挑战相互影响、环环相扣,可以说,大模型及相关应用是迄今为止最复杂的软硬件系统工程。

任正非于今年2月在“难题揭榜”火花奖座谈会上预言说:“未来在AI大模型上会风起云涌,不只是微软一家。但人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进。”

在第四次工业革命,我们迎来的是大算力时代。

盘古大模型给出的答案是,没有风花雪月,只有珠峰北坡。解难题,做难事,行致远。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多