分享

盘古大模型介绍

 细雨青衫 2023-09-15

2023年7月7日,华为开发者大会发布盘古大模型3.0,盘古大模型采用L0、L1、L2三层“5 N X”架构。ØL0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0可以提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。 

图片

ØL1层是N个行业大模型,华为云提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上训练专有大模型。

图片

ØL2层提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,其华为云盘古气象大模型研究成果在《Nature》正刊发表。提供“开箱即用”的模型服务。 

图片

以下是华为盘古大模型不同领域不同场景下的应用:

Ø盘古采矿模型:盘古采矿模型已在中国8个煤矿得到应用。单个模型可以支持1000多个煤矿开采子场景,包括挖掘、驾驶、设备控制、运输、通风、洗煤等。它有助于建造更安全、更智能的煤矿。

Ø盘古铁路模型:铁路方面,盘古铁路模型可以准确识别67种货运车辆和430多种铁路以及鉴别货运车辆故障。盘古铁路模型可以快速扫描铁路TFDS系统捕获的数百万张图像,并过滤掉95%的无故障图像。通过这种方式,列车检查员可以专注于剩余的图像,这有助于他们提高效率和准确性。

Ø盘古气象模型:盘古气象模型(或盘古天气)是第一个在精度上超过最先进的数值天气预报(NWP)方法的人工智能模型。预测速度也快了几个数量级。过去,预测台风在10天内的轨迹需要在3000台服务器的高性能集群上进行4到5个小时的模拟。现在,盘古模型可以在单个服务器的单个GPU上在10秒内完成,并且结果更加准确。

Ø盘古金融模型:金融服务,盘古金融模型在包含银行政策、流程和案例研究数据的大型数据集上进行了预先训练,可以根据客户的服务请求自动为银行柜员生成正确的服务工作流程和指南。这有助于他们更有效、更自信地处理服务请求。从本质上讲,盘古金融模型为每个银行员工提供了自己的个人智能助手。

Ø盘古制造模型:制造业,在过去,为一条生产线制定一天的零件分配计划需要三个多小时。盘古制造模型经过华为自身生产线的零部件数据、业务流程和规则的预训练,能够准确理解意图。通过调用华为OptVerse AI Solver插件,盘古模型可以在1分钟内制定3天的生产计划。

Ø盘古药物分子模型:医药研发,开发一种新药平均需要10年时间,耗资10亿美元。现在,盘古药物分子模型能够将先导化合物的发现从几年缩短到一个月,将药物研发成本降低70%。利用这个模型,由西安交通大学刘冰教授领导的团队最近发现了一种新的超级抗生素——这是40年来发现的第一种新型抗生素,具有全新的蛋白质靶点,并且属于自己的一类。

盘古大模型采用完全的分层解耦设计,客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在L0和L1大模型的基础上,华为云提供了大模型行业开发套件,通过对需求方自有数据的二次训练,可以获取专属行业大模型。同时,根据不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

参考[1]盘古大模型官网。https://www./product/pangu.html[2]Bi, K., Xie, L., Zhang, H. et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533–538 (2023). https:///10.1038/s41586-023-06185-3

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多