分享

打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT

 黄爸爸好 2023-06-27 发布于上海

微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5

12 小时前

IT之家 6 月 27 日消息,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。

微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5

微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5© 由 IT之家 提供

▲ 图源 Arxiv

IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。

微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5

微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5© 由 IT之家 提供

▲ 图源 Arxiv

微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5(47%)还要好。

微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5

微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5© 由 IT之家 提供

▲ 图源 Arxiv

微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多