分享

炸裂!AI重大突破!GPT4o大更新!传说的核弹“草莓”被泄露。

 王兆善 2024-08-19 发布于上海
炸裂!AI重大突破!GPT4o大更新!传说的核弹“草莓”被泄露。

When you purchase through links on our site, we may earn an affiliate commission, Here's how itworks.

Rumors are circulating that OpenAl is about to drop a new model this week andit could be our first sighting of the highly anticipated 'Project Strawberry' - areasoning-focused Al.

Trying, to follow artificial intelligence topics on social media over the past fewdays brought back memories of strawberry picking with my parents as a child.Every account has been dropping pictures ofthe fruit - including OpenAl CEOSam Altman.

炸裂!AI重大突破!GPT4o大更新!传说的核弹“草莓”被泄露。

OpenAl将于在本周推出一款新模型,这是Open AI首次让大家看到备受期待的“草莓计划”-一这个草莓计划款是专注于推理的人工智能。

01/

Open AI-草莓计划

“草莓项目是'Q大模型的前生”

1、草莓计划

“草莓计划”项目是OpenAI为了提升GPT大模型的的推理能力,在复杂科学和数学问题的能力得到了充分提升。主要是通过专门的“后训练”方法与借鉴类似STaR的技术,OpenAI希望在模型推理能力上的大幅度提升,然后推动大模型加上迭代。这个项目的核心在于让大模型不仅能够生成查询答案,还能进行提前规划,实现自主、可靠地浏览互联网进行“深度研究”的能力。

2、Open AI-“Q计划”是什么?

但是我看了国外很多媒体报道,说这次的“草莓”可能是一个代号,因为“草莓的”的前身是基于Q*算法模型,更准确地说是Q star项目,是OpenAI在大模型的突破性进展,我记得我之前有写过专栏解释Q计划的文章。它是基于Q学习算法打造的新模型,是通向AGI超级智能的重大突破。

它是采用了一种叫做“过程监督”的技术,将解决问题的过程分解成若干个步骤,从而提高算法的准确性和可靠性。它在解决复杂科学和数学问题的能力是非常强大的。大家都知道数学作为生成式AI发展的基础,掌握数学能力对于AI模型来说意味着更强的推理能力,这是目前大语言模型普遍缺乏的,也是OpenAI希望通过“草莓”项目来实现的突破。而且Q大模型能够理解和生成自然语言或代码的多模态语言模型,这对于GPT迭代更新确实是一个重大利好。

02/

Open AI-草莓计划关键部分

“后训练”

草莓”项目的一个关键组成部分是专门的“后训练”方法。这种方法在生成式AI模型已经通过大量数据集进行预训练的基础上,进一步调整模型以提高其在特定任务上的表现。几个关键步骤:微调、人类反馈强化学习、推理步骤的生成与筛选(类似于斯坦福大学开发的STaR)、反向推理机制、性能“磨炼”。例如STaR是允许AI模型通过反复创建自己的训练数据来“引导”自己进入更高的智能水平,理论上可以实现超越人类的智能。

OpenAI目前还公布了未来AI发展的五级路线图。大家可以看下图。这五级路线图包括从基础的语言理解和生成,到复杂的逻辑推理自主决策和创造性工作等多个方面的进展。

炸裂!AI重大突破!GPT4o大更新!传说的核弹“草莓”被泄露。

03/

Open AI-草莓计划推理能力有多强?

“接近人类”

大厂都普遍质疑LLM的推理能力。

现在谷歌与微软都在尝试不同方法想提高LLM语言大模型的推理能力。就连大佬图灵LeCun都坚决认为,LLM是不没有像人类一样的的推理能力,但是这项技术真的让Open AI做成了。你们说是不是不可思议。

推理能力超越人类

据多个消息源透露,“草莓”项目的推理能力已经超越人类水平,现在很多市场的声音,经常对大语言模型能否实现类人推理的能力表示怀疑。项目的前身Q*曾展示过解决前所未见数学问题的强大能力,这次又用“后训练的方法”在需要时主动获取整合信息,从而更全面地理解和解决问题。

炸裂!AI重大突破!GPT4o大更新!传说的核弹“草莓”被泄露。

“草莓”模型不仅能够生成用户查询的答案,还能够提前规划并自主可靠地在互联网上导航,以执行“深度研究”。这种能力使得模型能够像人类一样,更全面地理解和解决问题。这种自主性和规划能力对于AI在复杂任务中的应用具有重要意义。

技术方法的创新

后训练方法:“草莓”项目采用了专门的“后训练”方法,包括对基础模型的微调和人类反馈强化学习(RLHF)。这种方法上面已经解释过了。

自学推理方法:“草莓”项目可能与斯坦福大学提出的“自学推理者”(STaR)方法相似。STaR方法通过让模型自己生成推理步骤答案并筛选出正确的样本作为新的训练数据,从而不断提升模型的推理能力。这种方法是不依赖于大规模人工标注的数据集,而是通过自举的方式让模型自己学会推理。

炸裂!AI重大突破!GPT4o大更新!传说的核弹“草莓”被泄露。

这次Open AI“草莓”项目对于推理需求提升无疑是一个指数级增长的指引。未来大客户微软的用户一定会大幅度上升,Open AI现在的推理算力无疑是不够用的。

今天传出NV­I­D­IA的Bl­a­c­k­w­e­ll芯片问题已经彻底解决好,良率据说60%,但事实上这种大卡的良率普遍在30到40%,希望大家有自己的判断。10月左右就可以量产了,Q4月产量15万片。KY­EC已被要求按时扩大测试设备容量,所以整体来说是可以供应全球的算力需求,当然未来国产的“草莓”大模型也会横空出世。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多