炸裂！AI重大突破！GPT4o大更新！传说的核弹“草莓”被泄露。

王兆善 2024-08-19 发布于上海

展开全文

When you purchase through links on our site, we may earn an affiliate commission, Here's how itworks.

Rumors are circulating that OpenAl is about to drop a new model this week andit could be our first sighting of the highly anticipated 'Project Strawberry' - areasoning-focused Al.

Trying, to follow artificial intelligence topics on social media over the past fewdays brought back memories of strawberry picking with my parents as a child.Every account has been dropping pictures ofthe fruit - including OpenAl CEOSam Altman.

OpenAl将于在本周推出一款新模型，这是Open AI首次让大家看到备受期待的“草莓计划”-一这个草莓计划款是专注于推理的人工智能。

01/

Open AI-草莓计划

“草莓项目是'Q大模型的前生”

1、草莓计划

“草莓计划”项目是OpenAI为了提升GPT大模型的的推理能力，在复杂科学和数学问题的能力得到了充分提升。主要是通过专门的“后训练”方法与借鉴类似STaR的技术，OpenAI希望在模型推理能力上的大幅度提升，然后推动大模型加上迭代。这个项目的核心在于让大模型不仅能够生成查询答案，还能进行提前规划，实现自主、可靠地浏览互联网进行“深度研究”的能力。

2、Open AI-“Q计划”是什么？

但是我看了国外很多媒体报道，说这次的“草莓”可能是一个代号，因为“草莓的”的前身是基于Q*算法模型，更准确地说是Q star项目，是OpenAI在大模型的突破性进展，我记得我之前有写过专栏解释Q计划的文章。它是基于Q学习算法打造的新模型，是通向AGI超级智能的重大突破。

它是采用了一种叫做“过程监督”的技术，将解决问题的过程分解成若干个步骤，从而提高算法的准确性和可靠性。它在解决复杂科学和数学问题的能力是非常强大的。大家都知道数学作为生成式AI发展的基础，掌握数学能力对于AI模型来说意味着更强的推理能力，这是目前大语言模型普遍缺乏的，也是OpenAI希望通过“草莓”项目来实现的突破。而且Q大模型能够理解和生成自然语言或代码的多模态语言模型，这对于GPT迭代更新确实是一个重大利好。

02/

Open AI-草莓计划关键部分

“后训练”

草莓”项目的一个关键组成部分是专门的“后训练”方法。这种方法在生成式AI模型已经通过大量数据集进行预训练的基础上，进一步调整模型以提高其在特定任务上的表现。几个关键步骤：微调、人类反馈强化学习、推理步骤的生成与筛选（类似于斯坦福大学开发的STaR）、反向推理机制、性能“磨炼”。例如STaR是允许AI模型通过反复创建自己的训练数据来“引导”自己进入更高的智能水平，理论上可以实现超越人类的智能。

OpenAI目前还公布了未来AI发展的五级路线图。大家可以看下图。这五级路线图包括从基础的语言理解和生成，到复杂的逻辑推理、自主决策和创造性工作等多个方面的进展。

03/

Open AI-草莓计划推理能力有多强？

“接近人类”

大厂都普遍质疑LLM的推理能力。

现在谷歌与微软都在尝试不同方法想提高LLM语言大模型的推理能力。就连大佬图灵LeCun都坚决认为，LLM是不没有像人类一样的的推理能力，但是这项技术真的让Open AI做成了。你们说是不是不可思议。

推理能力超越人类

据多个消息源透露，“草莓”项目的推理能力已经超越人类水平，现在很多市场的声音，经常对大语言模型能否实现类人推理的能力表示怀疑。项目的前身Q*曾展示过解决前所未见数学问题的强大能力，这次又用“后训练的方法”在需要时主动获取和整合信息，从而更全面地理解和解决问题。

“草莓”模型不仅能够生成用户查询的答案，还能够提前规划并自主可靠地在互联网上导航，以执行“深度研究”。这种能力使得模型能够像人类一样，更全面地理解和解决问题。这种自主性和规划能力对于AI在复杂任务中的应用具有重要意义。

技术方法的创新

后训练方法：“草莓”项目采用了专门的“后训练”方法，包括对基础模型的微调和人类反馈强化学习（RLHF）。这种方法上面已经解释过了。

自学推理方法：“草莓”项目可能与斯坦福大学提出的“自学推理者”（STaR）方法相似。STaR方法通过让模型自己生成推理步骤和答案，并筛选出正确的样本作为新的训练数据，从而不断提升模型的推理能力。这种方法是不依赖于大规模人工标注的数据集，而是通过自举的方式让模型自己学会推理。

这次Open AI“草莓”项目对于推理需求提升无疑是一个指数级增长的指引。未来大客户微软的用户一定会大幅度上升，Open AI现在的推理算力无疑是不够用的。

今天传出NVIDIA的Blackwell芯片问题已经彻底解决好，良率据说60%，但事实上这种大卡的良率普遍在30到40%，希望大家有自己的判断。10月左右就可以量产了，Q4月产量15万片。KYEC已被要求按时扩大测试设备容量，所以整体来说是可以供应全球的算力需求，当然未来国产的“草莓”大模型也会横空出世。