配色: 字号:
漫话OpenAI(3)
2025-02-18 | 阅:  转:  |  分享 
  
漫话OpenAI(3)

胡经国



(续前)

四、OpenAI价值理念

1、哲学思想

据认为,有效利他主义(Effective Altruism),最初是慈善领域的一个相对简单的想法:在最有效的地方捐款,而不是仅仅为了“温暖的光辉”而无效地捐款。

英国哲学教授威廉·麦克阿斯基尔(William MacAskill)是有效利他主义运动的创始人。鉴于以功利主义数学为基础,该运动开始吸引来自大型科技公司的支持者,他们开始进一步推动这一逻辑。当可以通过赚更多的钱来增加捐款数额时,为什么只关注捐赠的钱呢?这种逻辑表明,如果有能力,在对冲基金或大型科技公司工作并且进行捐赠,那么比为慈善机构工作更道德。逻辑进一步推演,将信奉有效利他主义的人指向两件事:星际定居(这样人类就可以在地球灭绝事件之后生存)和通用人工智能(AGI)——人工智能的超级智能版本;如果正确“对齐”,那么可以为人类谋福利,极大地提高人类生存的长度和质量。这就是OpenAI应该发挥作用的地方。

2、核心目的

资料显示,OpenAI成立之初是一个真正的非营利组织,其核心目的就是确保通用人工智能(AGI)安全引入。在其官网上都明确了OpenAI的目标是“确保人工智能造福全人类”。

3、核心理念

2020年,OpenAl提出核心理念——Scaling Law(缩放规律),即:大模型规模越大,其性能越好。

2018年6月,0penAl推出第一代大语言模型GPT1;其参数规模达到1.17亿,从总计4GB的书籍中训练得来。

2019年,OpenAl再次推出参数规模为上一代的12倍、文本规模是上一代的8倍多的GPT2模型;其在文本生成方面更加出色。

2020年6月推出的GPT-3,其参数规模达到1750亿,是GPT2模型的116倍,也是微软Turing-NLG模型的10倍,成为当时市面上最大的自然语言处理模型。

2024年年初爆火的Sora模型,再一次验证了Scaling Law的“大力出奇迹”的成功。

4、公司使命

据介绍,OpenAI的使命是确保人工智能(AGI)造福全人类。所谓AGI,是指在最具经济价值的工作中胜过人类的高度自主系统。这一使命体现在OpenAI公司章程中。

在产品讨论中有策略地使用了“在这些选项中,哪一个让我们感觉更接近AGI”这一短语,有助于决定打造什么、和因为使命而决定放弃。明确的重点永远是速度的驱动力。使命有助于保持专注,也为许多新想法铺平了道路。

5、企业文化

在企业文化塑造方面,OpenAI将AI安全作为企业文化的核心部分,并且在日常研发中贯彻这一理念。其通过与公众的沟通和交流,强化了社会对AI安全问题的认知和理解。

五、OpenAI主要产品

1、ChatGPT

⑴、产品定义

在英语短语“ChatGPT”中,GPT为Generative Pre-trained Transformer的缩写,直译为:“生成式预训练变换器”。

ChatGPT 是OpenAI于2022年11月30日发布的全新的“聊天机器人模型”;是OpenAI公司开发的一种“人工智能智能文本生成技术”,它可以模拟人类对话的方式,生成有逻辑、有思考、有趣味的文本。

⑵、基本原理

ChatGPT的基本原理是:通过深度学习算法,将大量的文本内容输入模型中进行训练,模型会自动学习语言的结构规律,从而可以生成高质量的文本。

⑶、产品定位

在GPT(生成式预训练变换器)出现之前,NLP模型主要是基于针对特定任务的大量“标注数据”进行训练。但是会存在以下一些限制:大规模高质量的“标注数据”不易获得;模型仅限于所接受的训练,泛化能力不足;无法执行“开箱即用”的任务,限制了模型的落地应用。

为了克服这些问题,OpenAI走上了“预训练大模型”的道路。从GPT-1到ChatGPT,就是一个“预训练模型”越来越大、效果越来越强的过程,不断迭代。

在OpenAI的官网上,ChatGPT被描述为“优化对话的语言模型”,是GPT-3.5架构的主力模型。GPT-3.5架构,基于OpenAI于2020年推出的GPT-3架构,即生成式语言模型的第3代。早在2020年6月,在训练大约2000亿个单词、“烧掉”几千万美元以后,史上最强大AI模型GPT-3“一炮而红”。

⑷、产品功能

作为聊天机器人,ChatGPT具有同类产品具备的一些特性,例如:对话能力,能够在同一个会话期间内回答上下文相关的后续问题;能写诗、撰文、编码、翻译、改错别字、计算机程序纠错等;可上传PDF、数据文档等多种类型文档;无需转换即可使用所有工具(如访问浏览、高级数据分析、DALL·E)。

2024年12月11日,OpenAI宣布,面向所有ChatGPT用户开放Canvas功能。

2024年12月18日(当地时间),OpenAI宣布,美国和加拿大用户可通过拨打1-800-ChatGPT(1-800-242-8478)与ChatGPT进行交谈,每月有15分钟的语音通话额度;其他国家的用户也可通过发送WhatsApp消息到同一号码,与ChatGPT进行对话。

⑸、应用范围

ChatGPT的应用范围非常广泛,可以用于智能客服、智能聊天机器人、自动化写作等方面;可以通过与用户的互动,根据用户的需求生成相应的文本,从而提升用户的体验感。

除此之外,ChatGPT还可以用于自动化写作,比如新闻报道、文学创作等方面,可以大大提高写作的效率和精度。

随着智能化的发展,ChatGPT技术将会在越来越多的领域发挥作用,成为自动化智能服务的重要支撑。

⑹、训练方式

根据OpenAI的官方文档,相比之前的GPT模型,OpenAI采用了全新的训练方式,即一种名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)的训练方式,对ChatGPT进行了训练。

OpenAI让“人类训练师”扮演对话的双方提供对话作为学习资料。当人类扮演聊天机器人的时,OpenAI也会让模型生成一些建议来帮助人类训练师撰写自己的回复。也就是说,基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让AI学会“思考”。

ChatGPT还采用了“注重道德水平”的训练方式;按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但是不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。

⑺、体验流程

ChatGPT的体验流程更方便,只要注册一个OpenAI账号就可以体验了。与早期的模型需要申请通过才能体验相比,ChatGPT影响的人群更广泛,讨论的人会更多。

⑻、局限性

ChatGPT有时会写出看似合理但是不正确或荒谬的答案。这是Open AI认为ChatGPT所面临的“限制”,并且解决这个问题被认为是具有挑战性的。其背后原因有三:首先,强化学习的信息源目前并未建立;其次,模型通过学习变得更加谨慎,会导致其回避原本能够正确回答的问题;另外,监督学习将会对模型造成误导,因为理想的答案应该来源于模型的认知,而非人工演示者的认知。

ChatGPT的能力获得是基于庞大的“语料库”,凝练了多领域问题的很多数据做相互校验,然后挑一些基础性的内容回答出来。这其实是“举一千反一”的过程,与人类举一反三的能力还相差较远。由于它不具备思考能力,因而犯错误不可避免;但是,通过人为的干预反馈,这些问题是可以被改进的。

⑼、市场运用

在首次亮相后的几个月里,ChatGPT已经成为一种全球现象。

在2022年12月,在OpenAI宣布已经有超过100万用户注册该服务几天以后,OpenAI总裁格雷格·布罗克曼在Twitter上说,该服务的用户已经达到200万。

根据Sensor Tower的数据,TikTok达到1亿用户用了9个月,而Instagram则花了2年半的时间。

ChatGPT的成功使OpenAI进入了硅谷实力派的行列。

2024年4月1日(当地时间),OpenAI宣布,允许用户直接使用ChatGPT,而无需注册该项服务。这让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感,并且获得问题的答案。

2、GPTs

GPTs,是OpenAI于2023年11月7日推出的一款重要产品。通过它用户将能够通过自定义指令、拓展(模型)的知识边界和下达行动命令,来构建自己的GPT,并且能够对外发布给全球更多的人使用。更重要的是,整个构建“自定义GPT”的过程,也是通过自然语言对话形成的。

3、Assistants API

Assistants API(“助理API”)是2023年11月7日在OpenAI首届开发者大会上,OpenAI推出的一种“专门构建的AI工具”,可利用“额外的知识”帮助开发者在自家应用程序中构建AI助手。

4、Sora

Sora,是OpenAI于2024年2月15日(当地时间)推出的,并且于2024年12月10日正式向用户开放的一款“人工智能视频生成模型”。该模型可以根据文字说明创建现实和想象的场景。Sora作为一款通用的视觉数据模型,其卓越之处在于:能够生成跨越不同持续时间、纵横比和分辨率的视频和图像,甚至包括生成长达1分钟的高清视频。Sora从文本到视频模式,旨在帮助人们解决需要现实世界互动的问题。

5、GPT-4o

GPT-4o是GPT系列的最新力作。GPT-4o(欧)的“o”源自拉丁语,意思是“全能”(字幕:omni,全能)。该产品是OpenAI推出的一款“人工智能模型”。GPT-4o模型“会听会看会说”,能够处理50种不同的语言,提高了速度和质量,并且能够读取人的情绪。

该公司CEO萨姆·奥尔特曼发推文表示,新的GPT-4o是OpenAI“有史以来最好的模型”。

6、Operator

当地时间2025年1月23日,OpenAI宣布上线名为Operator(直译:操作员)的首款“AI智能体”,它能通过网页执行各种任务。Operator可以像人类一样使用互联网执行各种任务,可以打开一个浏览器,点击页面的按钮并且打字输入内容。人类用户上网会做的那些事,比如预订机票、酒店订房、规划购物订单并且完成网购,都可以由Operator代劳。

(未完待续)







5







献花(0)
+1
(本文系现代科普图...原创)