漫话OpenAI（3）

来自：现代科普图书馆 > 馆藏分类

配色：

字号：大中小

漫话OpenAI（3）

2025-02-18 | 阅：转： | 分享

漫话OpenAI（3）

胡经国

（续前）

四、OpenAI价值理念

1、哲学思想

据认为，有效利他主义（Effective Altruism），最初是慈善领域的一个相对简单的想法：在最有效的地方捐款，而不是仅仅为了“温暖的光辉”而无效地捐款。

英国哲学教授威廉·麦克阿斯基尔（William MacAskill）是有效利他主义运动的创始人。鉴于以功利主义数学为基础，该运动开始吸引来自大型科技公司的支持者，他们开始进一步推动这一逻辑。当可以通过赚更多的钱来增加捐款数额时，为什么只关注捐赠的钱呢？这种逻辑表明，如果有能力，在对冲基金或大型科技公司工作并且进行捐赠，那么比为慈善机构工作更道德。逻辑进一步推演，将信奉有效利他主义的人指向两件事：星际定居（这样人类就可以在地球灭绝事件之后生存）和通用人工智能（AGI）——人工智能的超级智能版本；如果正确“对齐”，那么可以为人类谋福利，极大地提高人类生存的长度和质量。这就是OpenAI应该发挥作用的地方。

2、核心目的

资料显示，OpenAI成立之初是一个真正的非营利组织，其核心目的就是确保通用人工智能（AGI）安全引入。在其官网上都明确了OpenAI的目标是“确保人工智能造福全人类”。

3、核心理念

2020年，OpenAl提出核心理念——Scaling Law（缩放规律），即：大模型规模越大，其性能越好。

2018年6月，0penAl推出第一代大语言模型GPT1；其参数规模达到1.17亿，从总计4GB的书籍中训练得来。

2019年，OpenAl再次推出参数规模为上一代的12倍、文本规模是上一代的8倍多的GPT2模型；其在文本生成方面更加出色。

2020年6月推出的GPT-3，其参数规模达到1750亿，是GPT2模型的116倍，也是微软Turing-NLG模型的10倍，成为当时市面上最大的自然语言处理模型。

2024年年初爆火的Sora模型，再一次验证了Scaling Law的“大力出奇迹”的成功。

4、公司使命

据介绍，OpenAI的使命是确保人工智能（AGI）造福全人类。所谓AGI，是指在最具经济价值的工作中胜过人类的高度自主系统。这一使命体现在OpenAI公司章程中。

在产品讨论中有策略地使用了“在这些选项中，哪一个让我们感觉更接近AGI”这一短语，有助于决定打造什么、和因为使命而决定放弃。明确的重点永远是速度的驱动力。使命有助于保持专注，也为许多新想法铺平了道路。

5、企业文化

在企业文化塑造方面，OpenAI将AI安全作为企业文化的核心部分，并且在日常研发中贯彻这一理念。其通过与公众的沟通和交流，强化了社会对AI安全问题的认知和理解。

五、OpenAI主要产品

1、ChatGPT

⑴、产品定义

在英语短语“ChatGPT”中，GPT为Generative Pre-trained Transformer的缩写，直译为：“生成式预训练变换器”。

ChatGPT 是OpenAI于2022年11月30日发布的全新的“聊天机器人模型”；是OpenAI公司开发的一种“人工智能智能文本生成技术”，它可以模拟人类对话的方式，生成有逻辑、有思考、有趣味的文本。

⑵、基本原理

ChatGPT的基本原理是：通过深度学习算法，将大量的文本内容输入模型中进行训练，模型会自动学习语言的结构规律，从而可以生成高质量的文本。

⑶、产品定位

在GPT（生成式预训练变换器）出现之前，NLP模型主要是基于针对特定任务的大量“标注数据”进行训练。但是会存在以下一些限制：大规模高质量的“标注数据”不易获得；模型仅限于所接受的训练，泛化能力不足；无法执行“开箱即用”的任务，限制了模型的落地应用。

为了克服这些问题，OpenAI走上了“预训练大模型”的道路。从GPT-1到ChatGPT，就是一个“预训练模型”越来越大、效果越来越强的过程，不断迭代。

在OpenAI的官网上，ChatGPT被描述为“优化对话的语言模型”，是GPT-3.5架构的主力模型。GPT-3.5架构，基于OpenAI于2020年推出的GPT-3架构，即生成式语言模型的第3代。早在2020年6月，在训练大约2000亿个单词、“烧掉”几千万美元以后，史上最强大AI模型GPT-3“一炮而红”。

⑷、产品功能

作为聊天机器人，ChatGPT具有同类产品具备的一些特性，例如：对话能力，能够在同一个会话期间内回答上下文相关的后续问题；能写诗、撰文、编码、翻译、改错别字、计算机程序纠错等；可上传PDF、数据文档等多种类型文档；无需转换即可使用所有工具（如访问浏览、高级数据分析、DALL·E）。

2024年12月11日，OpenAI宣布，面向所有ChatGPT用户开放Canvas功能。

2024年12月18日（当地时间），OpenAI宣布，美国和加拿大用户可通过拨打1-800-ChatGPT（1-800-242-8478）与ChatGPT进行交谈，每月有15分钟的语音通话额度；其他国家的用户也可通过发送WhatsApp消息到同一号码，与ChatGPT进行对话。

⑸、应用范围

ChatGPT的应用范围非常广泛，可以用于智能客服、智能聊天机器人、自动化写作等方面；可以通过与用户的互动，根据用户的需求生成相应的文本，从而提升用户的体验感。

除此之外，ChatGPT还可以用于自动化写作，比如新闻报道、文学创作等方面，可以大大提高写作的效率和精度。

随着智能化的发展，ChatGPT技术将会在越来越多的领域发挥作用，成为自动化智能服务的重要支撑。

⑹、训练方式

根据OpenAI的官方文档，相比之前的GPT模型，OpenAI采用了全新的训练方式，即一种名为“从人类反馈中强化学习”（Reinforcement Learning from Human Feedback，RLHF）的训练方式，对ChatGPT进行了训练。

OpenAI让“人类训练师”扮演对话的双方提供对话作为学习资料。当人类扮演聊天机器人的时，OpenAI也会让模型生成一些建议来帮助人类训练师撰写自己的回复。也就是说，基于优秀的机器学习算法和强劲的算力，通过海量的数据训练，来让AI学会“思考”。

ChatGPT还采用了“注重道德水平”的训练方式；按照预先设计的道德准则，对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意，包括但是不限于暴力、歧视、犯罪等意图，它都会拒绝提供有效答案。

⑺、体验流程

ChatGPT的体验流程更方便，只要注册一个OpenAI账号就可以体验了。与早期的模型需要申请通过才能体验相比，ChatGPT影响的人群更广泛，讨论的人会更多。

⑻、局限性

ChatGPT有时会写出看似合理但是不正确或荒谬的答案。这是Open AI认为ChatGPT所面临的“限制”，并且解决这个问题被认为是具有挑战性的。其背后原因有三：首先，强化学习的信息源目前并未建立；其次，模型通过学习变得更加谨慎，会导致其回避原本能够正确回答的问题；另外，监督学习将会对模型造成误导，因为理想的答案应该来源于模型的认知，而非人工演示者的认知。

ChatGPT的能力获得是基于庞大的“语料库”，凝练了多领域问题的很多数据做相互校验，然后挑一些基础性的内容回答出来。这其实是“举一千反一”的过程，与人类举一反三的能力还相差较远。由于它不具备思考能力，因而犯错误不可避免；但是，通过人为的干预反馈，这些问题是可以被改进的。

⑼、市场运用

在首次亮相后的几个月里，ChatGPT已经成为一种全球现象。

在2022年12月，在OpenAI宣布已经有超过100万用户注册该服务几天以后，OpenAI总裁格雷格·布罗克曼在Twitter上说，该服务的用户已经达到200万。

根据Sensor Tower的数据，TikTok达到1亿用户用了9个月，而Instagram则花了2年半的时间。

ChatGPT的成功使OpenAI进入了硅谷实力派的行列。

2024年4月1日（当地时间），OpenAI宣布，允许用户直接使用ChatGPT，而无需注册该项服务。这让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感，并且获得问题的答案。

2、GPTs

GPTs，是OpenAI于2023年11月7日推出的一款重要产品。通过它用户将能够通过自定义指令、拓展（模型）的知识边界和下达行动命令，来构建自己的GPT，并且能够对外发布给全球更多的人使用。更重要的是，整个构建“自定义GPT”的过程，也是通过自然语言对话形成的。

3、Assistants API

Assistants API（“助理API”）是2023年11月7日在OpenAI首届开发者大会上，OpenAI推出的一种“专门构建的AI工具”，可利用“额外的知识”帮助开发者在自家应用程序中构建AI助手。

4、Sora

Sora，是OpenAI于2024年2月15日（当地时间）推出的，并且于2024年12月10日正式向用户开放的一款“人工智能视频生成模型”。该模型可以根据文字说明创建现实和想象的场景。Sora作为一款通用的视觉数据模型，其卓越之处在于：能够生成跨越不同持续时间、纵横比和分辨率的视频和图像，甚至包括生成长达1分钟的高清视频。Sora从文本到视频模式，旨在帮助人们解决需要现实世界互动的问题。

5、GPT-4o

GPT-4o是GPT系列的最新力作。GPT-4o（欧）的“o”源自拉丁语，意思是“全能”（字幕：omni，全能）。该产品是OpenAI推出的一款“人工智能模型”。GPT-4o模型“会听会看会说”，能够处理50种不同的语言，提高了速度和质量，并且能够读取人的情绪。

该公司CEO萨姆·奥尔特曼发推文表示，新的GPT-4o是OpenAI“有史以来最好的模型”。

6、Operator

当地时间2025年1月23日，OpenAI宣布上线名为Operator（直译：操作员）的首款“AI智能体”，它能通过网页执行各种任务。Operator可以像人类一样使用互联网执行各种任务，可以打开一个浏览器，点击页面的按钮并且打字输入内容。人类用户上网会做的那些事，比如预订机票、酒店订房、规划购物订单并且完成网购，都可以由Operator代劳。

（未完待续）

5

献花(0)

(本文系现代科普图...原创)

类似文章 更多

发表评论：