Chat GPT APP 4.0堪比原子弹的更新

天承办公室 2023-10-10 发布于北京

展开全文

Chat GPT 4.0是一项革命性的AI技术，近几日，open AI解禁chat gpt4.0的多模态能力，引入了全新的图片识别和语音交互功能。从这时开始，chat gpt4.0获得了图片识别的能力，以及可以直接进行语言沟通。

图片识别：看见世界

Chat GPT 4.0 备卓越的图片识别能力，它能够识别你提供的图片，并理解其中的内容。无论是照片、插图还是图表，它都能为你提供详细的描述、分析和解释。你甚至可以上传一张墨镜图片让他为你提供可以和这个墨镜搭配的衣服图片。只需上传图片，Chat GPT 4.0就可以帮助你更深入地理解图像中的信息。

语音交互：自然而流畅

与Chat GPT 4.0对话不再局限于文字，你还可以通过语音与它进行互动。Chat GPT 4.0的语音交互功能可以听取你的声音，并提供语音回应。无论是提问、聊天还是获取信息，都能更加自然而流畅地进行，仿佛在与真人交谈一样。降低了学习成本，可以轻松上手。同时chat gpt提供5种不同的语音以供选择。

多元交互：文本、图像、语音全搞定

Chat GPT 4.0 的多元交互让你可以根据需要选择最适合的方式与它互动。无论你是倾向于文字输入、图片上传还是语音对话，它都能提供一致的智能反馈。这种全面性的交互方式让你能够更自由地与Chat GPT 4.0进行沟通，以满足不同情境下的需求。

Chat GPT 4.0 是一款集成了图片识别和语音交互的智能伙伴，它不仅能够理解你的文字，还能通过图片和声音更全面地了解你的需求。无论是在学习、工作、娱乐还是解决问题，它都将为你提供无与伦比的支持和便利。Chat GPT 4.0，交互的未来，已经来临。

现在 OpenAI 把多模态端上来，对用户自然是好的，我们能用到更强的模型、更好的功能，同时其实也以为着，OpenAI 觉得自己已经在某种程度上解决了多模态模型的安全性问题，可以推出使用了。

更重要的是算力问题，要知道即便是只开放给 Plus 用户使用，多模态消耗的算力也是远超纯文本信息的。之前一直说 OpenAI 算力紧张，不知道现在拿出多模态是否也是算力充足，不会影响 GPT-5 和 toB 企业用户的一种表现。（也要结合 DALLE-3 的新闻看，同时支持图像生成和图像识别，加量不加价，Plus 这下香爆了啊）

不过话说回来，之前很早微软的 NewBing 就支持了图像的生成和识别，之后应该也会继续支持，只是不知道背后的模型会不会是 GPT-4V。

至于多模态的用途，要随着大家的探索和想象，进一步挖掘了，已经看到了很多想象力和 idea，就等着正式上线进行测试了。

另外，根据 Logan 的回复，GPT-4V 有可能会提供 API 调用，那样的话甚至能为开发者提供多模态的开发能力，可玩性就更多更强了…可以瞬间包装出很多 App…