分享

大模型新贵还是绕不过云计算大佬

 天承办公室 2024-04-26 发布于北京

图片

图片来源:unsplash

大模型改换云计算江湖?亚马逊云科技可没同意。

作者|张帅

编辑|刘湘明

本文首发于钛媒体APP

“AI or die”

图片

至少有那么一小段时间,云计算行业真的开始担心亚马逊云科技会落后。

彼时微软押中OpenAI,风光一时无两,激动人心的故事背后是一场豪赌,就连比尔·盖茨也曾警告萨提亚·纳德拉不要投资OpenAI,随后ChatGPT的现象级热度让一切质疑消弭于无形,OpenAI GPT和微软Azure的组合似乎稳赢。

图片

图片来源:unsplash

在“名不见经传”的OpenAI爆火之前,谷歌一直是人工智能领域技术的标杆,OpenAI也是站在谷歌的肩膀上才有所成就,比如Transformer架构最早由谷歌推出,涌现现象由谷歌研究员发现。如果AI是云服务未来最大的变量,那么谷歌云一定是最有力的竞争者,位次还要在微软Azure之前。

不得不向微软Azure和谷歌云脱帽致敬,他们加速了人工智能改变一切的节奏,也让云服务的焦点转向AI。这是一场“AI or die”的竞赛,云巨头不仅要具备AI能力,还要比直接竞争对手有更突出的差异化优势。

当外界普遍为亚马逊云科技担心时,Adam Selipsky显然不这么想,亚马逊云科技遍布全球的庞大基础设施和繁荣的合作伙伴生态,是其长久以来的领先壁垒,外界都在期待亚马逊云科技的新底牌。

那些认为微软Azure和谷歌云能够凭借大模型超过亚马逊云科技,或者说缩小与其差距的观点,也同时抱有另一种期待,即一旦亚马逊云科技将AI纳入其提供给客户的强大服务生态系统,亚马逊云科技失去的任何阵地都会很快被弥补回来。

这就是2023年4月Amazon Bedrock诞生时的背景。相比于微软和谷歌主推的OpenAI和Google PaLM,亚马逊云科技采取了不同的策略。

起初Amazon Bedrock主打多模型接入,亚马逊云科技的基础模型(Amazon Titan),和各种第三方模型(如AI21 Labs、Anthropic、Stability AI等),都可以通过API的方式接入。同时发布的还有代码生成器以及用于训练和推理的云上算力。

此后Amazon Bedrock不断更新,增加全新基础模型、基础模型供应商以及Agents功能,提供微调、知识库、代理、模型评估等各种丰富的功能,同时还能与亚马逊云科技其他工作负载无缝集成。

图片

图片来源:pixabay

总结来说就是三大方面,简化选择:多样化业界基础模型选择;简化定制:提供持续预训练,fine-tuning, RAG等方式;简化集成:Agent on Amazon Bedrock。

最新一次的重磅更新,亚马逊云科技数据和人工智能副总裁Swami Sivasubramanian形容其为“Significant new capabilities make it easier to use Amazon Bedrock to build and scale generative AI applications–and achieve impressive results”。

重大更新、更易使用、效果显著,成为Amazon Bedrock本次更新的关键词。

大模型向下看,仍旧是云平台

图片

Amazon Bedrock对外发布已有一年,过去一年,大模型依然在不断迭代,甚至迭代得有些过于快速,以至于企业客户不知道把应用做到什么程度,Amazon Bedrock给出的答案是,云厂商不只负责大模型,而是对最终的业务效果负责。

Swami Sivasubramanian表示,Amazon Bedrock聚焦于客户所需的关键领域,以适当的成本和速度构建可投入生产的企业级生成式AI 应用程序。

当所有人都在关注大模型的时候,更应该关注支撑大模型所必需的云服务,通过一系列的更新,Amazon Bedrock打造了一个端到端的、对客户业务效果负责的平台,也让业内再次把目光聚焦到亚马逊云科技。

首先,新增了Llama 3的Llama 3 8B和Llama 3 70B版本模型,目前最强的开源模型正式GA。Llama 3 8B擅长文本摘要、分类、情感分析和翻译,适合有限资源和边缘设备场景。Llama 3 70B在内容创建、对话式人工智能、语言理解、研发、企业、准确摘要、细致分类/情感分析、语言建模、对话系统、代码生成和指令跟踪方面表现出色。

同时Amazon Bedrock还预告了Amazon Titan Text Embeddings V2,Embeddings V2提供256、512和1024向量空间尺寸,优先考虑降低成本,同时保留RAG用例97%的准确性,性能优于其他领先模型。

以及即将支持Cohere的Command R和Command R+企业FM。Command R+是Cohere最强大的模型,针对长上下文任务进行了优化,而Command R则针对大规模生产工作负载进行了优化。

值得关注的是,Amazon Bedrock 的模型评估工具全面可用,能够根据特定应用场景的指标(如相关性、风格和品牌声音)对模型进行评估,为客户评估、比较和选择适合其应用程序的最佳模型,将评估模型的时间从几个星期缩短到几个小时,评估后还会提供评估报告,为更多模型使用者提供参考。

钛媒体App观察到,现阶段客户并不希望被一个模型绑定,基础模型在进化,应用场景也在调试,客户希望更多选择、更低成本、更易调试不同的模型,来测试自己的业务效果,模型评估工具就很有必要且应景。

另外还有非常实用的Amazon Titan图像生成器现已全面推出,客户可以利用自然语言实现低成本、大量高效地生成图像,并且每张图像都包含不可见水印,有助于降低知识产权风险。

其次,如何让企业更安全地定制模型,并将其集成到特定业务用例,Amazon Bedrock实现了自定义模型导入,客户现在可以导入和访问流行的开放模型架构(包括Flan-T5、Llama和Mistral)构建自定义模型,作为Amazon Bedrock中完全托管的应用程序编程接口 (API)。

如此,客户可以采用在Amazon SageMaker或其他工具上定制的模型,并将其轻松添加到Amazon Bedrock,并且经过自动验证后无缝访问其自定义模型,就像Amazon Bedrock提供的模型一样,效果和体验拉满,这也完全体现了Amazon Bedrock的开放性。

最后是安全,Amazon Bedrock的Guardrails现已全面上市,可帮助客户防止有害内容并管理应用程序内的敏感信息。客户能够定义内容策略、设置应用程序行为边界并实施针对潜在风险的保护措施。 据了解,与Amazon Bedrock上FM本身提供的保护相比,它可以帮助客户阻止多达85%的有害内容。 

GenAI,延续亚马逊云科技的第一性原理

图片

不得不说,轮到行业继续向亚马逊云科技脱帽致敬了,老大哥依旧是老大哥。

Amazon Bedrock仅用一年时间就扭转了风向,行业依然关注大模型本身的技术进步,但更关注大模型能不能为我所用,这涉及到庞大的基础设施、工程能力、生态系统等。

亚马逊云科技没有选择只做大模型,而是以另一种方式,也是他们所擅长的方式,将人工智能融入到原有的生态系统中,数以万计的客户正在使用Amazon Bedrock来构建和扩展大模型应用程序。

图片

亚马逊云科技就此构建了完备的生成式AI全栈布局,企业构建生成式AI 应用的三层架构,包括:用于基础模型训练和推理的基础设施、使用基础模型进行构建的工具、利用基础模型构建的开箱即用的应用程序。

在底层算力层,一方面,亚马逊云科技继续提供来自英伟达的计算实例,包括最新的NVIDIA Grace Blackwell GPU的Amazon EC2实例等;另一方面是亚马逊云科技自研芯片,包括推理芯片Inferentia和Trainium系列。 

图片

中间层是Amazon Bedrock以及各种附加功能。上层是包括Amazon Q在内的应用程序,Amazon Q可以连接到企业自己的数据、信息和系统,可以根据客户的业务定制Amazon Q,企业中的营销人员、项目经理以及销售代表等,都可以利用Q进行定制对话、解决问题、生成内容、采取行动等等,据悉,亚马逊云科技即将带来进一步的更新。

如果说大模型改变了云计算行业的游戏规则,那么如今行业人士会发现,亚马逊云科技制定的游戏规则,在更广泛的层面还在发挥着作用。

OpenAI GPT和Google PaLM足够引人注目,但同时也为微软Azure和谷歌云制造了新的竞争问题,市面上还有很多模型公司,Amazon Bedrock为这些模型公司建立了一个相同的起点,客户得以同等体验不同的模型。

在钛媒体App看来,亚马逊云科技不论是做云还是做生成式AI,其基本理念和逻辑如出一辙,所以亚马逊云科技不必摇摆去思考到底怎么做、做什么,而是直接按照第一性原理,做出最适合亚马逊云科技的Amazon Bedrock。

早年Andy Jassy做云计算的理念是——“将IT基础设施细分到最小单元,让程序员可以最大自由来选择与组合”,亚马逊云科技的确是这么做的,到了大模型依然如此。

翻阅Swami Sivasubramanian在Amazon Bedrock刚发布时的观点,“我们生活在一个机器学习非常激动人心的时代。我可能每年都这么说,但是今年它甚至更特别,因为这些大型语言模型和基础模型确实可以支持如此多的用例,在这些用例中,人们不必组建单独的团队来构建特定于任务的模型。机器学习模型开发的速度将真正提高。”

“但在未来几年里,除非我们让这些模型对每个人都更容易使用,否则你不会达到你想要的最终状态。这就是我们在SageMaker早期的机器学习中所做的,这也是我们在Bedrock及其所有应用程序中需要做的。”他说。

人工智能是比IT更复杂的技术堆栈,亚马逊云科技依旧兑现了此前的承诺,让企业内的任何开发人员都能够自由构建生成式AI应用,而无需关注复杂的机器学习或底层基础设施,也让人工智能成为到达云计算应许之地的关键一跃。

(本文首发于钛媒体App)



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章