合适AI的云长什么样?天下云计较老年老给了一个谜底

合适AI的云长什么样?天下云计较老年老给了一个谜底

文|光锥智能 白 鸽

编|王一粟

“性价比、降老本、实用AI”。在亚马逊云科技2024年度re:Invent大会上,这些词成为了亚马逊云科技All in生成式AI的关节词。

现时,大模子行业合座的风向照旧发生升沉,从正本All in预训诫大模子,迟缓转为不停收缩预训诫限制,加快大模子的推理和应用。

有位业内东谈主士跟光锥智能示意:“异日天下梗概作念通用大模子预训诫的玩家不会特别50家。”

这也就意味着,越来越多的企业运转转型作念大模子的推理和应用落地,而这些玩家最典型的特征,即是会愈加详实干涉产出比,以及何如通过大模子为本身杀青降本增效。

但大模子的落地应用无疑将是一场漫长的干戈。就像亚马逊云科技新任 CEO Matt Garman所说:“东谈主工智能是一场莫得止境的竞赛,它将始终抓续下去。”

行为天下云计较厂商的老年老,生成式AI无疑是亚马逊云科技险阻错过的赛谈。

为怡悦更多大模子落地应用需求,在这场大会上,亚马逊云科技全见地展示了从计较、存储、数据库、推理、东谈主工智能、生成式AI应用等方面的体系化更新效果,并照旧构建了从底层AI芯片,到中间大模子平台,再到表层生成式AI应用的齐全AI本领栈和基础设施。

通过这次大会也梗概看出,从前年的相对低调,到本年年中的“转稳为攻”,再到年尾的“全面开战”,亚马逊云科技在生成式AI的这场“无穷”的干戈中,运转支棱起来了。

亚马逊首席履行官Andy Jassy在演讲中也明确了亚马逊云在生成式AI时期的发展旅途,“咱们一定会优先有计划那些实在对客户抨击的本领,专注为客户惩办本色的问题。”

也即是说,从确切客户需求动身,亚马逊云科技通过愚弄本身在基础设施、用具/模子和应用三层面的积蓄和实力,梗概给客户多提供了一个“快、好、省”的选项。而这无疑梗概让亚马逊云科技,再次坐稳云计较行业的“铁王座”。

全新一代芯片+训诫集群,让大模子训诫部署更具性价比

经济基础决定表层建筑,云计较的基础相似也决定了大模子发展的异日。

Andy Jassy示意:“当生成式AI应用达到一定例模时,计较老本将至关抨击。”但面前天下范围内,大大王人生成式AI应用王人主要依赖某一种芯片进行计较。

因此,行业但愿梗概领有具有更高性价比的惩办决议。

那么,东谈主工智能时期实在的的基础设施究竟是什么样的?亚马逊云科技高档副总裁Peter DeSantis建议构建东谈主工智能基础设施的两个基本撑抓:

构建更强的就业器;

构建更大限制、更高遵守的就业器集群;

而不管是就业器照旧就业器集群,王人离不开最基础的、高性能的GPU芯片。

Trainium是亚马逊云科技自研的AI芯片,2020 年头次推出,曾一度被认为是训诫AI模子最具遵守的芯片。在这次re:Invent大会上,亚马逊云科技秘书Trainium2芯片,以及由Trainium2 驱动的EC2实例雅致可用,并推出Trainium2 Server和Trainium2 UltraServer,这将使用户梗概以更高的性能和老本遵守训诫和部署东谈主工智能模子。

据先容,Amazon EC2 Trn2实例,集成了16个Trainium2芯片,由高带宽低蔓延的NeuronLink本领杀青互连,单节点提供20.8 pFLOPS FP8算力,相较GPU实例,Trn2实例的性价比高出30%至40%,专为生成式AI训诫和推理而构建。

在测试中,与其他云就业商的访佛产物比拟,使用Amazon Trn2 EC2实例的Llama 3.1 405B 模子token生成隐隐量提高了三倍以上。

面前,Adobe、Poolside、Databricks、Qualcomm等鼎新公司已大限制干涉使用Trainium2。

Matt现场还秘书将在2025年推出Trainium3芯片。Trainium3是亚马逊云科技基于3纳米先进工艺制造的首款芯片,是Trainium2性能的两倍,同期能效升迁40%。

但濒临大模子的训诫需求,单一芯片还远远不够。亚马逊云科技通过独特神经元连结本领NeuronLink,将64个Trainium2芯片合成了一个Ultra就业器。其计较容量是面前AI就业器的5倍。带宽亦然高达2TB每秒,但蔓延惟有1微秒。

Anthropic也秘书,下一代Claude模子将在包含数十万个Trainium2芯片的Project Rainier集群中进行训诫。

现时,除计较以外,影响大模子训诫和推理的,还有存储和数据库等软件系统。这次大会上,亚马逊云科技也同步更新了存储和数据库体系。

存储方面,亚马逊云科技全新发布Amazon S3 Tables,是专为Iceberg野心的全新式存储类别,以派遣快速增长的数据湖需求。

据先容,Amazon S3 Tables可提高悉数Iceberg表的性能和可膨大性。针对存储在S3中的Parquet文献类型,可取得3倍的查询性能及每秒事务量10倍升迁。这使得S3统统从头界说了面向数据湖的对象存储,提供更好的性能、老本和限制膨大智力。

而当达到PB或EB级别存储限制时,元数据(metadata)就变得相配抨击。元数据可匡助组织了解存储在S3中的对象的信息,从而找到所需的数据。

基于此,亚马逊云科技雅致发布Amazon S3 metadata就业,可自动从对象中索取元数据,并近及时地将其存储在新的S3Tables桶中(Iceberg表),以支抓后续使用分析用具进行元数据查询。当对象发生变化时,S3会自动在几分钟内更新相应的元数据。

这无疑惩办了大限制数据分析中的元数据管制挑战,让行业用户梗概高效发现和愚弄数据而无须从事换取性的基础设施构建责任。

在数据库方面,亚马逊云科技全新发布了Amazon Aurora DSQL,其具有免运维体验的散布式SQL数据库,可在天下范围内杀青跨区域部署,并无限膨大,具备99.999%的多区域高可用性及强数据一致性,同期兼顾低蔓延,是迄今为止最快的天下化部署的散布式SQL数据库,比Google Spanner快4倍。

同期,针对NoSQL数据库,亚马逊云科技也发布了Amazon DynamoDB global tables的多区域强一致性功能。至此,岂论客户需要SQL照旧NoSQL,亚马逊云科技王人不错提供在天下可快速膨大的高可用数据库,支抓数据强一致支抓,并具备极低的读写蔓延。

关于现阶段的云厂商们来说,比拟于AI大模子就业,算力无疑是最挣钱的一块业务。但面向异日,AI大模子的就业和应用,也将至关抨击。Jassy在10月份的财报追思时示意,本年,亚马逊的云计较业务增长态势明显,该公司的东谈主工智能就业照旧创造了数十亿好意思元的年化收入。

自研+集成百余款大模子!选用的职权,大于一切

“选用决定一切!用模子的时间,需要有好多可选的解放!”Andy Jassy在大会上如斯说谈。

一句话,就照旧标明了亚马逊云科技在大模子就业上的格调,亚马逊云科技通过集成更多的大模子产物,来让用户在选用大模子使用上不受限。而这一欺压,也源自于亚马逊云科技里面在作念AI应用落地的不雅察。

“咱们讶异的发现,即使在亚马逊里面,生成式AI应用的缔造过程中所使用的模子种类也相配各种化。”Andy Jassy说谈,“咱们一次又一次地学习到相似的训戒,那即是——始终不会有‘一统天地的用具’。正如数据库范围一样,咱们往时十年一直在照应,东谈主们使用的是多种联系型或非联系型数据库。”

然则,这并不料味着亚马逊云科技摈弃自研大模子产物。

在演讲中,Andy Jassy也提到,亚马逊云科技里面在缔造应用门径的过程中,里面缔造者向亚马逊的模子团队建议了各式需求,包括但愿模子有更低的蔓延和更低的老本;望梗概进行微调,以通过鲜艳样本进一步优化应用性能;需要更好的图像和视频处贤慧力等等。

这些需求相配庸俗,现如今的大模子厂商并不行统统怡悦这些需求。

因此,除集成大模子产物以外,亚马逊云科技也雅致发布自家新款“大模子全家桶”—Amazon Nova,涵盖文本对话、图片生成、视频生成,异日不仅要杀青Speech to Speech,更要Any-to-Any!

据先容,新发布的Amazon Nova基础模子共包括四大模子:

可用于省略任务的超高性价比翰墨处理Micro模子;

三种多模态模子——低老本的Lite模子;

兼具准确性、速率和老本的Pro模子;

用于复杂的推理任务同期也可进行蒸馏定制的Premier模子。

具体到功能方面,Nova模子支抓微调(Fine-tuning),蒸馏(Distillation)训诫更小的模子,让大模子的使用遵守升迁的情况下,还能缩短老本。同期,Nova模子与Amazon Bedrock常识库深度集成,可用于RAG,以根据我方的数据生成反应。性能层面,Amazon Nova模子与同类模子比拟,Nova在悉数基准测试中王人是十分或更好,极具竞争力。

现场,Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从收货中不丢丑出,其在检索增强生成(RAG)、函数调用和智能体应用方面具有较好的性能。

同期,亚马逊云科技还重磅推出两个全新模子:Amazon Nova Canvas高质料图像生成模子,Amazon Nova Reel高质料视频生成模子。其中,Amazon Nova Reel支抓生成六秒的视频,异日几个月将支抓生成两分钟视频。

在后续的产物目的中,Andy则示意,在2025年一季度摆布,亚马逊云科技将提供语音到语音的模子,允许输入语音,取得畅达的语音输出。在2025年年中摆布,将提供多模态输入到多模态输出的前沿模子,支抓文本、语音、图像及视频。

面前,亚马逊云科技自研的大模子产物照旧上架亚马逊云科技的“模子工场”Amazon Bedrock,而Premier版块则将于2025年第一季度推出。

除自研大模子以外,为了梗概让用户不受限,亚马逊云科技数据和东谈主工智能部门副总裁 Swami Sivasubramanian在大会上示意:“百款基础模子随性挑!亚马逊云科技秘书推出Amazon Bedrock Marketplace,用户不错收缩调用100多款最初的大模子。”

面前Amazon Bedrock还上新了包括poolside Assistant、Stable Diffusion 3.5、Luma AI等在内的大模子。

跟着大模子的加快落地应用,推理也将成为生成式AI责任流中的中枢。

Matt在大会上也示意:“推理在AI模子的应用中变得尤为抨击,尤其是在处理像大型言语模子等复杂模子时,推理条款极高的计较智力和低蔓延反应。”

而为了怡悦更多客户对大模子推理当用的需求,这次Amazon Bedrock也迎来多项智力的升级,使得用户不错通过Amazon Bedrock浅易探询Inferentia和Trainium芯片提供的推理的硬件优化资源。

比如模子蒸馏功能,其梗概升迁推理速率高达500%,老本缩短75%,用户只需提供应用示例教导,Amazon Bedrock会为用户自动完成蒸馏过程,最终取得一个定制的、具备专科常识、合理蔓延和合感性价比的蒸馏模子。

濒临企业级应用,为失足大模子幻觉问题,亚马逊云科技发布自动推理检查功能,有助于检测幻觉、提供可考据的左证诠释大型言语模子的准确性。

关于Agent智能体的应用,则发布Amazon Bedrock multi-agentcollaboration(多智能体合作),不错支抓复杂责任过程。在性能方面,Amazon Bedrock还推出了低蔓延优化推理,由此,用户不错在使用开端进的大模子基础上,还享受超卓的推感性能。

数据披露,面前每天王人独特万名客户使用Amazon Bedrock创建应用门径,比往时一年增长了5倍。而通过Amazon Bedrock,亚马逊云科技云就业也杀青既与多家模子提供商有着深厚的合作联系,同期也集成自研大模子产物,最终梗概为用户提供最庸俗、最优质的功能选用。

开箱即用的AI应用,加快大模子落地

有了底层算力基础设施的支抓,有了不错松弛选用的大模子平台用具,但思要实在缔造出一个优秀的生成式AI应用,却依然会存在相配多的勤劳。

不仅需要一个优秀的模子,在模子以外,还需要合适的需要合适的安全举止、畅达的言语抒发、细腻的用户界面(UI)以及合理的蔓延阐扬——用户不但愿体验到安靖或卡顿。还需要一个优化的老本结构。

在Andy Jassy看来,在很厚情况下,你会以为我方有了一个很好的模子,稍加缔栽植能构建出一个优秀的生成式AI应用。但事实是,你可能只完成了70%的责任。执行是,客户不会优容那些仍有30%问题的应用。

因此,思要实在缔造一款好用且优秀的AI应用,离不开云厂商们提供的梗概开箱即用的AI应用缔造平台用具。

亚马逊云科技的AI应用平台Amazon Q 为用户提供了丰富的AI应用用具。

其中,Amazon Q Developer,这次全新全新推出三个Agent,用于生成单位测试、文档和代码审查,不错匡助惩办这个缔造东谈主员端到端的开提问题。

Swami现场示意:“Amazon Q Developer登顶了SWE基准测试TOP1!收缩惩办55.8%的软件问题,德甲、好意思国航空、英国电信王人在使用。”

Amazon Q Business,不错强健为是亚马逊云科技为企业提供的数据勾通用具,梗概为企业数据创建了一个索引,勾通不同的业务系统、企业数据源,岂论这些数据源来自亚马逊云科技、第三方应用门径,悉数这些数据王人不错在安全和秘籍的前提下进行更好的搜索,并逾越各式数据库与悉数企业数据进行对话。

在Q Business之下,亚马逊这次发布了将QuickSight和Q Business的数据一聚集合的新功能,通过QuickSight和Q Business以及与之有关联的系统,举例Salesforce系统数据拉入QuickSight讲明快速得到愈加全面的QuickSight姿色板,使QuickSight行为BI用具变得愈加众多。

Amazon SageMaker由于被越来越多客户用来处理和准备他们的数据,用于机器学习的责任负载。因此,亚马逊云科技将其从头定位为就业数据、分析和东谈主工智能需求的中心。

全新发布的Amazon SageMakerUnified Studio,则不错提供整合的数据和东谈主工智能缔造环境,允许客户探询组织中的所独特据,并使用最合适的用具。它梗概将面前亚马逊云科技各式就业,包括Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中孤独的Studio,查询裁剪器,以及各式可视化用具等,整合到现有的Amazon SageMaker Studio中。

“Amazon SageMaker照旧成为所独特据分析和AI的一站式平台,分析责任化繁为简,从头界说了生成式AI的游戏轨则。”Swami如斯说谈。

面前,在天下范围内,各大企业王人但愿梗概通过生成式AI杀青降本增效。同期,各大天下企业巨头,在筹划生成式AI的同期,也会率先在我方里面业务场景中落地应用。

亚马逊里面相似如斯。基于生成式AI,亚马逊照旧将生成式AI落地到企业里面多个应用场景中,包括:Alexa 语音助手改换、电商告白创作、手掌支付、无东谈主值守零卖就业区和处方药阅读等。

而通过里面复杂数字生态场景所试真金不怕火出来的智力,在输出给亚马逊云科技的用户,无疑将梗概给用户带来更好的体验。

综上来看,这次亚马逊云科技的要点,则落在了大模子的推理和应用层面,正在全过程缩短生成式AI构建的门槛,以及推理和应用的老本。

比拟于OpenAI对AGI的追求,无疑亚马逊云科技更详实本色,而这背后,王人离不开其“一切从客户确切需求动身”的本领研发准则。






Powered by 数字视野网 @2013-2022 RSS地图 HTML地图