在拉斯维加斯举办的年度re:Invent盛会上,亚马逊云科技(Amazon Web Services, AWS)震撼发布了其全面的生成式人工智能(AI)产品组合,这一系列举措无疑将在企业级AI应用领域掀起波澜。
生成式AI近年来在提升生产效率方面展现出了巨大潜力,迅速成为企业应用的热门领域。然而,企业在初步尝试这一技术后,如何确保员工在工作中持续使用,而非将其束之高阁,成为云计算巨头们亟待解决的关键问题。AWS,作为这一领域的领航者,在re:Invent大会上给出了自己的答案。
AWS在大会上推出了涵盖从底层算力芯片、模型训练和基础模型,到中层智能体开发,再到上层AI应用的全方位新产品。这些新产品旨在解决企业在引入生成式AI时面临的五大核心挑战:选择权、部署成本、模型训练效率、消除幻觉以及解决复杂任务的能力。
在谈及企业部署生成式AI时,AWS高管强调了“丰富的选择”对于客户的重要性。AWS不仅自主研发了Titan和Nova系列大模型,还投资了Anthropic等顶尖大模型开发商,为开发者提供了一个多样化的大模型选择平台。这一策略与微软云和谷歌云等倾向于依赖自家或顶尖合作伙伴的策略形成鲜明对比。
AWS进一步扩展了其大模型供应库,发布了自研大模型Amazon Nova,并与擅长视频生成和代码生成的大模型开发商达成合作。AWS推出了Amazon Bedrock Marketplace,提供了超过100个来自全球供应商的基础模型产品,用户可以在Bedrock上选择和测试这些新模型。
在计算成本方面,AWS正式推出了Amazon EC2 Trn2实例,相比GPU实例,性价比提升30%-40%。同时,AWS还剧透了下一代算力芯片Trainium 3,采用3nm先进制程工艺,提供两倍于Trainium 2的算力,以及40%的单位能效提升。AWS还推出了Prompt Caching技术,旨在减少AI应用在调用大模型时的计算开销、延迟和成本。
为了满足企业对敏捷、专业小模型的需求,AWS在Amazon Bedrock中推出了模型蒸馏功能。这一功能使得新模型的运行速度能够提升500%,成本降低75%,用户只需将应用示例发给Bedrock,即可完成所有剩余工作。AWS还加强了数据治理领域的产品线,包括新型数据管理工具Amazon S3 Tables和元数据工具Amazon S3 metaData,以及与Bedrock和SageMaker等开发系统的整合。
针对大模型的幻觉问题,AWS推出了自动推理检查功能,能够防止因模型幻觉而导致的事实性错误。这一功能基于可靠的数学验证,能够对模型所做出的事实陈述进行准确性检查,确保答案的准确无误。AWS还推出了多智能体协作功能,能够处理更复杂的工作流程,实现智能体之间的有效协作,提升工作效率。
AWS在re:Invent大会上发布的一系列新产品和技术,不仅展示了其在生成式AI领域的巨大资源投入和坚定战略意图,也为企业级市场的大规模部署提供了强有力的支持。这些新产品和技术将助力企业解决具体的业务需求和实际问题,推动生成式AI从早期试验阶段向产业落地转变。