擢升AI代理可靠性英伟达推出容器化微干事Inference Microservices

发布日期：2025-02-22 06:07 点击次数：100

作家：赵雨荷

起原：硬AI

英伟达周四推出用于加快生成式AI模子的部署的容器化微干事Nvidia Inference Microservices（NIM），但愿匡助企业提高手工智能代理的信任、安全和可靠性。

英伟达在一篇博客中示意，东谈主工智能代理是一项正在马上发展的技巧，正平缓改动东谈主们与计较机互动的形状，但也伴跟着诸多枢纽问题。智能化 AI（Agentic AI）有望校正常识责任者的任务实际形状，以及客户与品牌“对话”的形状，但其背后的大型讲话模子仍可能出现不良反应，致使在坏心用户试图冲突戒备时激发安全问题。

英伟达示意，周四发布的骨子是基于其为建造者提供的保护框架NeMo Guardrails的膨胀，旨在提高生成式东谈主工智能应用的安全性、精准性和可膨胀性。NeMo Guardrails是英伟达NeMo平台的一部分，用于握住、定制和保护东谈主工智能，匡助建造者在大型讲话模子（LLM）应用中集成并握住AI戒备要领。目下Amdocs、Cerence AI和Lowe’s正在使用NeMo Guardrails来保护 AI 应用。

英伟达发布的NIM共有三种，离别涵盖主题范围、骨子安全和逃狱保护。该公司示意，这些微干事是经由高度优化的微型轻量级AI模子，可通过调控大型模子的反应擢升应用性能。

英伟达企业AI模子、软件与干事副总裁Kari Briski示意。

“其中一项用于调控骨子安全的新微干事，是基于Aegis骨子安全数据集考试的。这是同类数据集会质地最高、由东谈主工标注的数据源之一。”

Aegis骨子安全数据集由英伟达推出，包括逾越35,000个由东谈主工标注的样本，用于检测AI安全问题和试图绕过系统范围的逃狱行径。该数据集将在本年晚些时候于Hugging Face上公建造布。

举例，用于主题范围的NIM可精明AI代理“过于健谈”或偏离其正本的任务规划，确保其保合手在既定主题内。英伟达示意，与AI聊天机器东谈主进行的对话时分越长，它越容易健忘对话的初志，从而让话题偏离轨谈，类似于东谈主类对话可能的座谈。天然东谈主类不错采取这种情况，但关于聊天机器东谈主，尤其是品牌AI代理，偏离主题可能导致批驳到名东谈主或竞争家具，这对品牌不利。

Briski示意，

“像NeMo Guardrails系列中的微型讲话模子，具有较低的延伸，专为资源受限或分散式环境中的高效运行而联想，这使它们至极安妥在医疗、汽车、制造等行业的病院或仓库等场景中膨胀AI应用。”

此外，NIM允许建造者以最小的附加延伸类似多个戒备要领。英伟达示意，这对大多半生成式AI应用至关蹙迫，因为用户不可爱永劫分恭候，举例看到三点精通或转圈加载动画后才出现文本或语音。

英伟达示意，NIM微干事以及用于轨谈编排的NeMo Guardrails和NVIDIA Garak器具包，当今照旧面向建造者和企业绽放使用。建造者不错通过相干教程初始将AI戒备要领集成到客户干事的AI代理中，诈欺NeMo Guardrails构建安全的AI应用。

风险指示及免责条件市集有风险，投资需严慎。本文不组成个东谈主投资冷漠，也未计议到个别用户迥殊的投资规划、财务现象或需要。用户应试虑本文中的任何见识、不雅点或论断是否安妥其特定现象。据此投资，包袱欣忭。

热点资讯

擢升AI代理可靠性 英伟达推出容器化微干事Inference Microservices

擢升AI代理可靠性英伟达推出容器化微干事Inference Microservices