엔비디아, AI 안전 위한 NIM 마이크로서비스 출시

엔비디아는 AI 가드레일을 위한 새로운 엔비디아 NIM 마이크로서비스를 출시했다고 17일 발표했다.

개발자는 새로운NIM 마이크로서비스를 사용해 더 안전하고 신뢰할 수 있는 AI 에이전트를 구축할 수 있다.

기업이 AI 에이전트를 개발하려면 신뢰, 안전, 보안, 규정 준수 등과 같은 중요한 문제를 해결해야 한다.

AI 가드레일을 위한 새로운 엔비디아 NIM 마이크로서비스는 소프트웨어 도구 모음인 엔비디아 네모 가드레일(NeMo Guardrail)의 일부다. 기업이 생성형 AI 애플리케이션의 안전성, 정확성, 확장성을 개선할 수 있도록 돕는 휴대용 최적화 추론 마이크로서비스다.

마이크로서비스 조정을 위한 핵심 요소는 엔비디아 네모 플랫폼의 일부인 네모 가드레일로, AI를 큐레이팅, 맞춤화, 가드레일링하는 데 도움을 준다. 네모 가드레일은 개발자가 거대 언어 모델(LLM) 애플리케이션에 AI 가드레일을 통합하고 관리할 수 있도록 지원한다.. 암독스, 세렌스 AI, 로우즈 등은 AI 애플리케이션을 보호하기 위해 네모 가드레일을 사용하고 있다.

개발자는 새로운 NIM 마이크로서비스를 사용해 보다 안전하고 신뢰할 수 있는 AI 에이전트를 구축할 수 있다. 컨텍스트별 가이드라인 내에서 안전하고 적절한 응답을 제공하고, 탈옥 시도에 대비해 강화될 수 있다. 이러한 에이전트는 자동차, 금융, 의료, 제조, 소매업 등 다양한 산업의 고객 서비스에 배치돼 고객 만족도와 신뢰도를 높일 수 있다.

새로운 마이크로서비스 중 하나는 콘텐츠 안전성을 조정하기 위해 이지스 콘텐츠 안전 데이터세트를 사용해 훈련됐다. 이 데이터세트는 해당 카테고리에서 가장 높은 품질의 인간 주석 데이터 소스 중 하나이다. 엔비디아가 큐레이팅하고 소유한 이 데이터세트는 허깅 페이스에서 공개적으로 사용할 수 있다. 그리고 이는 AI 안전과 시스템 제한을 우회하기 위한 탈옥 시도에 대해 플래그가 지정된 3만5000개 이상의 인간 주석 데이터 샘플이 포함된다.

AI는 다양한 비즈니스 프로세스에서 생산성을 빠르게 향상시키고 있다. 고객 서비스의 경우, 고객 문제 해결 속도를 최대 40%까지 향상시켜 준다. 고객 서비스와 기타 AI 에이전트를 위해 AI를 확장하려면 유해하거나 부적절한 결과를 방지하고 AI 애플리케이션이 정의된 매개변수 내에서 작동하도록 보장하는 안전한 모델이 필요하다.

엔비디아는 AI 에이전트가 대규모로 운영되면서도 제어된 행동을 유지할 수 있도록 돕는 네모 가드레일을 위한 새로운 NIM 마이크로서비스 세 가지를 소개했다.

콘텐츠 안전 NIM 마이크로서비스는 편향되거나 유해한 결과물이 생성되는 것을 방지해 AI가 윤리적 기준에 부합하는 응답을 할 수 있도록 한다. 주제 제어 NIM 마이크로서비스는 대화가 승인된 주제에 집중하도록 유지해, 주제가 벗어나는 내용이나 부적절한 콘텐츠를 피할 수 있도록 한다. 탈옥 탐지 NIM 마이크로서비스는 탈옥 시도에 대한 보호 기능을 추가해 대립적인 시나리오에서 AI무결성을 유지하는 데 도움이 된다.

개발자는 다양한 경량화된 전문 모델을 가드레일로 적용함으로써, 일반적인 글로벌 정책과 보호 기능만으로는 막을 수 없는 빈틈을 메울 수 있다. 모든 상황에 적용되는 단일 접근 방식으로는 복잡한 에이전틱AI 워크플로우를 적절하게 보호하고 제어할 수 없기 때문이다.

네모 가드레일 컬렉션에 있는 것과 같은 소형 언어 모델(sLM)은 지연 시간이 짧고, 리소스가 제한된 환경이나 분산된 환경에서도 효율적으로 실행되도록 설계됐다. 따라서 병원이나 창고와 같은 장소에서 의료, 자동차, 제조업과 같은 산업 분야의 AI 애플리케이션을 확장하는 데 이상적이다.

오픈 소스 커뮤니티에서 사용할 수 있는 네모 가드레일은 개발자가 레일(rail)이라고 불리는 여러 가지 AI 소프트웨어 정책을 조정해 LLM 애플리케이션의 보안과 제어를 강화할 수 있도록 돕는다. 이는 엔비디아 NIM 마이크로서비스와 함께 작동해 안전성이나 성능을 저해하지 않으면서도 대규모로 배포할 수 있는 AI시스템을 구축하기 위한 강력한 프레임워크를 제공한다.

엔비디아는 최근 NRF 전시회에서 소매 쇼핑 어시스턴트를 위한 엔비디아 AI 블루프린트가 네모 가드레일 마이크로서비스를 통합한다고 발표했다. 소매업에서 AI 애플리케이션 개발과 배포에 AI 안전 장치를 더욱 빠르게 도입하기 위해서다. 이를 통해 디지털 쇼핑 경험 중 더 안정적이고 제어된 고객 상호작용을 창출할 것이라고 밝혔다.

네모 가드레일은 개방적이고 확장 가능하며, 선도적인 AI 안전 모델과 가드레일 제공업체의 강력한 생태계와 통합할 수 있을 뿐 아니라, AI 가시성과 개발 도구와의 통합도 지원한다. 대화형 AI 애플리케이션에서 유해하거나 부적절한 콘텐츠를 필터링하고 가시성, 분석, 모니터링 기능을 제공하는 액티브펜스의 액티브스코어 통합도 지원한다.

하이브는 이미지, 비디오, 오디오 콘텐츠에 대한 AI 생성 콘텐츠 탐지 모델을 NIM 마이크로서비스로 제공한다. 이들은 네모 가드레일을 사용해 AI 애플리케이션에 쉽게 통합하고 조정할 수 있도록 지원한다.

피들러 AI 옵저버빌리티 플랫폼은 네모 가드레일과 쉽게 통합돼 AI 가드레일 모니터링 기능을 향상시킨다. 그리고 엔드투엔드 AI 개발자 플랫폼인 웨이츠앤바이어시스는 네모 가드레일 마이크로서비스와의 통합을 추가해 W&B 위브의 기능을 확장하고 있다. 이러한 개선은 생산 환경에서 최적화된 AI 추론을 위해 웨이츠 앤 바이어시스의 기존 NIM 통합 포트폴리오를 기반으로 한다.

보호 모델과 기타 레일의 적용 효과를 테스트할 준비가 된 개발자는 엔비디아 가락(Garak)을 사용할 수 있다. 이는 엔비디아 리서치 팀이 개발한 LLM과 애플리케이션 취약성 스캐닝을 위한 오픈 소스 툴킷이다.

개발자는 가락을 통해 데이터 유출, 프롬프트 인젝션, 코드 환각, 탈옥 시나리오와 같은 문제를 평가함으로써LLM을 사용하는 시스템의 취약점을 식별할 수 있다. 가락은 부적절하거나 잘못된 출력을 포함하는 테스트 케이스를 생성함으로써 개발자가 AI 모델의 잠재적 약점을 감지하고 해결해 AI 모델의 견고성과 안전성을 향상시킬 수 있도록 돕는다.

엔비디아 네모 가드레일 마이크로서비스와 레일 조정을 위한 네모 가드레일, 엔비디아 가락 툴킷이 이제 개발자와 기업에 제공된다. 개발자는 튜토리얼을 통해 네모 가드레일을 사용하고 고객 서비스를 위한 AI 에이전트에 AI 보호 장치를 구축할 수 있다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network