AWS, 아마존 베드록 에이전트코어에 지식 확장 기능 추가
아마존웹서비스(AWS)는 AI 에이전트의 지식 접근 범위를 확장하고 프로덕션 환경에서의 지속적인 성능 개선을 지원하는 아마존 베드록 에이전트코어 신규 기능을 18일 발표했다.
오늘날 에이전트를 구동하는 모델은 복잡한 문제를 추론하고 다단계 워크플로를 계획하며 정교한 응답을 생성할 수 있을 만큼 뛰어난 역량을 갖췄다. 그러나 대다수 에이전트는 이 잠재력을 충분히 발휘하지 못하고 있다. 문제는 모델의 지능이 아니라, 필요한 맥락 정보와 피드백을 활용하지 못하는 데 있다.
AWS는 에이전트의 정보 접근 범위를 조직 내 지식 자산, 웹 정보, 유료 정보까지 확대하고, 운영 중 발생하는 문제를 탐지·진단하며, 에이전트 역량 확대에 맞춰 보안 통제도 강화하는 기능을 제공한다.
기업의 핵심 업무 데이터는 셰어포인트, 구글 드라이브, 컨플루언스, 아마존 S3, 사내 위키 등 다양한 시스템에 분산돼 있다. 기존에 이를 에이전트에 연결하려면 커스텀 수집 파이프라인 구축, 검색 튜닝, 데이터 최신성 유지 등 수개월의 엔지니어링 작업이 요구됐다.
‘아마존 베드록 관리형 지식 베이스’는 에이전트코어에 새롭게 통합돼 이 작업을 대체한다. 비정형 데이터 소스를 연결하면 벡터 스토어, 임베딩·재순위화 모델, 속도 제한 등 확장성 관련 인프라를 AWS가 직접 관리한다. 고객은 파이프라인 운영 부담 없이 에이전트 구축에 집중할 수 있다.
이 통합의 핵심 기능은 기존 검색증강생성(RAG) 방식을 넘어선 에이전트 기반 검색기(agentic retriever)다. 질의와 유사한 조각을 단순 매칭하는 대신, 지식 베이스 전반에 걸쳐 질의 수행 과정을 설계하고 문서 간 연관 개념을 연결하며 중간 결과를 평가해 재순위화한 뒤 답변을 생성한다. 복잡한 다단계 질의에서 에이전트 기반 검색은 기본 검색 대비 더 폭넓고 포괄적인 결과를 제공한다.
AWS는 AI 에이전트 개발자를 위한 신규 도구인 ‘웹 서치 온 에이전트코어’를 발표했다. 웹 서치 온 에이전트코어는 고객의 AWS 보안 환경 내에서 웹 정보를 제공한다.
웹 서치 온 에이전트코어는 아마존의 알렉사 플러스, 아마존 퀵 스위트, 키로 등을 구동하는 동일한 검색 인프라를 기반으로 한다. 에이전트 기반 검색에 최적화돼 적은 토큰으로도 많은 정보를 담은 핵심 발췌문을 제공하며, 공개 웹 정보와 아마존의 독자적인 지식 그래프를 결합하는 다중 소스 그라운딩(근거 기반) 방식을 적용했다. 지식 그래프는 구조화된 엔티티 데이터, 검증된 사실, 주가·스포츠 경기 결과 등 실시간 정보를 포함한다. 웹 서치 온 에이전트코어는 별도 벤더 온보딩이나 그에 따른 오케스트레이션·인증·결제 절차 없이 질의를 AWS 보안·컴플라이언스 범위 내에서 처리한다.
소니 그룹은 에이전트코어를 기반으로 사내 여러 사업부가 지식 어시스턴트부터 워크플로 자동화 에이전트까지 각자의 필요에 맞춰 AI 에이전트를 개발·공유·재사용할 수 있는 엔터프라이즈 AI 에이전트 플랫폼을 구축하고 있다
좋은 정보가 모두 무료는 아니다. 금융 시장 데이터, 유료 리서치, 독점 데이터셋, 프리미엄 API 등 에이전트가 유료 리소스에 접근하지 못하면 최적의 답변을 제공하지 못하게 되고 사용자는 무엇을 놓쳤는지 알 수 없다.
유료 콘텐츠 접근에 두 가지 요소가 필요하다. 에이전트는 결제 수단이 있어야 하고 제공자는 대가를 받을 방법이 있어야 한다. 지난달 프리뷰로 발표된 에이전트코어 페이먼트는 에이전트가 유료 서비스·콘텐츠를 발견하고 접근해 실행 루프 내에서 결제할 수 있도록 한다. 정식 출시된 AWS WAF AI 트래픽 수익화는 콘텐츠 소유자가 에이전트 접근을 차단·허용하거나 대가를 받을 수 있도록 한다. 두 기능이 동일한 플랫폼에서 작동하기 때문에, WAF를 사용하는 콘텐츠 제공자는 에이전트코어에서 인증된 에이전트를 별도 설정 없이 자동으로 신뢰할 수 있다.
에이전트에 더 나은 지식 접근권을 제공하는 것만으로는 충분하지 않다. 에이전트가 실제로 목표를 달성하고 있는지 파악하고, 문제 발생 시 이를 포착하는 것도 필요하다. 가장 위험한 에이전트 오류는 오류 신호 없이 발생하는 경우가 많아 대시보드만으로는 발견하기 어렵고, 수천 건의 세션에 영향을 준 뒤에야 고객 불만을 통해 드러난다.
AWS는 운영 트레이스를 분석해 에이전트를 지속적으로 개선할 수 있는 신규 최적화 기능을 발표했다. 프리뷰로 제공되는 에이전트코어 인사이트는 수백 건의 세션에 걸친 실패·의도·경로 분석을 통해 대시보드나 개별 트레이스 검토로는 드러나지 않는 패턴을 파악할 수 있게 한다. 실패 인사이트는 오류 신호를 남기지 않는 조용한 실패를 포함한 반복 실패 패턴을 탐지하고 근본 원인을 설명하며 영향 범위에 따라 우선순위를 제시한다. 의도 인사이트는 사용자의 실제 요청 의도를 기준으로 요청을 군집화하고, 경로 인사이트는 에이전트의 작업 수행 경로를 그룹화해 공통 패턴과 이례적 사례를 파악할 수 있게 한다.
정식 출시된 추천 기능과 A/B 테스트는 트레이스와 평가 결과를 분석해 시스템 프롬프트·도구 설명의 구체적인 개선안을 제시한다. 배치 평가는 정의된 테스트 데이터셋으로 해당 개선안을 검증해 종합 점수를 제공하며, 변경 사항이 프로덕션에 반영되기 전 성능 저하를 사전에 파악할 수 있다. A/B 테스트는 운영 트래픽을 분할해 에이전트 버전 간 통제된 비교를 수행한다. 이 기능들은 에이전트코어 런타임, AWS 람다, 아마존 EKS, AWS 외의 환경 등 에이전트 운영 환경에 관계없이 동일하게 작동한다.
후지소프트는 소프트웨어 개발과 운영을 가속화하기 위해 AI 에이전트를 구축하고 있다. 에이전트코어의 최적화 기능으로 운영 트레이스를 분석해 실패 패턴을 찾아내고 원인을 설명하며 영향도에 따라 순위를 매기고, 이를 바탕으로 프롬프트와 도구 설명에 대한 개선 권고를 받아 운영 트래픽에서 A/B 테스트한 뒤 적용했다.
에이전트의 역량이 커질수록 노출되는 영역도 늘어난다. 에이전트는 기존 소프트웨어와 달리 확률적으로 판단을 내리며, 이 판단은 컨텍스트에 영향을 받을 수 있다. 에이전트코어의 정책 기능은 게이트웨이 단계에서 에이전트가 도구·데이터로 할 수 있는 일과 할 수 없는 일을 정의하는 실시간 결정론적 통제를 이미 제공하고 있다.
AWS는 이번에 정식 출시된 베드록 가드레일 연동으로 이 기능을 확장했다. 베드록 가드레일 연동은 모든 에이전트 행동을 프롬프트 인젝션 시도, 유해 콘텐츠, 민감정보 노출 여부로 평가하며, 해당 점검은 에이전트 코드와 분리된 게이트웨이 계층에서 이뤄져 에이전트가 이를 인지하거나 우회할 수 없다.
AWS는 가드레일에 이어 체크포인트, 지스케일러, 루브릭, 넷스코프, 센티넬원 등 주요 보안 기업의 탐지 신호도 동일한 정책에 반영할 계획이다. 탐지는 확률적일 수 있지만, 정책 집행은 항상 정해진 기준에 따라 결정론적으로 이뤄진다는 원칙은 변함없다. 에이전트코어의 모든 도구와 컨텍스트 소스는 게이트웨이를 통해 연결되므로, 에이전트에 추가되는 모든 기능에는 동일한 보안 정책이 자동으로 적용된다.
AWS는 에이전트코어 하네스를 관리형 기능으로 정식 출시했다. 고객은 오케스트레이션 루프를 직접 코딩하는 대신, 모델·도구·스킬·지침을 설정으로 정의하면 에이전트코어가 루프를 구성·실행한다. 이 설정 하나로 독립 실행 환경의 에이전트를 몇 분 안에 확보할 수 있으며, 파일시스템·셸·세션 간 메모리·스킬·웹 브라우징이 기본 제공된다. 고객은 동일한 구성을 대규모 환경으로 손쉽게 확장할 수 있고, 커스텀 오케스트레이션이 필요한 경우 하네스를 코드로 내보내 동일 플랫폼에서 이어갈 수 있다.
AWS는 모델과 하네스를 분리해 설계했다. 이에 따라 고객은 원하는 모델을 선택하고 에이전트 로직을 수정하지 않고도 세션 중간에 모델을 전환할 수 있다. 하네스가 단일 플랫폼의 일부로 동작하기 때문에 보안 정책을 적용하는 동일한 게이트웨이로 도구에 접근하고 조직 지식·웹 검색·유료 서비스와 연결된다. 신원 관리, 메모리, 옵저버빌리티도 같은 플랫폼에서 제공돼 별도 연동 작업 없이 모든 에이전트 행동이 처음부터 거버넌스·추적 대상이 된다.
관리형 하네스, 아마존 베드록 관리형 지식 베이스, 웹 서치, 가드레일 연동, 추천·A/B 테스트 기능은 현재 정식 출시됐다. 인사이트와 페이먼트 기능은 프리뷰로 제공된다. 고객은 AWS 콘솔이나 에이전트코어 CLI에서 바로 이용할 수 있다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network



