“OSI 7 레이어는 시대에 뒤떨어졌다”
[인터뷰] 비조이 판데이 시스코 아웃시프트 수석부사장
“전통적인 OSI 7계층 스택은 시대에 뒤떨어졌고, 레이어8과 레이어9을 새로 추가해야 한다. 기존 스택은 머신을 연결하고 데이터를 통신하는 역할만 가져 해석하지 않고 이해하지 않기 때문에 AI 에이전트를 인지하고, 상호 간 추론 상태 정보를 교환할 수 있는 프로토콜이 필요하다.”
비조이 판데이 시스코 아웃시프트 수석부사장은 최근 한국기자단과 인터뷰에서 AI 에이전트 시대를 위한 새로운 네트워크 개념인 ‘인지 인터넷(Internet of Cognition)’을 설명하며 이같이 밝혔다.
비조이 판데이 부사장은 “그동안의 컴퓨팅은 동일 입력에 동일 출력을 보장하는 결정론적 컴퓨팅 기반이라면, 에이전틱 AI와 양자컴퓨팅 같은 새로운 트렌드는 질문에 100%라 할 수 없는 최선의 답변을 내놓는 확률론적 컴퓨팅으로 패러다임을 바꾸고 있다”며 “확률적 패러다임으로 컴퓨팅이 바뀌면 인프라도 변해야 하고, 에이전틱 AI 시대를 뒷받침할 인프라를 구축해야 한다”고 강조했다.
오늘날 생성형 AI를 구현하는 대형언어모델(LLM)과 그를 바탕으로 작동하는 AI 에이전트는 각기 높은 성능을 자랑하지만, 여전히 고립돼 있다. 네트워크로 연결돼 있다고 하지만, 각자의 상태를 공유하진 못한다. 시스코 등이 제안하는 ‘인지 인터넷’은 멀티 에이전트를 서로 연결할 뿐 아니라, 여러 AI 에이전트가 팀으로 협업할수 있는 환경이다. 비조이 판데이 수석부사장은 공저자로 참여한 작년 11월 ‘에이전트 인터넷을 위한 계층형 프로토콜 아키텍처’란 논문에서 ‘에이전트 인터넷(IoA)’이란 새로운 통신 스택을 제안했다.
이 논문은 AI 에이전트 간 협업 시스템을 위한 새로운 네트워크 스택을 구상한다. 그동안 LLM은 API, 도구 인터페이스 등을 통해 도메인특화언어(DSL)를 학습하고, 예비 연산과 도구 호출을 통해 행동하는 AI 에이전트를 만들 수 있게 됐지만, 메모리와 계산 용량 제한이란 한계를 갖고 있다. AI 에이전트가 더 복잡한 문제를 해결하려면 컨텍스트 윈도우의 제한을 돌파해 여러 에이전트의 컴퓨팅 시스템을 공유하며 협업해야 한다는 게 골자다. 그를 위해 에이전트 개체 간 연산을 분산하고, 에이전트 작업을 확장하는 신규 계층을 추가하자는 것이다.
비조이 판데이 부사장은 “네트워크에서 일어나는 일에 대한 심층 이해가 필요하고, 에이전트가 집단적으로 상태 정보를 교환해야 한다”며 “패브릭 레이어 관점에서 수많은 인텔리전스 엔드포인트를 연결하고, 제도적 지식을 축적할 수 있는 메모리와 지식 패브릭 레이어가 필요해졌다”고 말했다.
현재의 네트워크 아키텍처 스택(OSI 및 TCP/IP)은 호스트와 프로세스 간의 데이터 전송을 위해 설계됐다. 기존의 OSI 7계층 모델은 엔드포인트 간의 확정적 상태를 동기화하지만, 인지 상태를 동기화하지 못한다. 이는 ‘인지 루프’의 한계를 발생시키며, 에이전트들이 서로의 요구 사항(목표와 의도)을 추측하고 공통의 결과를 도출하기 위해 어떻게 협력해야 할지 고심하게 만든다. 이는 속도를 느리게 하고, 비용을 늘리는 반복적 대화다.
시스코는 에이전트 협업을 위해 에이전트 통신 계층(L8)과 에이전트 의미론 계층(L9)이라는 두 가지 새로운 계층을 제안한다. L8 계층은 MCP와 같은 프로토콜을 기반으로 메시지 봉투, 화행 수행어(요청, 정보 제공), 상호작용 패턴(요청-응답, 발행-구독) 등을 표준화해 통신 구조를 형식화한다. L9 계층은 ▲의미적 맥락 발견 및 협상을 형식화하고 ▲용어를 의미적 맥락에 연결해 의미적 기반을 제공하며 ▲들어오는 프롬프트를 의미적으로 검증하고 필요에 따라 모호성을 해소한다. L9는 조정 및 합의를 위한 기본 요소를 도입해 에이전트들이 공유 상태, 공동 목표, 분산된 신념에 대한 합의를 달성할 수 있도록 한다.
그는 기존의 인터넷을 4가지 축으로 설명했다. 첫째는 어디로 갈지 탐색하고 연결하는 디스커버리로 URL에 적절한 IP 주소를 매핑하는 DNS고, 둘째는 URL을 통한 서비스 호출에 권한을 가진 사용자인지 확인하는 아이덴티티이며, 세번째는 인터넷 엔드포인트 간 통신 표준을 규정한 프로토콜이고, 마지막은 인터넷 기능의 구동을 모니터하고 확인하는 텔레메트리와 옵저버빌리티다.
그는 “인지 인터넷 시대에서 네 축 모두 변화가 필요한데, 기존 DNS는 URL과 IP 매핑만할 뿐 에이전트와 상관없기에 에이전트의 역량을 기반으로 탐색하고 식별할 수 있어야 한다”며 “가령 금융 모델 에이전트라면 탐색이나 그 과정에서 해당 에이전트의 평판, 관련성에 따라 탐색할 새 디스커버리가 필요하다”고 설명했다.
이어 “기존 아이덴티티가 역할 기반 접근제어(RBAC)라면, 에이전트의 경우 그 태스크를 기반으로 접근을 제어하고 권한을 부여하는 과정이 필요하다”며 “기존의 프로토콜은 머신 간 통신이고, 새로운 프로토콜은 에이전트 간 통신을 규정해 AWS, 앤트로픽, 오픈AI, 구글 등 각각에 배포된 서로 다른 모델 기반의 에이전트가 서로 통신할 수 있게 해야 한다”고 밝혔다.
그는 “에이전트가 공통의 과제를 두고 협업하기 위해 서로 각자가 이런 추론을 하고 있다는 상태 정보를 공유해야 한다”며 “데이터를 넘어 상태 정보 교환을 가능하게 하는 새 프로토콜 설계가 필요한 상황”이라고 덧붙였다.
AI 에이전트는 각자의 기반 모델을 바탕에 두고 움직이지만, 장거리 네트워크로 연결됐을 때 각자의 자원을 공유하지 않는다. 각자는 높은 연산력과 매개변수를 가졌지만, 다른 공간의 에이전트에게 쓸 수 없는 자원이다. 각각의 특화 에이전트마다 전문성을 갖지만 시간 순서대로 작업 흐름에 따라 업무를 배분할 뿐 근본적인 협력은 불가능하다.
판데이 부사장은 “인간 개인이 언어의 탄생과 함께 집단으로 협력해 뛰어난 집단 지성을 만들어갔듯 AI 에이전트도 이와 유사하게 협업하며 집단 지능을 구축해야 더 뛰어난 결과를 만들 수 있다”고 말했다.

레이어8(에이전트 통신 계층)은 대화 구조를 처리한다. A2A, MCP 등의 프로토콜을 포함하며, REQUEST나 INFORM과 같은 ‘언어 행위’를 표준화해 에이전트가 작업을 요청받았는지 아니면 단순히 업데이트를 받았는지 알 수 있도록 한다.
레이어9(에이전트 의미 계층)은 작업 실행 전에 검증 가능하고 공유된 진실을 확립하도록 설계됐다. 레이어9는 현재 프로토콜에 부족한 ‘의미론적 악수(semantic handshake)’를 제공한다. 에이전트들은 공유된 컨텍스트를 확정하기 위해 상호 작용을 수행한다. 이를 통해 원시 데이터는 기계가 읽을 수 있는 형식적인 정의와 연결돼 관련된 모든 에이전트에게 동일한 의미를 갖도록 보장한다. 레이어9은 에이전트들이 집단적 합의에 도달할 수 있도록 기본적인 요소들을 제공한다. 대표적인 예로 리플 효과 프로토콜(REP)은 에이전트 집단 간의 조정을 촉진해, 에이전트들이 규모 확장에 따라 시스템 상태에 대한 일관된 입장을 유지하도록 보장한다. 레이어9은 형식적인 의미 체계를 통한 의미 교환, 저대역폭 환경을 위한 압축된 상태, ‘두뇌 대 두뇌’ 조정을 위한 직접적인 잠재 공간 임베딩까지 가능하다.
시스코는 델테크놀로지스, 구글클라우드, 오라클, 레드햇 등과 함께 서로 다른 프레임워크와 벤더에서 제작된 AI 에이전트들이 제약 없이 소통하고 협업할 수 있도록 돕는 ‘에이전트용 인터넷(IoA)’ 인프라를 구축하는 오픈 소스 프로젝트 ‘AGNTCY.ORG’에 참여중이다. 리눅스재단 산하의 이 오픈소스 프로젝트는 멀티 에이전트 시스템(MAS)의 표준을 만들고 있다. 레이어8과 레이어9을 구체화하는 작업이 여기서 진행된다.
AGNTCY.ORG 프로젝트는 4개의 워킹 그룹을 운영하며 AGNTCY 프레임워크를 구축하고있다. 에이전트를 위한 ▲탐색 ▲식별 ▲메시징 ▲옵저버빌리티 등이다. 에이전트 탐색을 위해 에이전트 디스커버리 디렉토리를 개발하고, OASF(Open Agent Schema Framework)를 활용해 모든 에이전트가 다른 에이전트의 기능을 검색하고 이해할 수 있도록 한다.
에이전트 식별은 암호학적으로 검증 가능한 신원 및 접근 제어를 제공해 조직 경계를 넘어 에이전트가 안전하게 작동할 수 있도록 한다. 에이전트 메시징은 SLIM(Secure Low-latency Interactive Messaging)을 통해 멀티모달, 휴먼인더루프, 양자 컴퓨팅 환경에서도 안전한 통신을 지원한다. 에이전트 옵저버빌리티는 벤더 및 프레임워크에 관계없이 복잡한 멀티 에이전트 워크플로우를 평가하고 디버깅하는 데 도움이 되는 엔드투엔드 관찰 도구를 제공한다. A2A 에이전트와 MCP 서버는 AGNTCY 디렉터리를 통해 검색하고 AGNTCY 관찰 도구를 사용해 모니터링할 수 있다.

시스코는 이 가운데 AI 인프라를 위한 전체 스택을 구축하고 있다. AI 학습 및 추론을 위한 GPU 네트워킹을 지원하는데, 랙 내 연결을 위한 스케일업 외에 랙 간 연결을 위한 스케일아웃, 데이터센터 간 연결을 위한 스케일어크로스 등에 대해 제품을 개발, 출시중이다.
에이전트 탐색은 웹엑스에 내장해 에이전틱 디스커버리 플랫폼으로 웹엑스를 사용할 수 있도록 했고, AI 인프라를 에이전트로 관리하는 AI 캔버스를 출시했으며, 에이전트의 신원 확인과 접근 제어를 시스코 듀오로 수행할 수 있도록 태스크 및 과제 기반 접근제어로 진화시키고 있다. 세부적인 에이전트 옵저버빌리티는 스플렁크를 고도화해 지원한다.
그는 “시스코는 에이전틱 AI와 미래의 양자컴퓨팅에 대비해 수직적 시스템 증축뿐 아니라, 수평적 스케일아웃을 해야 한다고 본다”며 “시스코는 스택 전반에 걸쳐 다양한 구성 요소를 제공하고, 각 구성요소의 연결뿐 아니라 보안과 옵저버빌리티 같은 추가 레이어도 내재화해 분산형 인프라를 제공할 수 있다”고 강조했다.

한편, 그는 양자컴퓨팅의 상용화 시점인 ‘큐데이(Q-DAY)’ 후 현존하는 암호화체계가 붕괴될 수 있으므로 양자내성암호(PQC)를 당장 도입해야 한다고 밝혔다. 그리고 PQC와 함께 양자 네트워킹을 위한 기술에도 투자하고 있다고 강조했다.
그는 “현재의 RSA 암호화는 양자컴퓨팅 상용화 시점에 해독 가능한데, RSA 해독에 필요한 큐비트 수는 빠르게 줄어들고, 양자컴퓨팅의 규모도 급속도로 커지고 있다”며 “현재 최대 1000큐비트의 양자컴퓨터는 양자 네트워킹으로 1만큐비트 이상으로 확장될 수 있다”고 말했다.
그는 “이런 미래에 대비하는 PQC를 도입한 새 소프트웨어 구조를 가져야 하며, 양자 네트워킹으로 연결되는 수많은 양자컴퓨터로부터 조직의 데이터를 보호해야 한다”고 밝혔다.
그는 “양자 네트워킹은 현재 프로토타입과 연구 단계에 있고, 얼마전 뉴욕시에서 상용 광섬유 네트워크를 사용해 17.6킬로미터에 걸친 양자 네트워크를 실증 시연했다”며 “앞으로 2, 3년 간 연구해 상용화할 것”이라고 덧붙였다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network



