[까다로운 IT] 챗 GPT보다 더 중요한 AI, AI 에이전트
여러분, 여러분은 현재 어떤 AI가 가장 중요하다고 생각하시나요? 애플 인텔리전스? 갤럭시 AI? 챗 GPT? 아닙니다. AI 에이전트.
에이전트하면 여러분 무슨 단어가 떠오르십니까? 저는 비밀요원, 킹스맨, 실드 이런 게 떠오르는데요. 정확한 의미는 대리인, 대행자 이런 겁니다. 예를 들어 변호사를 법률 대리인이라고 부르죠. 우리가 소송을 해야할 때 전문적인 지식이 없으니까 전문가인 대리인에게 맡기는 겁니다. 그 대리인을 에이전트라고 부르죠. 다른 것도 똑같습니다. 킹스맨, 실드 이런 데서 활동하는 에이전트는 국민이나 단체를 대신해서 비밀 업무를 수행하는 사람들을 말하죠. 그런데 AI가 대리인이라니 무슨 소릴까요.
3년 전 챗GPT가 처음 나왔을 때 저는 이런 생각을 했습니다. 쟤가 이제 검색도 대신해 주고 시말서도 대신 써주고, 국밥도 끓여주고, 이럴 줄 알았는데요. 결과는 아니었죠. 현재 전 세계에서 가장 바쁜 거짓말쟁이로 활동 중입니다. 이걸 환각, 할루시네이션이라고 그러는데요. 진실 검증보다는 자연스러운 대화에 더 초점을 맞춰서 개발됐기 때문입니다.
AI 에이전트는 이 챗봇의 다음 단계를 말합니다. 사람의 명령이 떨어지면 문서를 뒤지고, CRM 뒤지고, 캘린더에 일정 잡아주고 이런 걸 다 할 수 있는 거예요. 심지어 조금 더 나아가서 사람이 해야 하는 일을 알려주면 명령 없이도 일하고 있는 상태를 만들 수 있죠. 우리 소송 때 변호사한테 어떠어떠한 증거가 있는데 이게 무슨 법률 위반이니까 이렇게 처리해 주세요-라고 말하지 않잖아요. 그건 챗GPT 수준이고요. 우리의 에이전트는 증거를 가져다주면 무슨 법에 위반됐는지 알아서 밝혀내죠. 그것이 바로 AI 에이전트, 에이전틱 AI입니다.
실제로 이거 비슷한 게 최근에 공개됐어요. 챗GPT와 호각을 이루는 앤스로픽의 클로드에서 비슷한 기능을 선보였죠. 이름은 컴퓨터 유즈입니다. AI가 내 컴퓨터 좀 쓰겠다 이런 거죠.
클로드 3.5 소넷에서는 컴퓨터 유즈 기능으로 이런 명령이 가능해요. 이 액셀 파일에서 어떤 회사 정보를 찾아봐. 그럼 AI는 이렇게 대답합니다. “없네요. CRM으로 이동해서 찾아보겠습니다.” 그리고 기다리면 “CRM엔 있네요. 양식을 작성해 보겠습니다.”
자, 어떻습니까? 챗봇보다 훨씬 능동적이죠. 아직까지는 끊김 없는 대화가 가능한 건 아니지만 기능이 계속 업데이트되면 진짜 비서처럼 활동하는 게 가능하겠죠.
원리는 생각보다 간단합니다. AI가 저한테 권리를 얻어서 제 컴퓨터의 스크린샷을 계속 찍습니다. 그리고 이 스크린샷을 비전 AI로 분석해요. 여기에 무슨 정보 있고 여기에 엑셀 어떤 값 있고 이런 걸 순간적으로 판단합니다. 없으면 마우스로 넘겨서 또 스크린샷을 찍어서 또 분석해요. 이렇게 정보를 스크린샷으로 판단해서 그다음은 원래의 챗봇들처럼 AI로 문서작성해 주고, 코드 작성해 주고, 심지어 사이트를 만들고 퍼블리싱하는 역할까지 해줄 수 있습니다.
이렇게 하면 우리가 반복하는 작업들, 짜증나는 작업, 문서에서 뭐 찾고 또 찾고 분류하고 다시 그걸 문서로 만들고 이런 과정에서 벗어날 수 있겠죠.
사실 AI 도입 전에도 자동화, 오토메이션이라고 해서 반복작업을 줄여주는 기능이 있었어요. 여기에 생성형 AI, LLM, 비전 AI 이런 걸 다 합쳐버리니까 컴퓨터 유즈 같은 AI 에이전트 초기 단계가 등장한 겁니다.
그런데 클로드는 왜 굳이 스크린샷을 찍어서 화면을 분석하는 걸까요? 여러 이유가 있는데 아직까지는 완벽하게 보안을 책임질 수 없는 이유가 큰 걸로 보입니다. 예를 들어서 AI가 컴퓨터를 계속해서 들여다본다? 그런데 이 AI를 누가 해킹해요. 그럼 제 컴퓨터는 다 털리는 겁니다. 스크린샷으로 조작하면 적어도 중간에 큰 피해는 막을 수 있겠죠. 클로드 개발사 앤스로픽이 아직까지는 우리는 책임지기 싫다-이런 의미로 보이네요.
클로드 3.5 소넷의 AI 에이전트는 아직까지 초창기입니다. 왜냐면 명령을 줘야 하기 때문이죠. 만약 기능이 꾸준하게 발전해서 나중에는 명령 안 해도 작업을 자기 스스로 하게 되고, 이전 작업들의 패턴을 기억한다면? 실제 사람과 유사한 작업을 사람보다 더 빠르게 할 수 있겠죠.
현재 앤스로픽 외 다른 회사들도 AI 에이전트를 활발하게 공개하고 있는데요. 마이크로소프트도 기업용 서비스인 다이내믹 365에서 AI 에이전트 10종을 공개했죠. 거의 기업용이라 아직은 일반 사무직들이 쓰기엔 애매한데 점차 소비자 레벨로 내려올 겁니다. MS AI 에이전트 특징은 이거예요. Microsoft 365 Graph, Dataverse, Fabric 같은 다양한 데이터 소스 사용할 수 있고요. MS가 가진 많은 소프트웨어들 있죠. 이걸 유기적으로 연동되게 만들 수 있습니다.
그리고 코파일럿 스튜디오라는 게 있어요. 이건 아까 말했던 오토메이션처럼 내가 아무것도 안해도 넌 이런 거 하고 있어라-하는 저한테 딱 맞는 AI 에이전트를 만들 수 있는 겁니다. 오토메이션 도구는 기존에도 있었는데 여기에 LLM을 좀 추가한 거죠.
다른 기업들도 AI 에이전트, 만들고 있습니다. 특히 우리가 가장 원하는 AI 에이전트, 물론 시리와 빅스비에서겠지만 다른 걸 하나만 꼽으라면요? 챗GPT죠.
챗GPT 개발사 오픈 AI도 ‘오퍼레이터’ 코드명으로 AI 에이전트를 개발 중입니다. 2025년 1월에 프리뷰 빛 개발자 도구를 출시한다고 하고요. 기능에 대해서는 아직 구체적으로 밝혀진 바는 없는데요. 오픈 AI의 강점은 연동성이죠. 예를 들어서 챗GPT는 아이폰에 통합되잖아요. 그럼 시리를 활용해서 AI 에이전트를 활용할 수도 있겠고요. 기본적으로 가장 많은 서비스와 연동되는 LLM이기 때문에 더 많은 업무용 도구나 데이터 소스, 개발 툴킷 같은 걸 사용할 수 있게 되지 않을까-라는 예상을 해봅니다.
궁극적으로는 스마트폰에 AI 에이전트를 탑재하면 좋겠죠. 업무 자료를 스마트폰에 저장해 놓고 명령만 내리면 정말로 이제는 스마트폰 하나에서 업무, 여가, 예약 같은 걸 다 처리할 수 있을 겁니다.
여러분이 처음에 꿈꿨던 AI는 어떤 모습인가요? 대부분 업무를 척척해 주고 밥도 먹여주고 잠도 재워주고 사만다처럼 사랑도 해 주고 이런 모습 아닐까요? 사만다 하나로만 예를 들어도 사만다가 테어도르의 DB나 컴퓨터를 뒤져서 뭘 찾아주고 일도 해 주고 사랑도 해 주고 이러잖아요. 딱 그 정도가 되는 시점이 AI 에이전트가 활성화되는 시기가 아닐까 싶습니다.
이렇게 AI가 업무를 다 해버리면 우린 뭘 하게 될까요? 제 생각에는 업무를 어떻게 추진하고 정확하게 명령하고 하는 역량이 현재에 비해서는 중요해지지 않을까 싶습니다.
컴퓨터 유즈와 오퍼레이터, MS의 코파일럿 스튜디오 같은 기능을, 아직 완전히 출시는 안 됐습니다. 출시 시점에 저한테 꼭 맞는 AI 종철 에이전트를 만들어서 대본도 써보고 합성도 해보고 하면서 여러 리뷰 여러분께 들려드리도록 하겠습니다. 그럼 그때까지 구독, 좋아요, 알림 설정.
영상제작. 바이라인네트워크
촬영·편집. 바이라인네트워크 영상팀 byline@byline.network
대본. <이종철 기자>jude@byline.network