MS 빌드와 구글I/O…AI의 도구와, AI로 만드는 서비스
지난 19일과 20일 마이크로소프트와 구글이 각자 연례 개발자 컨퍼런스를 개최했다. 두 회사 모두 생성형 인공지능(AI)의 다음 단계를 제시하면서 전세계 개발자의 이목을 집중시켰다.
‘마이크로소프트 빌드’와 ‘구글 I/O’는 개발자 컨퍼런스란 큰 틀에서 같지만, 행사의 분위기와 방향성은 전혀 다르다. 빌드는 개발도구의 잔치이며, I/O는 기술력 과시의 장이다. 마이크로소프트는 생성형 AI 플랫폼을 내세워 개발자의 빠르고 손쉬운 AI 애플리케이션 개발을 강조하는 반면, 구글은 대형언어모델(LLM)부터 애플리케이션과 하드웨어에 이르기까지 생성형 AI 구현과 응용의 총체적 기술력을 과시하고 자사 서비스 생태계 내의 개발자 응집력을 강화한다. 마이크로소프트는 개발자의 플랫폼 소비를 독려하고, 구글은 생태계 고도화를 추구한다.
마이크로소프트 빌드2025
마이크로소프트가 지난 19일부터 22일까지 미국 시애틀에서 개최한 ‘마이크로소프트 빌드 2025’의 큰 주제는 ‘오픈 에이전틱 웹’이다. 마이크로소프트는 생성형 AI를 사람을 지원하는 보조 도구에서 동등한 동료로 격상시키고, 수많은 AI 에이전트로 연결된 새로운 디지털 경제망을 제시했다.
사람은 무수한 AI 에이전트를 연결하는 네트워크 속의 또 다른 한 점(Point)이다. 사람과 AI 에이전트의 상호작용은 대화형 인터페이스를 통해 이뤄지고, AI 에이전트의 IT 세계와 상호작용은 ‘모델컨텍스트프로토콜(MCP)’과 ‘에이전트2에이전트(A2A) 프로토콜’을 통해 이뤄진다. 이미 웹 세상에 존재하는 여러 웹사이트를 ‘에이전틱 웹’에 편입시키는 도구이자 언어로 ‘NLWeb’을 새롭게 제시하면서 ‘오픈 에이전틱 웹’이란 큰 그림을 그린다.

그렇다면, 개발자의 ‘오픈 에이전틱 웹’ 참여를 도와주는 경로이자, 활동을 지탱하는 ‘플랫폼’이 필요하다. 마이크로소프트의 ‘애저 AI 파운드리’는 바로 그 플랫폼이다.
[관련기사: 애저 AI 파운드리, 경계없는 AI 에이전트 플랫폼으로]
마이크로소프트는 애저 AI 파운드리에서 오픈AI GPT, 메타 ‘라마’ 모델군을 비롯해 1900개의 검증된 AI 모델과 소형언어모델(SLM)을 제공하며, 코파일럿 스튜디오 같은 AI 개발도구에서 생성형 AI 애플리케이션과 AI 에이전트를 개발하게 한다. 깃허브는 개발자의 코드를 담아두는 저장소이고, 깃허브 코파일럿은 개발자의 모든 작업을 지원하는 AI 동료다.
[관련기사: 깃허브, 코파일럿 코딩 에이전트 공개 ‘부조종사에서 동료로’]
개발자는 애저 AI 파운드리를 기반 삼아 생성형 AI 활용이란 숙제를 해결할 수 있다. 애저 AI 파운드리에서 AI 모델을 골라 쓰거나 미세조정하고, 마이크로소프트 패브릭이란 데이터 아키텍처를 통해 AI를 위한 데이터를 공급하며, 코파일럿 스튜디오와 깃허브로 AI 애플리케이션과 에이전트를 개발해 사용자에게 배포하면 된다. 애저 AI 파운드리는 그 자체로 멀티 에이전트 오케스트레이션도 담당한다.
애저 AI 파운드리는 마이크로소프트의 윈도우란 디바이스 계층과도 이어진다. 애저 AI 파운드리의 온디바이스 AI 버전인 ‘윈도우AI 파운드리’는 윈도 기기에서 실행가능한 AI 애플리케이션을 개발, 구동하게 지원한다. 윈도우는 MCP를 지원해 PC의 사용자 데이터를 생성형 AI와 연결할 수 있게 준비됐다. 윈도우 AI 파운드리는 애저와도 연결될 수 있어서 기기에서 돌아가는 AI 모델과 애플리케이션을 애저 클라우드와 혼합하거나 아예 클라우드로 옮겨 작동시키는 것도 가능하다.
생산성 도구와 관련된 ‘마이크로소프트365 코파일럿(이하 M365)’을 마이크로소프트에서 구현한 비즈니스를 위한 생성형 AI 애플리케이션이다. 각종 오피스 제품군과 함께 하며 구체적인 비즈니스 업무를 지원한다. M365 코파일럿은 이제 수많은 AI 에이전트를 거느린 거대한 관리자 AI 에이전트로 진화했다. M365 코파일럿으로 현실 비즈니스 업무를 수행하는 자율형 에이전트를 만들고, 관리할 수 있다. 여러 자율 에이전트 간 협업을 조율하는 멀티 에이전트 오케스트레이션도 담당한다.
[관련기사: 마이크로소프트365 코파일럿, 맞춤형 에이전트로 진화]
기업이 빠른 시간 안에 생성형 AI와 AI 에이전트를 도입하고 단시간 내에 투자 효과를 거두고 싶다면, M365 코파일럿을 선택하면 된다. 더 자기 주도적으로 생성형 AI와 AI 에이전트를 만들고, 관리하고 싶으면 ‘애저 AI 파운드리’를 선택하면 된다.
마이크로소프트의 목표는 사실 단순하다. 마이크로소프트의 핵심 사업인 M365 구독과, 애저 클라우드를 최대한 많은 개발자가 오랫동안 사용하길 바란다. 비즈니스 사용자와 기업 IT 사용자가 생성형 AI란 거대한 수요 안에서 겹치고 있으므로, 생산성 도구와 클라우드 수익의 견인차로서 코파일럿과 AI 파운드리를 고도화하고 끝없이 내미는 것이다.

윈도우 메모장에 AI 생성기를 넣는 등 윈도우11의 생성형 AI 기능을 계속 출시하고, 새로운 윈도우 OS 터미널 편집기인 ‘에디트(edit)’를 오픈소스로 공유하고, 윈도우에서 리눅스를 구동하게 해주는 ‘리눅스용 윈도우서브시템(WSL)’을 돌연 오픈소스로 출시하고, ‘깃허브 코파일럿 챗’을 오픈소스로 공개하는 등 일련의 행동은 개발자에게 트렌디함을 어필하려는 목적이다.
애저 AI 파운드리와 M365 코파일럿이란 새로운 기반에서 만들어지는 AI 에이전트가 있고, 다른 한켠에 이미 존재하는 수많은 HTML 기반의 웹사이트를 AI 에이전트 친화적으로 전환하는 공간도 있다. 웹사이트에 자연어 인터페이스를 붙여 AI와 소통 가능하게 만드는 오픈소스 프로젝트 ‘NLWeb’이다. NLWeb은 자연어 웹(Natural Language Web)의 약자로, 웹사이트 운영자가 선택한 모델과 자체 데이터를 AI에서 활용하게 해준다. NLWeb을 구상하고 구축한 사람이 RSS, RDF 등 웹표준의 창시자인 라마나단 V. 구하 마이크로소프트 기업부사장(CVP) 겸 기술 펠로우란 점이 흥미롭다.
[관련기사: 모두를 AI 에이전트 경제로 끌어들인다 ‘에이전트 웹’]
다양한 플랫폼에서 다양한 높은 자율성을 가진 AI 에이전트가 수없이 만들어지는 가운데, 수많은 에이전트들을 하나의 네트워크로 연결할 수 있어야 한다는 게 마이크로소프트의 판단이다. 수많은 AI 에이전트의 집합 네트워크는 ‘에이전트 경제’를 형성한다. 기존의 애플리케이션과 웹사이트, 그리고 그 소유자가 새로운 경제 시스템에서 고립되고 도태되지 않는 아이디어도 제시한다.
마이크로소프트는 올해 빌드 2025 컨퍼런스에서 프로페셔널 개발자, 시민 개발자, 기업 운영자 등이 쉽게 AI 에이전트를 구축하고, 운영하며, 배포할 수 있는 다양한 기술을 선보였다. MCP, A2A는 깃허브, 애저, 윈도우 등에 모두 기본으로 포함됐다. 윈도우 디바이스, 애저, 타사 클라우드, 엣지, 데이터센터, 인터넷 페이지 등을 포괄하는 ‘오픈 에이전틱 웹’에서 마이크로소프트를 거대 플랫폼으로 자리하게 하려는 의도를 볼 수 있다.
사티아 나델라 마이크로소프트 최고경영자(CEO)는 “에이전트 웹 비전은 어떤 의미에서 우리를 웹의 원래 비전과 정신에 더 가깝게 만든다”며 “이제 콘텐츠와 인텔리전스 모두 웹을 통해 더 많이 분산되고 발견될 수 있으며, NLWeb은 모든 앱, 모든 웹사이트에 대한 지능 창출을 민주화한다”고 밝혔다.
그는 “에이전트 웹은 우리가 함께 만들고 싶은 플랫폼”이라며 “이것은 단지 과거의 반복이 아니며, 뭔가 큰 변화가 일어날 것”이라고 강조했다.
구글 IO 2025
구글은 지난 20일부터 21일까지 미국 마운틴뷰에서 ‘구글I/O 2025’를 개최했다. 원래 안드로이드 모바일 생태계를 강화하는 내용으로 꾸며졌던 행사지만, 2023년부터 생성형 AI와 구글 서비스의 진화를 발표하는 행사로 성격을 바꿨다.
구글I/O 2025의 내용은 파운데이션 모델인 ‘제미나이’와 그 파생 모델, 개발자 도구, OS, 구글 서비스, 하드웨어 등을 총망라한다.
구글은 2023년과 2024년 구글I/O에서 PaLM2, 제미나이 등 파운데이션 모델의 버전 업그레이드를 발표했던 것과 달리 올해 행사에서 모델의 새 버전을 공개하지 않았다. 오히려 컨퍼런스를 앞두고 알파이볼브, 제미나이2.5 플래시, 제미나이2.5 프로 등의 AI 모델을 먼저 발표했다. 오픈AI나 앤트로픽 같은 경쟁자를 겨냥하는 파운데이션 모델의 우위는 이미 달성했으니 지나치고, 상상 세계에 있던 구상을 실제 서비스로 현실화하는 응용의 영역에 진입했다는 선도자적 위상을 자랑한 것이다.

구체적인 서비스를 언급하기에 앞서 제미나이 2.5 프로와 플래시의 사고 모델 측면의 업그레이드를 강조하고, 그 기술 개발과 서비스를 지탱하는 데이터센터 하드웨어 ‘TPU’의 최신 세대인 ‘아이언우드(TPUv7)’의 우월함을 내세웠다.
[관련기사: 구글, 제미나이 2.5 업데이트 발표 “이론을 현실로”]
구글딥마인드의 데미스 하사비스는 제미나이 자체의 발전을 건너뛰고 현실적인 생성형 AI를 설명했다. 이미지 생성 모델인 ‘이마젠4’, 비디오 생성 모델인 ‘베오3’, 작곡 모델인 ‘리리아2’를 소개하고, 이런 멀티미디어 모델을 동원해 장대한 종합 콘텐츠를 만들 수 있는 ‘플로우(Flow)’를 발표했다.
그는 나아가 프로젝트 아스트라(Astra)라는 실험적 멀티모달 비서 기술의 최신 프로토타입을 시연했다. AI가 휴대폰 카메라로 주변을 보고 스스로 상황을 파악해 사용자의 직접 요청 없이 할 일을 알아서 수행한다. 웹 브라우저를 대신 탐색하고 작업을 진행해주는 에이전트 AI인 ‘프로젝트 마리너(Mariner)’도 소개됐다. 제미나이에 통합된 이 에이전트는 사용자 지정 목표를 달성하기 위해 웹 검색부터 양식 제출, 예약, 구매까지 일련의 작업을 알아서 수행한다.
구글은 고급 사고 기능을 수행하는 AI 모델을 이용할 수 있는 월 249.99달러의 AI 구독 요금제 ‘AI 울트라 플랜’도 신설한다고 발표했다. 월 19.99달러의 AI 프로 요금제와 별도로, 최첨단 모델에 조기 접근할 수 있는 요금제다. AI 울트라 요금제를 이용하면 제미나이 2.5 프로 모델의 딥 싱크 모드를 남들보다 빨리 이용하고, AI의 웹 브라우징 에이전트 기술인 프로젝트 마리너의 고급 도구에도 조기 접근할 수 있다.
구글은 개발자들이 자사의 생태계 안에서 더 편하게 머무르길 기대한다. 그를 위해 개발자를 위한 각종 도구도 발표했다. AI 기반 코드 도우미인 ‘제미나이 코드 어시스트’는 제미나이 2.5 모델로 구동되도록 업데이트됐다. 코딩 성능과 컨텍스트 이해 능력이 더욱 향상됐는데. 개인 개발자는 무료로 사용할 수 있다. 코드 어시스턴트는 코드 작성 보조뿐 아니라 빌드 및 배포 스크립트나 리팩토링 등의 작업도 AI의 도움을 받아 손쉽게 처리할 수 있게 한다.
줄스(Jules)라는 새로운 AI 코딩 에이전트도 공개했다. 줄스는 개발자의 명령이나 의도를 이해하고 알아서 코딩 작업을 수행한다. 에이전트가 프로젝트의 코드베이스를 분석하고, 백그라운드에서 개발자 지정 작업을 자동으로 처리한다. 단위 테스트 작성, 새 기능 코드 추가, 버그 수정, 라이브러리 버전 업데이트 등을 에이전트에게 맡길 수 있다. 파이어베이스 스튜디오(Firebase Studio)라는 클라우드 기반 AI 앱 개발 도구도 소개됐다. 이 도구는 노코드로 아이디어를 바로 풀스택 애플리케이션으로 구현해준다. 예를 들어 피그마로 만든 디자인 시안을 불러오면 자동으로 해당 UI에 맞는 코드를 생성할 수 있다.
UI 디자인 AI 도구인 스팃치(Stitch)도 선보였다. 사용자가 선택한 테마와 설명 프롬프트 입력만으로 모바일/웹 앱의 UI를 만들어준다. 또, 안드로이드 앱 개발 도구인 안드로이스 스튜디오는 ‘저니스(Journeys)’란 에이전트형 AI 테스트 기능을 추가했다. 앱을 인간처럼 조작하며 자동으로 테스트 시나리오를 수행해준다.
[관련기사: 구글I/O 2025에서 발표된 개발자 AI 도구 총정리]
생성형 AI 자체의 기술력을 자랑한 뒤 구글은 검색, 포토, 지메일, 노트북LM 등 기존의 자사 서비스를 생성형 AI 기반으로 업그레이드했다는 점을 강조했다.
구글 검색에 대화형 AI 모드(AI Mode)가 본격 도입됨으로써, 검색창 상단의 탭에서 AI 모드로 전환하면 제미나이 기반의 챗봇과 대화하듯이 검색을 진행할 수 있다. 검색 AI 모드는 올해 중 딥서치 기능도 갖출 예정이다. 사용자의 지메일, 구글드라이브 등 개인 콘텐츠를 연계해 개인화된 결과도 보여줄 수 있다. 챗봇에서 챗봇과 대화하며 상품을 찾으면 상품 목록이 자동으로 갱신되는 쇼핑 추천 패널도 나왔다. 사용자 자신의 사진을 업로드하면 옷을 가상으로 입어볼 수 있는 가상 피팅(AI Try-On) 기능도 소개됐다. 스마트폰 카메라로 주변을 비추며 실시간 대화 형태로 검색하는 ‘서치 라이브(Search Live)’라는 모드도 등장했다.
[관련기사: “이 옷 나한테 어울릴까?” 구글, 내 사진에 옷 입혀주는 AI 기술 공개]
구글 포토는 ‘애스크 포토(Ask Photo)’ 기능을 추가했다. AI가 사용자의 사진 라이브러리를 이해하고 사용자 질문에 답할 수 있다. 지메일은 스마트 답장(Smart Reply) 기능을 도입해서 수신 메일에 대한 자동 응답 제안 시 사용자의 이전 이메일 내용이나 문체를 고려한 맞춤형 답변을 생성해준다. 메일함 관리도 AI가 해준다. 지메일과 구글 캘린더의 연동도 강화돼 메일 내용을 바탕으로 일정을 자동 생성·편집하거나 상대방과 회의 일정을 잡는 것을 도와준다. 구글 미트 화상회의는 AI 실시간 음성 통역 기능이 추가됐다. 노트북LM 서비스는 동영상 개요 생성, 음성 해설 길이 조절 등이 가능해졌다.
구글의 3D 원격 화상부스 기술인 ‘구글 빔’도 발표됐다. 구글 빔은 안경 없이 입체적인 3D 홀로그램 영상 통화를 구현하는 AI 기반 3D 커뮤니케이션 플랫폼이다. 빔은 실시간 통역 기술도 포함한다. 구글 빔에서 스페인어 이용자와 영어 이용자가 각자의 언어로 말하면 동시 통역하는 기능이 시연됐다.

구글은 한발 더 나아가 생성형 AI를 일상 생활에서 새로운 형식으로 이용할 수 있는 스마트 안경 플랫폼 ‘안드로이드 XR’을 소개했다. AR 글라스 제조사인 엑스리얼(Xreal)과 협업한 ‘프로젝트 아우라’의 프로토타입이 공개됐다. 평범한 선글라스처럼 생겼지만, 힌지 부분에 카메라와 마이크 등을 내장했으며, 구글의 제미나이 AI와 통합돼 음성 명령이나 시각 정보를 실시간으로 처리하고 사용자에게 정보를 제공한다.
[관련기사: 구글이 만든 스마트 안경 ‘아우라’, 어떤 기능 담았나]
순다 피차이 구글 CEO는 기조연설에서 제미나이와 각종 AI 모델 관련 서비스가 빠르게 성장하고 있다고 강조했다. 작년 제품과 API에서 한 달 9.7조개 토큰을 처리하던 것에서 현재 480조개 이상 토큰을 처리하고 있다고 밝혔다. 제미나이 활용 개발자는 1년 사이 5배 증가해 700만명을 넘었고, 버텍스AI의 제미나이 사용량은 40배 증가했다고 한다. 제미나이 앱의 월간활성사용자(MAU)는 4억명을 돌파했다.
구글I/O는 구글이란 영지 안에서 살아가는 개발자와 사용자에게 거주의 이유를 제공한다. 안드로이드 OS와 관련된 개발자는 제미나이 모델군을 활용해 모바일앱을 AI 앱으로 탈바꿈시켜 성장할 수 있다. 사용자는 새로운 차원의 AI 기반 서비스로 일상의 큰 변화를 경험할 수 있다. 사실 구글 생태계 내 개발자의 개발 플랫폼 활용을 독려하는 것은 구글에게 후순위다. 그 작업은 자회사인 구글클라우드의 몫이다. 그런 정보라면 I/O에 앞서 열리는 ‘구글클라우드넥스트’에서 보란 식이다.
구글은 외부 경쟁자의 침입을 방어하는 해자를 더 깊이 파고, 새로운 침입자의 월담을 막는 성벽을 제미나이로 매일 매일 더 높이고 있다. 이미 영지 내 구성원은 풍부하니 그들의 활동은 구글의 성공으로 자연스레 이어진다.
순다 피차이 CEO는 “이 모든 발전은 구글의 AI 플랫폼 전환이 새로운 국면에 접어들었음을 의미한다”며 “수십년 간의 연구가 이제 전세계 이용자, 기업, 커뮤니티를 위한 현실이 되고 있다”고 말했다.
그는 이어 “AI가 제공하는 기회는 실로 막대하다”며 “그리고 그 혜택이 가능한 한 많은 사람에게 돌아가도록 하는 것은 이번 세대의 개발자, 기술 구축자, 문제 해결사들의 손에 달려 있다”고 강조했다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network