[외쿡신문] 쏟아지는 챗GPT 소식에 입을 다물지 못합니다

요즘 정말 하루가 멀다하고 챗GPT에 대한 소식으로 뜨겁습니다. 날마다 놀라운 소식을 전하고 있는데요, 산업계를 넘어 사회적으로 적지 않은 파장을 일으킬 것으로 보입니다. AI가 인간 대신할 수 있는 일이 급작스럽게 많아질 것이기 때문입니다. 이번 주 <외쿡신문>은 챗GPT 소식을 모아봤습니다.


GPT-3, 와튼스쿨 MBA 패스 ‘가능’

챗GPT의 삼촌뻘인 GPT-3가 세계 최고의 비즈니스 스쿨로 꼽히는 펜실베니아 대학 와튼스쿨 MBA 시험에 통과했다고 합니다. 와튼스쿨 크리스천 터비시 교수는 최근 <챗GPT가 와튼스쿨 MBA를 받을 수 있을까? 운영관리 과목에서 성적을 기반으로 한 예측>이라는 주제의 논문을 발표했습니다. 이 논문에 따르면, GPT-3는 운영관리 시험에서 B-와 B 사이의 점수를 획득했다고 합니다.

터비시 교수는 논문에서 “일반적으로 높은 보상을 받는 지식 노동자의 기술, 특히 애널리스트·경영자·컨설턴트 등 MBA 졸업생이 하는 지식 노동의 일부를 자동화하는 놀라운 능력을 보여준다”고 평했습니다. 그는 특히 “정답을 모를 경우, 인간의 힌트에 반응해 대답을 수정하는 데 매우 능숙하다”고 전했습니다.

이는 GPT-3와 챗GPT의 뛰어남을 보여주는 사례이기도 하지만, 전통적인 교육 시스템의 붕괴를 예고하는 장면이기도 합니다. 와튼스쿨은 전세계 MBA 순위에서 1위를 기록하는 유명 학교입니다. 이런 학교에서 육성하는 인재의 수준에 AI가 따라왔다는 의미죠. 세계 최고의 학교에서 AI로 대체될 수 있는 인재를 육성하고 있다고 말하는 셈입니다. 즉, 비즈니스 스쿨의 교육 방향이 바뀌지 않으면 안된다는 것을 보여주는 것이기도 합니다.

터비시 교수는 “시험 정책의 필요성, 인간과 AI 간의 협력에 초점을 맞춘 커리큘럼 설계, 실제 의사 결정 프로세스를 시뮬레이션할 수 있는 기회, 창의적인 문제를 가르칠 필요성 등 비즈니스 스쿨 교육에 중요한 영향을 미친다”고 말했습니다.

물론 이 AI가 아직 완벽한 상태는 아닙니다. 터비시 교수는 ”6학년 수학 수준의 비교적 간단한 계산에서 때때로 놀라운 실수를 한다”고 언급하기도 했습니다. 또 “표준적인 템플릿을 기반으로 하는 경우에도 고급 프로세스 분석 질문을 처리할 수 없었다”면서 “여러 제품이 있는 프로세스 흐름과 수요 변동성과 같은 확률론적 영향이 있는 문제도 마찬가지”고 전했습니다.

터비시 교수는 GPT-3 기반의 챗봇으로 이번 실험을 진행했습니다. 오픈AI에 따르면, 현재 시장에 충격을 주고 있는 챗GPT는 GPT3에서 진화한 GPT3.5를 기반으로 하고 있습니다. 그리고 머지 않아 오픈AI는 GPT-4도 내놓을 예정입니다.

터비시 교수가 테스트 한 AI보다 이미 훨씬 발전해 있고, 앞으로도 엄청난 발전을 할 가능성이 높다는 점에서 터비시 교수가 지적한 문제는 이미 해결됐을 수도 있을 것 같습니다.

챗GPT, 미국 의사·변호사 자격 시험 통과 “가능“

챗GPT가 미국의사면허시험(USMLE)을 무난하게 통과할 정도의 실력을 갖췄다는 연구 결과가 나왔습니다. 미국 캘리포니아 마운틴뷰의 의료기관인 앤서블 헬스(Ansible Health) 연구진은, 챗GPT를 대상으로 USMLE 시험을 실시한 결과 모든 시험에서 50% 이상의 정확도를 보여줬다고 논문에서 밝혔습니다.

연구진은 3단계의 시험으로 구성된 USMLE로 챗GPT를 평가했는데, 3가지 시험 모두 합격 기준점 수준을 넘어선 것으로 나타났습니다. 연구진은 “특별한 훈련이나 강화 없이 진행한 챗GPT가 높은 수준의 통찰력을 보여줬다”면서 “이러한 결과는 대규모 언어 모델이 의학 교육이나 임상 의사 결정에 도움이 될 수 있음을 시사한다”고 밝혔습니다.

USMLE는 기초 과학, 임상 추론, 의료 관리, 생명 윤리 등의 지식을 평가하는 3단계 표준화 테스트 프로그램입니다 . 다만 질문의 난이도와 복잡성이 표준화되어 있기 때문에 오히려 AI가 답하기 어렵지 않다는 의견도 있습니다.

또 챗GPT가 미국 변호사 시험도 통과할 수 있다는 연구 결과도 나왔습니다. 연구진은 GPT-3.5인 ‘text-davinci-003’ 모델로 미국 변호사 시험(BAR)를 테스트했는데, 50% 이상의 정답률을 기록했다고 합니다. 이 시험은 로스쿨 3년을 마친 사람이 지원할 수 있는데, 이 시험을 처음보는 사람의 경우 5명중 1명만이 합격한다고 합니다.  

AI가 의사나 변호사와 같은 전문직의 업무의 일부를 대신할 것이라는 예측은 오래 전부터 나왔는데, 이제는 전망을 넘어 현실화 되어 가는 모습입니다.

예를 들어 챗GPT는 알츠하이머 조기 진단에 매우 유용하다고 합니다. 일반적으로 알츠하이머를 진단할 때 문법 오류, 말하다 잠시 멈추기, 반복해 말하기, 단어 잊기 등 언어적인 요소를 주로 보는데, 챗GPT가 사용하는 초거대 언어모델은 이런 일을 아주 잘 할 수 있는 AI인 것입니다.

챗GPT는 논문 저자가 될 수 없다

세계적인 과학 학술지 네이처가 챗GPT와 같은 대화형 인공지능을 논문 저자로 인정하지 않겠다고 발표했습니다. 웬 생뚱맞은 발표냐고요?

실제로 논문 저자로 챗GPT가 등재된 경우가 있기 때문에 논란이 됐었습니다. 지난달 의학논문 사전 공개사이트인 메드아카이브(MedRxiv)에 챗GPT를 세 번째 공저자로 한 논문이 발표되기도 했죠. 지금까지 챗GPT를 공저자로 올린 과학논문이 4개라고 합니다.

이에 따라 네이버는 저자 가이드에 초거대언어모델(LLM)은 연구 논문의 저자로 인정하지 않는다는 기준을 정했습니다. 논문저자로 이름을 올린다는 것은 논문이 도출한 결과에 책임을 지겠다는 의미인데, AI는 책임을 질 수 없기 때문에 저자로 인정하지 않겠다는 것입니다.

다만 논문작성에 LLM을 사용하는 것 자체는 금지사항이 아닙니다. 대신 LLM을 사용할 경우 그 사실을 논문 안에 명시해야 한다는 원칙을 정했습니다. 실제로 논문을 쓸때 챗GPT와 같은 LLM을 사용하는 경우가 많다고 합니다. 예를 들어 논문의 내용은 연구자들이 직접 쓰더라도 논문초록은 LLM에 맡길 수 있습니다.

네이처뿐 아니라 여러 학술지가 비슷한 입장을 전하고 있습니다. 사이언스 저널 편집장인 홀든 소프는 네이처 뉴스팀과의 인터뷰에서 “우리는 AI가 논문의 저자로 등재되는 것을 허용하지 않을 것이며 적절한 인용 없이 AI가 만든 텍스트를 사용하는 것도 표절로 간주될 수 있다”고 말했습니다.

챗GPT로 벌이는 마이크로소프트의 한판 승부

마이크로소프트가 챗GPT 개발사인 오픈AI에 대규모 투자를 진행한다고 밝혔습니다. 구체적은 금액을 공개하지는 않았지만 앞서 100억 달러(한화 약 12조원) 규모로 마이크로소프트가 투자할 계획이라는 소식이 계속 나오는 상황이었습니다. 블룸버그 역시 소식통을 인용해 투자 규모는 수년간 총 100억 달러(12조3천억 원)에 이른다고 전했습니다.

사티아 나델라 마이크로소프트 CEO 자사 블로그에 “최첨단 AI 연구를 진전시키고, AI를 새로운 플랫폼으로 만들려는 야망을 위한 것”이라고 밝혔습니다.

이번 투자는 마이크로소프트와 오픈AI의 관계가 더욱 돈독해진다는 것을 의미합니다. 마이크로소프트는 공식적으로 오픈AI에 10억 달러를 투자했고, 100억 달러 투자를 진행할 예정입니다. 하지만 뉴욕타임즈(NYT) 보도에 따르면, 2019년 처음 10억 달러를 투자한 이후 20억 달러를 추가 투자했다고 합니다. 마이크로소프트가 오픈AI에 이미 30억 달러의 투자를 이미 한 것이죠. 여기에 100억 달러를 추가 투자하면 총 130억 달러의 투자를 하는 셈입니다. 투자가 완료되면 마이크로소프트가 오픈AI의 지분 49%를 갖게 된다고 합니다. 사실상 오픈AI를 인수하는 것이나 다름없죠.

마이크로소프트가 오픈AI를 품에 안으면 양사의 시너지가 매울 클 것으로 전망됩니다. 최근 초거대 AI 경쟁은 결국 컴퓨팅 파워 경쟁과 크게 다르지 않습니다. 연구자들은 모델을 크게 만들고, 데이터를 많이 집어넣으면 기존에 하지 못했던 일을 할 수 있다는 사실을 알게 됐습니다. 그러나 이렇게 하기 위해서는 엄청난 컴퓨팅 자원이 필요하고, 이는 곧 비용입니다.

마이크로소프트는 애저라는 클라우드 컴퓨팅 플랫폼이 있습니다. 오픈AI에 큰 힘이 되죠. 오픈AI가 확보한 투자금은 다시 애저 이용료로 나갈 것이라는 분석이 많습니다.

마이크로소프트는 오픈AI의 기술을 클라우드 서비스로 제공해서 클라우드 시장에서 AWS를 넘을 수 있는 기회를 엿보고 있습니다. 또 오피스365 등 기존 제품에 챗GPT의 기술을 탑재해서 완전히 새로운 서비스를 제공할 수 있습니다.

특히 마이크로소프트는 빙 검색에 챗GPT를 넣을 예정이라고 합니다. 구글이 지배하는 검색 세상에서 마이크로소프트가 어쩌면 반등의 기회를 잡을 수 있을지도 모릅니다.

“GPT-4, 너무 기대하지 마세요”

GPT-4의 등장이 머지 않았다는 소식이 전해집니다. 여러 외신은 2023년 초기에 GPT-4가 등장할 것이라고 예상하고 있습니다. GPT-4는 현재 우리에게 충격을 주고 있는 챗GPT보다 진화된 초거대 모델입니다. 챗GPT는 GPT-3.5를 사용하고 있다고 합니다.

포브스에 따르면, GPT-4는 멀티 모달을 지원한다고 하네요. 지금까지 GPT 시리지는 텍스트를 입력하면 텍스트를 출력하는 형태였는데, 앞으로는 텍스트나 이미지, 오디오 등 다양한 소스를 입력하고, 출력도 다양한 형태로 나온다는 것입니다. 글이나 사진, 영상 등 어떤 모드로 입력하든 컴퓨터가 알아듣고 글이나 사진, 동영상, 프로그래밍 코드 등을 만들어 줄 수 있습니다.

그러나 오픈AI의 CEO는 이런 기대가 “과도하다”고 평가합니다. 샘 알트만 오픈AI CEO는 “100조 개 이상의 매개변수가 있을 것이라는 얘기도 있는데 그렇지 않다”면서 “사람들이 실망하기 시작할 것”이라고 말했습니다. 그는 GPT-4의 출시에 대해 “안전하고 책임감 있게 수행할 수 있다고 확신할 때만 공개될 것”이라며 “사람들이 원하는 것보다 훨씬 느리게 출시할 것”이라고 덧붙였습니다.

알트만 CEO는 특히 챗GPT에 열광하는 이 현상이 좀 당황스럽다고 전했습니다. 그는 “DALL-E가 사람들을 놀라게 한 이유는 알 수 있지만 챗GPT의 인기는 진정으로 혼란스러웠다”면서 “우리는 거의 3년 전에 GPT-3를 내놓았고 API로 제공한다”고 말했습니다. 챗GPT는 GPT-3의 수준인데 왜 갑자기 난리냐,는 뉘앙스입니다.

GPT-3은 비전문가에게 AI 원천기술로 받아들여졌던 것 같습니다. AI 업계 종사자나 IT 트렌드에 밝은 이들은 이미 GPT-3가 등장했을 때부터 난리였지만, 원천기술이 챗봇이라는 친숙한 서비스에 담기자 대중이 반응하기 시작한 것으로 풀이됩니다.

알트만 CEO는 “GPT-4에 대한 과대광고를 중단해달라”면서 “이런 기술은 인상적이기는 하지만, 견고하지 않기 때문에 시간이 갈수록 약점이 발견된다”고 강조했습니다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

관련 글

6 댓글

  1. 최근에 관심을 갖고 보던 주제라 재미있게 잘 읽었습니다.

    챗 GPT, 미국 의사·변호사 자격 시험 통과 “가능” 4번째 단락에 ‘미국 변호사 시험(BAR)Dㅡㄹ 테스트했는데’ 오타 있습니다.

  2. 여러 차례 테스트를 해봤는데 문장 자체는 완성도가 꽤 있었습니다만 내용 면에서 틀에 박힌 두루뭉실한 부분이 많았습니다. 인공지능의 안전성에 대한 질문에는 검열된듯한 답변을 내놓았고 일본의 만행에 대한 질문에서는 여러 차례 에러를 일으켰습니다. 인간의 가치와 인간을 대체할 신종 생물과 인공지능의 관계에 대한 질문에서는 틀에 박힌 애매한 답변을 했습니다. 특정 강의 요강을 만들어달라는 요구의 결과물은 매우 실망스러운 수준이었습니다. 실제로 해보니 아직은 장난감 수준에 불과하다는 느낌이었습니다. 저만 그런가요?

  3. 기사 잘 봤습니다.
    기사 중 와튼이 있는 대학을 펜실베이니아 주립대학(보통 펜 스테이트 칼리지 라고 부릅니다)이라 했는데 와튼은 아이비리그 중 하나인 ‘유니바시티 오브 펜실베이니아'(University of Pennsylvania. 보통 유펜이라 부릅니다)에 있는 비즈니스 스쿨입니다.
    많은 분들이 헛갈립니다.
    학부와 MBA 과정으로 되어 있으며 학부와 MBA 과정이 거의 동일합니다. 교수도 같습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다