2주 걸리던 SRE 업무, AI 동료와 하니 이틀로 줄어
|

2주 걸리던 SRE 업무, AI 동료와 하니 이틀로 줄어

최근 개발 현장에서 인공지능(AI)을 활용한 생산성 향상 논의가 활발하다. 하지만 인프라 안정성을 책임지는 ‘사이트 신뢰성 엔지니어링(이하 SRE)’ 영역에서의 AI 활용 논의는 상대적으로 부족하다는 것이 조훈 메가존소프트 엔지니어의 진단이다. 조 엔지니어는 지난달 24일 에서 개최한 ‘AI 시대를 준비하는 쿠버네티스’ 웨비나에서 ‘AI-Driven SRE’를 주제로 발표하며, 1인 SRE 환경에서 AI를 도입해 업무 생산성을 5배 높인 사례를 공유했다.

“쿠버네티스는 GPU를 잘 활용하기 힘든 플랫폼”

“쿠버네티스는 GPU를 잘 활용하기 힘든 플랫폼”

쿠버네티스는 클라우드의 운영체제라 불릴 정도로 스테이트리스 서비스 운영의 기본 선택지로 자리잡았다. 그렇게 좋은 쿠버네티스지만, CPU와 메모리 자원을 최적화하는 걸 목적으로 태어났기 때문에, 학습과 추론의 AI 워크로드를 운영할 때 GPU를 효율적으로 활용하기에 어려운 부분이 많다. 쿠버네티스에서 GPU를 잘 활용하려면 실제 플랫폼을 구축할 때 발생하는 문제를 운영 관점에서 어떻게 해결할 수 있을 지 봐야 한다.

End of content

End of content