LG전자의 AI 에이전트 기반 CAE DB 자동화 구축기

“현업의 일하는 방식을 단 1%도 바꾸지 않고, 엔지니어는 기존 관행대로 PPT 보고서만 자유롭게 작성해서 업로드하면, 시스템이 알아서 수치를 뜯어내 DB화할 수 있게 됐다. AI 모델에게 가장 양질의 엔지니어링 영양분을 제공할 수 있는 데이터 파이프라인 기반이 완성된 덕이다.”

LG전자 HS연구센터 VPD실 최상혁 책임연구원은 지난달 11일 다쏘시스템이 개최한 ‘시뮬리아데이’ 하이테크 세션발표에서 AI 에이전트를 이용한 SPDM CAE 데이터베이스 구축의 효과에 대해 이같이 밝혔다.

시뮬레이션 프로세스 데이터 매니지먼트(SPDM)는 해석에 필요한 절차와 데이터를 체계적으로 관리하는 시스템이다. 엔지니어링 시뮬레이션에 사용되는 모든 데이터를 저장하며, 시뮬레이션의 전체 작업 흐름을 조율한다. SPDM의 목적은 쌓인 데이터를 활용해 CAE를 더 잘 수행하게 하는 것이다. LG전자는 SPDM을 2019년부터 고민하기 시작해 2022년부터 활용하고 있다. 그러나 현업 엔지니어의 활용률이 만족스럽지 못했다. 업무 부하만 늘어나는 시스템은 외면받을 수밖에 없었다.

그는 “CAE 데이터를 다루면서 가장 중요하게 생각하는 본질은 데이터를 단순히 쌓는 단계에서 끝내는 것이 아니라, 쌓인 데이터를 활용해 CAE를 더 잘 수행하는 단계로 발전해야 한다는 점”이라며 “이미 2019년 파일럿 후 2022년 4월에 본부 도입을 완료해 본격적으로 사용하기 시작했고, 현재까지 플랫폼 운영을 통해 방대한 CAE 데이터를 저장 및 관리하고 있다”고 설명했다.

그는 “초기 2~3년 동안은 각 사업부마다 독립된 CAE 조직들이 흩어져 있다 보니 본부에서 SPDM 시스템을 쓰라고 강제해도 현업 엔지니어들이 쉽게 따라주지 않는 조직적인 우여곡절도 많았다”며 “엔지니어들이 ‘도입하면 도대체 우리한테 뭐가 좋냐’고 본질적인 의문을 던졌을 때, 이력 관리나 통계 분석이 자동으로 된다는 교과서적인 답변 외에는 엑셀 문서 관리나 팀 서버와 차별화되는 확실한 가치를 증명하기가 어려웠기 때문”이라고 말했다.

LG전자는 더 나은 시뮬레이션 결과, 더 효율적인 업무를 위해 AI 활용을 고려했다.

최 연구원은 “플랫폼 내에 쌓이는 솔버의 메시지 파일이나 리스타트 데이터 파일들을 잘 모아서 AI에게 학습시킨다면, 실패 확률을 미리 예측하고 솔빙 타임을 약 80~90% 수준으로 정확하게 예측할 수 있다는 것을 확인했다”며 “이를 통해 HPC 자원의 병목현상에 의한 대기문제를 효율적으로 개선하고 자원 활용성을 극대화하는 방안까지 도출이 가능해졌다”고 말했다.

그는 “이러한 배경 하에, 단순 데이터 레이크에 머물러 있던 보고서 파일들을 정량적인 수치 데이터베이스인 데이터 웨어하우스로 고도화해 데이터 주도 체계를 구축하는 과제를 본격적으로 진행하게 됐다”며 “2년전 1차 고도화 내용으로 ‘보고서 자동화 DB 구축’ 과제를 발표했을 당시 전사적으로 많이 쓰이는 해석 항목 약 200여건을 표준화하고, PPT 보고서의 두 번째 장에 표준화된 DB 테이블 양식을 삽입해 사용자가 수치를 직접 입력한 뒤 업로드하면 시스템이 이를 자동으로 파싱해 DB화하는 프로세스를 마련했다”고 설명했다.

[무료 웨비나] 복잡한 레거시 환경에서 AI를 안전하게 확장하고 비즈니스 혁신을 가속화하는 방법

일시 : 2026년 7월 23일 (목) 14:00 ~ 15:00

그는 “결론적으로 현업에서 거의 사용되지 않았는데, 가뜩이나 바쁜 엔지니어들에게 보고서 양식을 다운받아서 수치들을 일일이 타이핑하라고 요구하는 것 자체가 일하는 방식 측면에서 큰 무리였던 것”이라며 “이에 현업의 일하는 방식을 단 1%도 바꾸지 않고, 엔지니어는 기존 업무방식대로 PPT 보고서만 자유롭게 작성해서 업로드하면 시스템이 알아서 수치를 뜯어내 DB화하는 혁신적인 기법을 고민하게 됐다”고 덧붙였다.

초기 단계 단순히 대형언어모델(LLM)을 이용해 엔지니어의 문서를 DB로 전환하기에 무리였다. 일반적 LLM 수준으로 복잡한 PPT 요약 장표의 표나 객체 데이터를 정밀하게 읽어내지 못하기 때문이다. 과거 구형 포맷 문서를 변환하는 과정에서 표의 라인이 깨지거나 텍스트 객체가 이미지로 묶여 뭉개지는 현상이 잦았다고 한다.

최 연구원은 “이를 극복하기 위해 단순히 텍스트만 읽는 모델이 아니라, 시각 정보를 동시 분석하는 비전 언어 모델인 LVLM을 도입해 4단계 데이터 추출 프로세스를 구축했다”고 밝혔다.

‘데이터 전처리’ 단계는 슬라이드 내 텍스트, 표, 이미지를 분리하고, ‘키워드 쌍 추출’ 단계에서 표를 자리표시자로 대체해 주변 정보를 먼저 스크리닝하며, ‘정밀 추출’ 단계에서 거대 비전 언어 모델이 표 내부 로우와 컬럼 관계를 추적해 핵심 데이터값을 도출했다. ‘결과 병합 및 후처리’ 단계에서 데이터와 표 내부로부터 추출한 데이터의 정량적 결과 값을 하나의 JSON 포맷 데이터 스크립트로 병합했다. 이 과정에서 AI 모델은 자기개선 루프’를 통해 스스로 추출 결과의 오류를 성찰하고 반복 수정한다.

그는 “추출 프로세스를 전사 시스템에 유기적으로 연동하기 위해 생산기술원 슈퍼컴퓨터 센터와 플랫폼 간의 DB 파이프라인 아키텍처를 구축 완료했다”며 “엔지니어가 각자 로컬 PC에서 해석을 돌리던 과거와 달리, 현재는 라이센스 효율화와 대규모 연산을 위해 전사 엔지니어들이 본부 HPC 인프라에 접속해 작업을 수행하고 있다”고 밝혔다.

그리고, 그는 정교하게 정형화된 DB 테이블 구축으로 가능해진 현업의 엔지니어링 혁신 3가지로 특이값 분석, 설계 패턴 분석, 경향 분석 등의 예를 소개했다.

그는 “이 프로젝트의 가장 큰 성과는 현업 엔지니어들의 일하는 방식을 전혀 바꾸지 않고도 방대한 비정형 보고서 데이터를 완벽하게 자사 정형 자산으로 전환하는 SPDM CAE DB 시스템을 성공적으로 정립했다는 점”이라며 “기존에 사용자가 수치를 직접 입력해야 해서 완전히 실패했던 표준 양식 입력 메커니즘 한계를 깨부수고, 현업의 자율성을 100% 보장하는 AI 에이전트 파이프라인을 구축함으로써 데이터베이스에 대한 접근성과 편의성을 극대화했다”고 밝혔다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network