LG전자 최상혁 책임연구원(출처=다쏘시스템코리아)
|

LG전자의 AI 에이전트 기반 CAE DB 자동화 구축기

“현업의 일하는 방식을 단 1%도 바꾸지 않고, 엔지니어는 기존 관행대로 PPT 보고서만 자유롭게 작성해서 업로드하면, 시스템이 알아서 수치를 뜯어내 DB화할 수 있게 됐다. AI 모델에게 가장 양질의 엔지니어링 영양분을 제공할 수 있는 데이터 파이프라인 기반이 완성된 덕이다.”

LG전자 최상혁 책임연구원은 지난달 11일 다쏘시스템이 개최한 ‘시뮬리아데이’ 하이테크 세션발표에서 AI 에이전트를 이용한 SPDM CAE 데이터베이스 구축의 효과에 대해 이같이 밝혔다.

시뮬레이션 프로세스 데이터 매니지먼트(SPDM)는 해석에 필요한 절차와 데이터를 체계적으로 관리하는 시스템이다. 엔지니어링 시뮬레이션에 사용되는 모든 데이터를 저장하며, 시뮬레이션의 전체 작업 흐름을 조율한다. SPDM의 목적은 쌓인 데이터를 활용해 CAE를 더 잘 수행하게 하는 것이다. LG전자는 SPDM을 2019년부터 고민하기 시작해 2022년부터 활용하고 있다. 그러나 현업 엔지니어의 활용률이 만족스럽지 못했다. 업무 부하만 늘어나는 시스템은 외면받을 수밖에 없었다.

그는 “CAE 데이터를 다루면서 가장 중요하게 생각하는 본질은 데이터를 단순히 쌓는 단계에서 끝내는 것이 아니라, 쌓인 데이터를 활용해 CAE를 더 잘 수행하는 단계로 발전해야 한다는 점”이라며 “이미 2019년 파일럿 후 2022년 4월에 본부 도입을 완료해 본격적으로 사용하기 시작했고, 현재까지 플랫폼 운영을 통해 방대한 CAE 데이터를 저장 및 관리하고 있다”고 설명했다.

그는 “초기 2~3년 동안은 각 사업부마다 독립된 CAE 조직들이 흩어져 있다 보니 본부에서 SPDM 시스템을 쓰라고 강제해도 현업 엔지니어들이 쉽게 따라주지 않는 조직적인 우여곡절도 많았다”며 “엔지니어들이 ‘도입하면 도대체 우리한테 뭐가 좋냐’고 본질적인 의문을 던졌을 때, 이력 관리나 통계 분석이 자동으로 된다는 교과서적인 답변 외에는 엑셀 서랍이나 팀 서버와 차별화되는 확실한 가치를 증명하기가 어려웠기 때문”이라고 말했다.

구조 해석 분야에서 해석 엔지니어가 가장 많은 시간을 뺏기고 스트레스 받는 부분은 ‘해석의 수렴성’ 문제다. 왜 수렴되지 않는지, 안 되면 인풋 파일의 메시나 옵션을 어떻게 고쳐야 하는지에 상당한 리소스를 소모한다. LG전자는 더 나은 시뮬레이션 결과, 더 효율적인 업무를 위해 AI 활용을 고려했다.

최 연구원은 “플랫폼 내에 쌓이는 솔버의 메시지 파일이나 리스타트 데이터 파일들을 잘 모아서 AI에게 학습시킨다면, 실패 확률을 미리 예측하고 솔빙 타임을 약 80~90% 수준으로 정확하게 예측할 수 있다는 것을 확인했다”며 “이를 통해 HPC 자원의 병목 현상과 펜딩 문제를 효율적으로 개선하고 자원 활용성을 극대화하는 방안까지 도출이 가능해졌다”고 말했다.

그는 “이러한 배경 하에, 단순 데이터 레이크에 머물러 있던 보고서 파일들을 정량적인 수치 데이터베이스인 데이터 웨어하우스로 고도화해 데이터 주도 체계를 구축하는 과제를 본격적으로 진행하게 됐다”며 “2년전 1차 고도화 내용으로 ‘보고서 자동화 DB 구축’ 과제를 발표했을 당시 전사적으로 많이 쓰이는 해석 항목 약 200여건을 표준화하고, PPT 보고서의 두 번째 장에 표준화된 DB 테이블 양식을 삽입해 사용자가 수치를 직접 입력한 뒤 업로드하면 시스템이 이를 자동으로 파싱해 DB화하는 프로세스를 마련했다”고 설명했다.

그는 “결론적으로 현업에서 거의 사용되지 않았는데, 가뜩이나 바쁜 엔지니어들에게 보고서 양식을 다운받아서 수치들을 일일이 타이핑하라고 요구하는 것 자체가 일하는 방식 측면에서 큰 무리였던 것”이라며 “이에 현업의 일하는 방식을 단 1%도 바꾸지 않고, 엔지니어는 기존 관행대로 PPT 보고서만 자유롭게 작성해서 업로드하면 시스템이 알아서 수치를 뜯어내 DB화하는 혁신적인 기법을 고민하게 됐다”고 덧붙였다.

초기 단계 단순히 대형언어모델(LLM)을 이용해 엔지니어의 문서를 DB로 전환하기에 무리였다. 일반적 LLM 수준으로 복잡한 PPT 요약 장표의 표나 객체 데이터를 정밀하게 읽어내지 못하기 때문이다. 과거 구형 포맷 문서를 변환하는 과정에서 표의 라인이 깨지거나 텍스트 객체가 이미지로 묶여 뭉개지는 현상이 잦았다고 한다.

최 연구원은 “이를 극복하기 위해 단순히 텍스트만 읽는 모델이 아니라, 시각 정보를 동시 분석하는 비전 언어 모델인 LVLM 기반의 Qwen3-VL 모델을 도입해 4단계 데이터 추출 프로세스를 구축했다”고 밝혔다.

‘데이터 전처리’ 단계는 슬라이드 내 텍스트, 표, 이미지를 분리하고, ‘키워드 쌍 추출’ 단계에서 표를 자리표시자로 대체해 주변 정보를 먼저 스크리닝하며, ‘정밀 추출’ 단계에서 거대 비전 언어 모델이 표 내부 로우와 컬럼 관계를 추적해 핵심 데이터값을 도출했다. ‘결과 병합 및 후처리’ 단계에서 데이터와 표 내부로부터 추출한 데이터의 정량적 결과 값을 하나의 JSON 포맷 데이터 스크립트로 병합했다. 이 과정에서 AI 모델은 자기개선 루프’를 통해 스스로 추출 결과의 오류를 성찰하고 반복 수정한다.

그는 “자기개선 반복 루프 매커니즘은 거대 비전 언어 모델(Qwen3-VL)이 1차로 추출한 결과에 대해 내부적으로 자기성찰을 거쳐 누락이나 오류가 있는지 피드백을 생성하고, 이를 바탕으로 자기개선을 수행하는 방식”이라며 “이 루프를 만족할 때까지 4~5회 반복 수행해 최종적으로 더 이상 개선이 필요하지 않다고 판단되는 완벽히 정정된 개선 추출 결과를 최종 JSON 형태로 출력하게 된다”고 설명했다.

그는 “추출 프로세스를 전사 시스템에 유기적으로 연동하기 위해 생산기술원 슈퍼컴퓨터 센터와 플랫폼 간의 HPC 탑재 DB 파이프라인 아키텍처를 구축 완료했다”며 “엔지니어가 각자 로컬 PC에서 해석을 돌리던 과거와 달리, 현재는 라이센스 효율화와 대규모 연산을 위해 전사 엔지니어들이 본부 HPC 인프라에 접속해 작업을 수행하고 있다”고 밝혔다.

그에 의하면, 먼저 미세조정을 위한 데이터 라벨링 단계에서 시스템 내부에 비정형 데이터 추출 AI를 개발하기 위해, 기존에 저장됐던 수만건의 해석 보고서 이미지에서 제품군, 프로젝트명, 부품명, 설계 변경 전후 사양, 해석 결과 데이터들을 바운딩 박스로 지정하고 텍스트 구조화 어노테이션 데이터셋을 구축해 선행 학습을 진행했다. 이어 보고서 추출 LMM 파이프라인 구동 단계에서 유저가 매일 신규 보고서나 사전 보고서를 업로드하면, 파이프라인 아키텍처에 의해 SPDM 시스템 내부의 해석 기준 정보와 결합시켰다. 이 정보가 HPC AI 인프라의 GPU 자원을 사용하는 보고서 추출 전용 AI 언어 모델로 유입돼 고속으로 AI 추출 작업이 수행된다.

다음으로 유사어 매핑 및 정형화 단계에서 엔지니어들마다 보고서에 제각각 다르게 적어놓은 비표준 단어나 변수명을 시스템 표준 기준 정보 단어로 치환하는 유사어 매핑 프로세스를 거쳐 최종 비정형 마스터 DB로 적재했다. 마지막으로 정형 테이블 DB 변환 및 지식화 단계에서 적재된 데이터가 프로젝트 이름, 프로젝트 코드, 부서명, 해석의뢰명, 해석 종류 등의 정형 데이터 포맷 테이블로 즉각 변환돼 RDB에 저장된다. 이 파이프라인을 통해 최종적으로 개발-해석 이력 추적, 화면의 통계 분석, 그리고 시험-해석 정확도 자동 비교 분석이 가능한 완벽한 지식화 시스템이 완성됐다.

그는 구축된 파이프라인을 통해 구현된 실제 시스템 구동 화면과 DB 테이블 활용 방안을 설명했다. 시스템 GUI 창 최상단 카테고리 필터에서 ‘Kitchen Solution’과 ‘Refrigerator’ 제품군을 선택하고, 해당 제품군과 연동된 수많은 전사 표준 해석 항목이 기준 정보 리스트로 좌측에 정렬됐다. 사용자가 냉장고 도어 부품의 무급유 실도 가적재 바구니 해석 항목을 클릭하면, AI가 기존 PPT 보고서 수천 장에서 자동으로 뜯어내 병합해 둔 해석 항목, 프로젝트명, 부품명, 해석 유형, 설계 담당자, 해석 담당자, 완료일, 정량적 최대 응력 및 변형량 결과 수치 등이 엑셀 형태로 정렬된 하나의 거대한 정형 DB 테이블로 가시화돼 화면에 출력됐다. 하단 스페이스에 내장된 데이터 시각화 툴을 통해 사용자가 원하는 X축, Y축 변수를 지정하는 것만으로 프로젝트별 해석 결과의 거동 패턴과 경향성 그래프가 실시간으로 그려졌다.

그리고, 그는 정교하게 정형화된 DB 테이블 구축으로 가능해진 현업의 엔지니어링 혁신 3가지를 소개했다. 첫번째는 특이값(Anomaly) 분석으로, 냉장고 힌지 부품과 PD 스토퍼 부품의 연도별 해석 결과 데이터를 데이터 시각화 박스 플롯으로 정렬해 보면, USL 규격을 벗어나는 특정 이상치 데이터들이 즉각적으로 스크리닝된다. 주니어 엔지니어는 조건 설정을 실수했거나 비정상적인 메시 설정으로 인해 튀어나온 불량 해석 케이스들을 사전에 차단하고 보고서 신뢰성을 검증하는 의사결정 보조 지표로 활용할 수 있다.

두번째는 설계 패턴 분석이다. 세탁기 드럼 리어 부품의 구조 설계 변경 시, 과거에 두께나 형상을 가변 했을 때 단품 성형 해석, 드럼 강성 해석, 세트 진동/소음 해석 결과 데이터들이 어떤 유기적인 피드백 패턴으로 변해왔는지를 이력 테이블을 통해 한눈에 파악할 수 있다. 이 해석을 수행할 때 어떤 항목들을 필수적으로 체크해야 하는지 AI가 최적의 검증 가이드 리스트를 자동으로 뽑아내준다.

세 번째는 경향 분석이다. 특정 구조 변수의 가변 거동에 따른 폰 미세스 최대 응력 값의 마진 변화 추이를 주파수 및 시간 도메인 상에서 미세 마진 단위로 정밀하게 모니터링하여 구조적 안전성을 다각도로 검토할 수 있다.

그는 “이 프로젝트의 가장 큰 성과는 현업 엔지니어들의 일하는 방식을 전혀 바꾸지 않고도 방대한 비정형 보고서 데이터를 완벽하게 자사 정형 자산으로 전환하는 ‘LVLM 기반 자동 데이터 추출 및 SPDM CAE DB 시스템’을 성공적으로 정립했다는 점”이라며 “기존에 사용자가 수치를 직접 입력해야 해서 완전히 실패했던 표준 양식 입력 메커니즘 한계를 깨부수고, 현업의 자율성을 100% 보장하는 AI 에이전트 파이프라인을 구축함으로써 데이터베이스에 대한 접근성과 편의성을 극대화했다”고 밝혔다.

그는 “최근 현업 사용자들이 단순히 그래프를 직접 조회하는 것을 넘어 AI 챗봇 인터페이스에 대단히 익숙해져 있다”며 “보고서 내부의 핵심 정량 데이터들을 이처럼 완벽한 JSON 테이블 DB 형태로 가공해 두면, 향후 전사 LLM/LMM 솔루션의 기초 벡터 DB로 참조 체계를 연동했을 때 일반 비정형 텍스트 문서를 통째로 임포트 시켰을 때보다 수치적인 분석이나 결과 질의 응답에 대해 수십 배 이상 빠르고 정확하며 상세하게 강력한 답변을 정밀하게 출력해 내는 강력한 지식 자산으로 활용할 수 있을 것”이라고 덧붙였다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network

일간 바이라인 구독하기

2 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.