[파이낸셜뉴스] NC AI가 로봇 지능의 핵심 기술로 꼽히는 ‘월드 파운데이션 모델'(WFM) 연구 성과를 공개하며 글로벌 피지컬 AI 경쟁에 본격적으로 도전장을 던졌다. 대규모 연산 자원이 필수로 여겨지는 월드모델 분야에서 글로벌 최고 수준(SOTA) 대비 80%에 달하는 성능을 확보하면서도 컴퓨팅 자원 사용량을 25% 수준으로 낮춰 효율성을 입증했다.
NC AI는 월드 파운데이션 모델을 성공적으로 시연하고, 고난도 로봇 조작 태스크에서 의미 있는 성능을 확인했다고 16일 밝혔다. 월드모델은 로봇이 실제 세계의 물리적 환경을 이해하고 예측하며 행동하도록 만드는 피지컬 AI의 핵심 기술로, 글로벌 빅테크들이 대규모 투자를 진행하고 있는 분야다.
현재 로봇 AI 산업의 가장 큰 기술적 난제로 꼽히는 것은 ‘Sim2Real(시뮬레이션-현실)’ 격차다.
NC AI는 시각적 모방을 넘어 현실의 물리 법칙까지 정밀하게 예측하는 월드모델을 통해 이 문제에 접근했다. 기존 월드모델이 영상 생성 후 VLM(비전-언어 모델)을 통해 행동을 추론하는 구조였다면, NC AI의 모델은 영상 생성 이전 단계인 잠재공간 정보에서 바로 행동을 생성하도록 설계했다. 이를 통해 영상 생성과 추론 단계를 줄여 연산 효율을 높이면서도 정확도를 동시에 확보했다는 설명이다.
성능 지표 역시 실무 적용 가능성을 보여줬다. 로봇 팔의 복잡한 동작을 제어하는 24개의 고난도 로봇 조작 태스크를 기준으로 테스트한 결과 전체 평균 성능은 글로벌 최고 수준 모델 대비 약 70% 수준을 기록했다. 특히 현장 적용과 직결되는 상위 18개 핵심 태스크에서는 엔비디아 코스모스 등 최고 성능 모델 대비 약 80% 수준의 성공률을 달성했다.
이번 연구의 또 다른 특징은 자원 효율성이다. NC AI는 글로벌 최고 성능 모델 파인튜닝에 필요한 GPU 자원의 약 25%만으로 월드모델 학습을 수행했다. 막대한 인프라 투자 없이도 최적화된 학습 구조를 통해 글로벌 톱 수준의 기술적 가능성을 확인했다는 의미다.
로봇 학습에 필요한 데이터 문제 해결에도 접근했다. NC AI는 월드모델 기반 합성 데이터 생성 파이프라인을 통해 대규모 산업 데이터를 빠르게 생성할 수 있는 환경을 구축했다. A100 GPU 1대를 기준으로 10초 분량의 비디오를 약 80초 만에 생성할 수 있으며, H100 GPU 100대를 활용할 경우 약 1만 시간 분량의 합성 비디오 데이터를 11일 만에 생성할 수 있다는 설명이다.
이 기술은 반도체 클린룸, 철강 공정, 조선소 작업 환경 등 실제 산업 현장에서 필요한 다양한 상황을 가상 환경에서 생성해 로봇 학습에 활용할 수 있다는 점에서 의미가 있다.
NC AI는 현재 리얼월드, 삼성SDS, 씨메스, 레인보우로보틱스 등 기업과 함께 ETRI, KETI, 한국자동차연구원 등 연구기관, KAIST·서울대·고려대 등 학계가 참여하는 ‘K-피지컬 AI 얼라이언스’에도 참여하고 있다. 정밀 물리 시뮬레이션부터 로봇 실증까지 이어지는 생태계 구축을 통해 산업 현장 적용을 확대한다는 전략이다.
이연수 NC AI 대표는 "이번 WFM 연구 성과는 막대한 연산 자원에만 의존하던 기존의 로봇 AI 개발 방식에서 벗어나, 정밀한 물리 이해와 최적화된 학습 아키텍처를 통해 글로벌 톱티어 수준의 실질적 유효성을 증명해 냈다는 데 큰 의의가 있다"며 "글로벌 피지컬 AI 패권을 주도하는 핵심 경쟁력으로 키워나갈 것"이라고 말했다.
yjjoe@fnnews.com 조윤주 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지