본 포스팅은 소정의 원고료를 지원받아 작성되었습니다.
.jpg?type=w966)
AI 이야기를 할 때 보통은 더 빠른 GPU, 더 큰 모델, 더 똑똑한 챗봇을 먼저 떠올립니다. 그런데 최근 흐름을 보면 모델만큼 자주 나오는 단어가 있습니다. 바로 데이터입니다. 특히 로봇과 자율주행처럼 현실에서 움직이는 피지컬 AI에서는 데이터 문제가 더 크게 보입니다. 보도에 따르면 NVIDIA는 2025년 합성데이터 기업 Gretel을 인수한 것으로 알려졌습니다. 금액도 적지 않았다는 보도가 이어졌습니다. 단순히 데이터 회사를 하나 더 산 뉴스로 보기보다, AI 산업이 어디로 이동하는지 보여주는 장면으로 보는 편이 맞습니다.

가상에서 잘하던 AI가 현실에서 흔들리는 이유 피지컬 AI는 실제 공간에서 움직여야 합니다. 로봇이 물건을 집고, 자율주행 시스템이 주변을 보고, 공장 설비가 불량을 판단하는 식입니다. 화면 안에서 문장을 만드는 AI와는 완전히 다른 문제가 생깁니다.


가상 환경에서는 잘 작동하던 로봇이 실제 현장에서는 실수할 수 있습니다. 조명이 조금 바뀌거나, 바닥 반사가 달라지거나, 물체의 재질이 바뀌는 것만으로도 결과가 흔들립니다. 업계에서는 이런 차이를 `Sim-to-Real Gap`이라고 부릅니다. 이 간극을 줄이려면 현실과 비슷한 상황을 많이 겪어봐야 합니다. 하지만 실제 공장에서 같은 실험을 수만 번 반복하기는 어렵습니다. 장비와 인력이 필요하고, 실패 상황을 일부러 만드는 것도 부담스럽습니다.

실패 데이터가 학습 재료가 됩니다 로봇과 산업 AI에서는 성공 장면만큼 실패 장면도 중요합니다. 물건을 제대로 집지 못한 이유, 카메라가 놓친 부분, 조명이 바뀌었을 때 생긴 오판을 알아야 다음 성능을 높일 수 있습니다.

합성데이터는 이런 문제를 풀기 위한 방법 중 하나입니다. 현실에서 직접 만들기 어려운 장면을 가상 환경에서 구성하고, AI가 배울 수 있는 형태로 데이터를 만들어냅니다. 현실 데이터를 완전히 대신한다기보다, 부족한 부분을 촘촘하게 채워주는 역할에 가깝습니다. 예를 들어 카메라 각도, 조명, 소재, 표면 반사, 먼지, 노이즈 같은 조건을 바꿔가며 학습 장면을 만들 수 있습니다. 사람이 일일이 촬영하기 어려운 상황도 시뮬레이션으로 반복할 수 있습니다. 피지컬 AI가 실제 현장에 들어가기 전에 여러 변수를 미리 만나보는 셈입니다. 기업들이 데이터 생산 능력을 보는 이유 AI 모델은 계속 커지고 있지만, 좋은 데이터는 무한하지 않습니다. 인터넷에 있는 데이터를 모아 쓰는 방식만으로는 한계가 있습니다. 특히 제조, 물류, 로봇, 의료, 자율주행처럼 현장성이 강한 분야는 공개 데이터만으로 부족합니다.


그래서 필요한 데이터를 직접 만들 수 있는 능력이 중요해지고 있습니다. NVIDIA가 합성데이터와 로봇 시뮬레이션에 계속 투자하는 것도 같은 흐름으로 볼 수 있습니다. 2025년 공개된 Isaac GR00T N1 관련 발표에서도 로봇 개발을 빠르게 하기 위한 시뮬레이션과 합성데이터 생성 흐름이 함께 언급됐습니다.

이제 AI 경쟁은 모델 성능만의 싸움이 아닙니다. 어떤 데이터를 만들고, 그 데이터를 얼마나 빠르게 학습 자원으로 바꾸느냐가 함께 중요해지고 있습니다. 피지컬 AI가 커질수록 이 흐름은 더 강해질 가능성이 큽니다.

국내 산업에도 필요한 흐름입니다 한국은 제조업과 스마트팩토리 기반이 강한 편입니다. 그만큼 현장에서 나오는 데이터를 AI가 쓸 수 있는 형태로 바꾸는 일이 중요합니다. 단순히 장비를 자동화하는 수준을 넘어, 작업 환경 자체를 디지털 자산으로 만드는 과정이 필요합니다.

스카이인텔리전스는 3D 콘텐츠 기술과 AI를 기반으로 산업 현장의 구조, 객체 간 상호작용, 물리 기반 시뮬레이션을 연결하는 합성데이터 인프라를 준비하고 있습니다. 현실 공간을 디지털 환경으로 옮기고, 그 안에서 AI가 학습할 수 있는 장면을 만드는 방향입니다. 이런 기술은 로봇AI, 스마트팩토리, 비전 검사, 자율 시스템 같은 분야에서 활용 폭이 넓습니다. 앞으로는 장비를 얼마나 잘 만드는가와 함께, 그 장비가 배울 수 있는 데이터 환경을 얼마나 잘 갖추는지도 함께 봐야 합니다. 합성데이터는 AI의 다음 기반입니다 몇 년 전만 해도 AI 이야기는 모델 이름과 성능 비교에 집중됐습니다. 하지만 피지컬 AI 시대에는 질문이 조금 달라집니다. 현실을 얼마나 잘 데이터로 만들 수 있는가, 그리고 그 데이터를 얼마나 빠르게 다시 학습에 연결할 수 있는가가 중요해집니다.

NVIDIA가 합성데이터 기업에 관심을 보인 이유도 이 흐름에서 이해할 수 있습니다. AI가 화면 안을 넘어 로봇, 공장, 자동차, 물류 현장으로 들어갈수록 데이터 생산 능력은 더 큰 역할을 하게 됩니다.

스카이인텔리전스가 바라보는 지점도 여기에 있습니다. 합성데이터는 단순한 기술 용어가 아니라, 피지컬 AI가 실제 산업 현장으로 들어가기 위해 필요한 준비 과정입니다. 앞으로 AI 뉴스를 볼 때는 모델 이름만이 아니라 그 뒤에 있는 데이터 인프라까지 함께 살펴볼 필요가 있습니다.
