휴머노이드 로봇 기업 Noetix Robotics, 2000대 수주 돌파 및 심층강화학습 핵심 기술 공개

2025년 06월 11일

Noetix Robotics

Noetix Robotics, 반년 만에 2000대 수주·100억원 계약 달성

중국 휴머노이드 스타트업 Noetix Robotics(松延动力, 송연동력)이 단 반년 만에 2000대 수주와 100억원 규모의 계약을 체결하며 중국 휴머노이드 시장에서 돌풍을 일으키고 있다.

6월 5일 베이징 전연국제인공지능연구원이 주최한 ‘Noetix Robotics 탐방’ 행사에서 창립자 겸 이사장 장저위엔(姜哲源)은 자사의 휴머노이드 ‘샤오완퉁(小顽童)’이 이좡 휴머노이드 하프마라톤 대회에서 은메달을 획득한 후 한 달 만에 1000대 이상의 주문을 받았다고 밝혔다. 현재 총 주문 규모는 2000대를 돌파했으며, 총 계약 금액은 1억 위안(약 185억원)을 넘어섰다.

Noetix Robotics의 급성장 배경에는 휴머노이드의 운동 능력을 획기적으로 향상시키는 심층강화학습(Deep Reinforcement Learning) 기술이 자리 잡고 있다. 장저위엔은 이번 행사에서 심층강화학습 기술의 핵심 원리와 응용 방법을 상세히 공개했다.

심층강화학습으로 휴머노이드 운동능력 혁신

Noetix Robotics은 현재 두 가지 제품군을 운영하고 있다. 첫 번째는 N2와 E1을 포함한 이족보행 휴머노이드이고, 두 번째는 시뮬레이션 휴머노이드이다. 회사의 목표는 로봇이 실제로 가정에 들어가는 것이다.

장저위엔은 휴머노이드의 운동 성능 향상을 위한 핵심 기술로 심층강화학습을 제시했다. 그는 “인간이 의사결정을 내릴 때 시행착오, 반복 기억, 개선의 과정을 거치는 것처럼, 강화학습도 끊임없는 실수와 개선을 통해 학습한다”고 설명했다.

심층강화학습은 수학적으로 마르코프 의사결정과정(MDP)으로 표현된다. MDP는 다음 순간의 상태가 현재 순간의 상태와만 관련이 있고 이전 순간의 상태와는 무관하다는 원리다. 이는 S(상태 집합), A(동작 집합), P(상태 전이 함수), r(보상 함수), γ(할인 인자)로 구성된 5개 요소 튜플로 표현할 수 있다.

구체적으로 로봇에 적용하면, S는 각 관절의 각도, 지면 환경, 모터 온도 등을 나타내고, A는 동작의 집합이며, P는 로봇의 다음 순간 상태의 확률 분포를 의미한다. 특히 r(보상 함수)는 로봇이 인간과 유사하게 달릴수록 높은 보상을 받도록 설계되어 있다.

4단계 응용 프로세스로 완성되는 로봇 제어

Noetix Robotics의 심층강화학습 응용 프로세스는 4단계로 구성된다. 첫 번째는 알고리즘 설계, 두 번째는 시뮬레이션 훈련, 세 번째는 sim2sim(시뮬레이션 간 검증), 네 번째는 실제 로봇 배치다.

시뮬레이션 환경의 필요성에 대해 장저위엔은 “절대적으로 안전한 테스트 환경, 고도의 병렬 컴퓨팅 가능성, 상태 추정과 전략 학습의 편의성, 알고리즘 검증 및 최적화 효율성 향상”을 주요 이유로 들었다.

Noetix Robotics은 엔비디아의 아이잭짐(IsaacGym)을 기반으로 훈련을 진행한다. 아이잭짐은 효율적인 병렬 컴퓨팅 능력, 딥러닝 프레임워크와의 완벽한 통합, 높은 정밀도의 물리 시뮬레이션, 풍부한 사례 등의 장점을 갖고 있다.

sim2sim 검증 단계에서는 현재 로봇 분야에서 가장 높은 정밀도를 자랑하는 무조코(Mujoco) 시뮬레이터를 활용해 테스트를 진행한다. 이를 통해 실제 로봇 배치 전 한 번 더 검증 과정을 거치게 된다.

동작 공간과 상태 공간 설계에서 동작 공간은 로봇 관절의 각도와 토크 등을 의미하며, 완전성, 효율성, 합법성을 갖춰야 한다. 상태 공간 설계는 작업 분석, 정보 선별, 범용성 고려, 효과 검증의 과정을 거친다.

Noetix Robotics

산업 초기 단계에서 창조되는 새로운 시장 수요

베이징 전연국제인공지능연구원 이사장 겸 잉노엔젤펀드 파트너 왕성은 “이 연구원의 위치는 전통적인 연구원과 다르다. 우수한 과학자, 금융기관, 미디어, 사회과학 전문가를 연결하여 과학기술 성과의 실용화를 추진하는 것에 더 주력한다”고 밝혔다.

투자자 관점에서 왕성은 최근 2년간 국내 AI 산업 격변에 대한 견해를 피력했다. AI 기업들이 규모와 방향 면에서 변화를 보이고 있지만, 대기업들의 격변은 상대적으로 안정적이며 기존 격변을 바꾸기는 어렵다고 분석했다. 미래에는 기업의 비즈니스 모델, 매출, 이익 및 미래 가치가 투자의 핵심 고려 요소가 될 것이라고 전망했다.

현재 AI 분야의 선두 기업들, 특히 대기업들은 AI 사업부와 신기술 탐색에 대한 투자를 지속적으로 확대하고 있으며, 대형 모델 분야에서의 지속적인 투자를 강조하고 있다. 주요 방향은 국제 경쟁력 강화, 추론 능력 향상, 적절한 응용 범위 확대에 집중되어 있다.

베이징 전연국제인공지능연구원 원장 겸 잉노엔젤펀드 창립 파트너 리주는 “AI 대파도가 이제 막 시작되었다”며 “현재 슈퍼 애플리케이션이 아직 나타나지 않은 이유는 슈퍼 터미널이 아직 성숙하지 않았기 때문”이라고 분석했다. 미래에는 안경 등의 형태로 된 슈퍼 터미널에서 새로운 슈퍼 애플리케이션이 탄생할 것으로 전망했다.

구체적으로 구현지능 산업에 대해서는 아직 완전한 공감대가 형성되지 않은 산업이며, 기술 패러다임이 수렴되지 않았기 때문에 현재는 기술 경로와 방향이 백화제방하는 단계라고 평가했다.

혁신적 시장 창출과 다양한 응용 분야 확대

구현지능 업계에 대해 왕성은 이 업계의 발전이 초기 단계에 있으며, 현재 수요는 대학과 연구소 등에 집중되어 있지만, 결혼식 회사 등 소비 시나리오에서의 렌탈 수요도 창출되고 있다고 분석했다. 시장 발전에 따라 이 업계에서는 더 많은 수요가 창조될 것으로 전망된다.

Noetix Robotics의 새로운 공장은 베이징시 창핑구에 위치한다. 베이징시 ‘일남일북’ 로봇 트랙 중점 배치 지역 중 하나인 창핑구는 이미 각종 신형 기업 97개를 보유하고 있으며, 산업 수입이 100억 위안을 넘어섰다.

심층강화학습 기술의 로봇 응용은 운동 제어, 잡기, 내비게이션 장애물 회피 등 다양한 분야에 활용되고 있다. 특히 Noetix Robotics가 마라톤 대회에서 사용한 근접 최적화 알고리즘(PPO) 등의 기본 알고리즘들이 실제 성과를 입증했다.

휴머노이드가 시뮬레이션에서 실제 세계로 이전 될 때는 환경 모델링 차이, 로봇 모델링 차이, 제어 차이, 하드웨어 플랫폼 제한 등의 문제에 직면한다. 실제 로봇 배치 단계에서는 시스템 안정성과 신뢰성, 디버깅 및 검증의 편의성, 모델 배치 반복 등을 고려해야 한다.

Noetix Robotics의 하반기 중요 업무는 로봇 배송 보장이다. 2000대 이상의 주문을 소화하기 위해서는 생산 능력 확대와 품질 관리가 핵심 과제가 될 전망이다.

리주는 “미래 15년 내에 중국 경제에 가장 큰 영향을 미칠 변수는 AI”라며 “이것이 베이징 전연국제인공지능연구원이 이 분야에 집중하는 핵심 이유”라고 강조했다.

구현지능 산업의 발전은 여전히 초기 단계에 있지만, Noetix Robotics의 성공 사례는 기술 혁신과 상업화의 가능성을 보여준다. 마라톤 은메달에서 2000대 주문까지, Noetix Robotics의 성장 스토리는 중국 휴머노이드 산업의 새로운 가능성을 제시하고 있다.

[참고 기사]
https://zhidx.com/p/484177.html