중국 360그룹이 차세대 AI 에이전트 플랫폼 ‘나노AI(纳米AI)’의 대규모 업그레이드를 발표하며, 업계 최초로 L4급 다중 에이전트 시스템을 선보였다. 이번 업그레이드의 핵심은 ‘멀티 에이전트 스웜(Swarm)’ 기술로, 여러 AI 에이전트가 협업하여 복잡한 창작 업무를 자동화할 수 있다는 점이다.

혁신적인 ‘원클릭 영상 제작’ 기능 구현
나노AI의 가장 주목할 만한 기능은 단 한 줄의 텍스트 지시 만으로 최장 10분의 고품질 AI 영상을 자동 생성할 수 있다는 점이다. 기존의 영상 생성 모델들이 복잡한 프롬프트와 여러 번의 반복 작업을 요구했던 것과 달리, 나노AI는 사용자가 간단한 아이디어나 캐릭터 이미지, 스크립트만 입력하면 완성도 높은 영상을 자동으로 제작한다.
실제 시연에서는 기자 관점에서 서유기 캐릭터들을 인터뷰하는 특집 영상이 생성되었는데, 전체 과정이 자연스럽고 캐릭터 스타일의 일관성이 완벽하게 유지되었다. 특히 기자 신분증, 백골정·홍해아·금각대왕 등 캐릭터들의 정확한 재현, 다중 캐릭터의 입 모양과 음성 동기화까지 세밀하게 구현되어 업계의 주목을 받고 있다.
다중 에이전트 벌떼 시스템의 핵심 기술
나노AI가 이러한 혁신적 성과를 달성할 수 있었던 배경에는 독창적인 ‘멀티 에이전트 스웜(Swarm)’ 시스템이 있다. 이 시스템은 마치 전문 제작팀을 구성하는 것처럼 여러 전문 AI 에이전트들이 협업하여 복잡한 창작 과정을 수행한다.
영상 제작 과정에서 슈퍼 성우, 지능형 그래픽 전문가, 고급 촬영 감독, 고급 편집자, 영상 후반 작업 전문가 등 다양한 역할의 에이전트들이 자동으로 팀을 구성한다. 이들은 창의적 기획, 스토리보드 설계, 화면 생성, 더빙 및 배경음악, 편집 합성을 포함한 전체 과정을 투명하게 처리하며, 스타일 선택, BGM 선택, 스크립트 수정 등은 사용자가 실시간으로 개입하여 조정할 수 있다.
특히 주목할 점은 토큰 사용량이 1,437만+에 달해 업계 일반적인 100만 토큰 상한선보다 한 자릿수 높은 처리 능력을 보여준다는 것이다. 이는 기존 시장 솔루션 대비 1분 영상 제작 비용을 95% 이상 절감할 수 있음을 의미한다.
포괄적인 멀티모달 콘텐츠 생성 능력
나노AI의 활용 범위는 영상 제작에 국한되지 않는다. 단편 드라마 제작에서는 아인슈타인이 적벽대전에 등장하는 상상의 시나리오를 구현하고, 전자상거래 영역에서는 일론 머스크가 중국어로 제품을 소개하는 영상을 생성하는 등 다양한 창작 시나리오를 지원한다.
현재 나노AI는 10개 이상의 멀티 에이전트 스웜을 제공하며, 영상 제작, 콘텐츠 창작, 산업 연구, 전자상거래 마케팅, 여행 계획 등 다양한 시나리오를 커버한다. 사용자는 프로그래밍 언어 대신 자연어를 사용하여 자신만의 에이전트 팀을 DIY 방식으로 구성할 수 있다.
기술적 혁신과 안정성 확보
멀티 에이전트 협업에서 가장 큰 도전은 안정성 확보다. 단일 에이전트의 성공률이 90%라면 5개 에이전트 협업 시 성공률은 50% 이하로 떨어질 수 있으며, 다단계 워크플로에서의 오류율은 지수적으로 누적된다. 100단계 이상의 작업에서 90% 성공률을 보장하려면 단일 작업 성공률이 99.9%에 달해야 한다.
360은 이 문제를 해결하기 위해 다단계 실행에 최적화된 자체 개발 대형 모델 ‘360 Zhinao 72B’를 구축했다. 이 모델은 100단계 성공률 98.2%를 달성하여 Claude 3.7의 99%에 근접하면서도, 1,000토큰 당 비용은 Claude 3.7보다 80% 저렴하다.
또한 고성능 MCP 인프라스트럭처와 에이전트 인프라스트럭처를 자체 개발하여 MCP 성공률과 에이전트 신뢰성을 보장한다. 에이전트의 자체 수리 및 반성 메커니즘을 설계하여 모델 능력을 충분히 활용해 오류를 자동으로 복구하며, 1초 빠른 시작이 가능한 경량 클라우드 가상머신을 구축하여 업계 대비 30% 높은 단일 머신 성능을 구현했다.
L4급 에이전트 시대의 새로운 표준 정의
360의 나노AI 업그레이드는 에이전트 기술 발전에서 중요한 이정표가 되고 있다. 자율주행 기술의 레벨 분류를 참고하여 에이전트 발전 단계를 구분하면, L1은 초기 ChatGPT/GPT와 같은 채팅 어시스턴트, L2는 Dify 같은 로우코드 워크플로 도구, L3는 추론 능력을 갖춘 전문 에이전트, 그리고 L4는 이번 나노AI가 구현한 멀티 에이전트 스웜 협업 단계로 분류할 수 있다.

나노AI의 멀티 에이전트 스웜 시스템은 360 에이전트 팩토리, 멀티 에이전트 스웜 엔진, 멀티 에이전트 스웜 협업 공간 등 세 부분으로 구성된다. 5만 개의 에이전트를 보유한 에이전트 팩토리는 사용자가 필요에 따라 ‘인재’를 선별할 수 있는 ‘슈퍼 인재 시장’ 역할을 한다.
특히 멀티 에이전트 스웜 협업 공간 기술은 업계 최초로, 멀티 에이전트 협업 시 ‘기억’을 공유하여 작업 계획, 협업 실행, 자체 반복, 지속적 진화를 실현한다. 이를 통해 기존 멀티 에이전트 협업에서 발생했던 ‘협업 딜레마’ 문제를 성공적으로 해결했다.
생산성 도구로서의 에이전트 진화
나노AI의 이번 업그레이드는 에이전트를 기술 도구 개념에서 표준화 된 생산력 도구로 전환 시키는 의미를 갖는다. 에이전트가 보조 도구에서 자율적으로 협업 할 수 있는 ‘디지털 팀’으로 진화함으로써, 일반 사용자도 제로 문턱에서 집단 지혜를 활용해 전문가급 작업을 완수할 수 있게 되었다.
360의 창업자 저우홍이(周鸿祎)는 “단일 에이전트가 아무리 강력해도 ‘도구’ 수준의 한계가 있다. 협업 프레임워크를 통해 서로 다른 능력의 ‘도구’들을 유기적으로 결합하여 복잡한 문제를 해결할 수 있는 ‘시스템’을 형성하는 것이 시스템 아키텍처의 매력”이라고 평가했다.
이러한 기술적 진보는 개인의 핵심 경쟁력이 멀티 에이전트 ‘무리’를 조종, 구성, 관리하는 능력에 달려있다는 새로운 작업 패러다임을 제시한다. 이 능력을 보유한 사용자는 에이전트 시대의 ‘슈퍼 개체’가 될 것으로 전망된다.
현재 나노AI는 매일 무료 사용 횟수를 제공하여 일반 사용자들도 쉽게 체험할 수 있으며, 이는 고비용의 전문 영상 제작 서비스를 대중화 시키는 중요한 계기가 될 것으로 보인다.