베이징 인공지능 아카데미(BAAI), AI 가상-현실 융합 ‘오우지에(悟界)’ 시리즈 대형모델 발표

2025년 06월 12일

BAAI

중국의 대표적인 AI 연구 기관인 BAAI(베이징 인공지능 아카데미, 智源研究院)이 지난 6월 6일, 제 7회 BAAI 컨퍼런스에서 차세대 대형 모델인 ‘오우지에(悟界)’ 시리즈를 공식 발표했다. 이는 AI가 디지털 세계에서 물리적 세계로 확장되는 기술 트렌드에 대응한 혁신적인 솔루션으로 평가 받고 있다.

BAAI는 이전 ‘오우다오(悟道)’ 시리즈로 중국 대형모델 시대의 서막을 열었으며, 이번 오우지에 시리즈는 AI 발전의 다음 단계를 향한 대표작으로 자리매김하고 있다. 특히 이번 컨퍼런스에는 4명의 튜링상 수상자를 포함해 30여 명의 기업 창업자 및 CEO, 100여 명의 젊은 과학자, 200여 명의 AI 최고 학자 및 산업 전문가들이 참석해 180여 회의 AI 주제 발표를 진행했다.

미시적 생명체부터 구현지능까지, 4대 핵심 모델 공개

오우지에 시리즈 대형모델은 AI와 물리적 세계 간의 상호작용 경계를 확장하기 위해 개발되었으며, 미시적 생명체부터 구현지능체까지 아우르는 4개의 핵심 모델로 구성되어 있다.

네이티브 멀티모달 세계모델 Emu3와 뇌과학 모델 Brainμ

첫 번째 모델인 네이티브 멀티모달 세계모델 Emu3는 다음 토큰 예측 패러다임을 기반으로 멀티모달 학습을 통합하여 더 많은 모달리티로 확장이 용이하도록 설계되었다. 새로운 시각적 토크나이저를 개발하여 이미지와 비디오를 텍스트와 같은 구조의 이산 기호 시퀀스로 인코딩함으로써, 모달리티에 무관한 통일된 표현 공간을 구축했다. 이를 통해 텍스트, 이미지, 비디오의 임의 조합 이해와 생성이 가능하다.

두 번째로 주목받는 것은 뇌과학 분야의 멀티모달 범용 기초모델인 ‘지엔웨이 Brainμ(見微Brainμ)’이다. 이 모델은 Emu3의 하부 아키텍처를 기반으로 하여 fMRI, EEG, 이광자 등 신경과학 및 뇌의학 관련 뇌신호를 통일적으로 토큰화한다. 사전 훈련된 모델의 멀티모달 정렬 장점을 활용하여 다방향 매핑을 실현하며, 단일 모델로 다양한 신경과학 하위 작업을 완수할 수 있다.

현재 Brainμ는 신경과학 분야의 여러 대규모 공개 데이터셋과 다수 협력 실험실의 고품질 신경과학 데이터를 통합하여 100만 단위 이상의 신경신호 사전훈련을 완료했다. BAAI는 이미 국내 최고 뇌과학팀, 뇌질환 연구팀, 뇌-컴퓨터 인터페이스 응용팀과 협력을 구축했으며, 뇌-컴퓨터 인터페이스 회사인 치앙나오커지(强脑科技)와의 협력을 통해 휴대용 소비자급 뇌전도 시스템에서 감각 신호 재구성을 최초로 실현했다.

크로스 본체 구현지능 협작 프레임워크 RoboOS 2.0

구현지능 분야에서는 AI와 거시적 물리세계 상호작용의 핵심 매개체로서 ‘크로스 본체 구현 대소뇌 협력 프레임워크 RoboOS 2.0’을 발표했다. 이는 전 세계 최초로 구현지능 SaaS 플랫폼을 기반으로 하며, 서버리스 원스톱 경량화 로봇 본체 배포를 지원하는 오픈소스 프레임워크다. 동시에 RoboOS 2.0은 전 세계 최초로 MCP를 지원하는 크로스 본체 구현 대소뇌 협력 프레임워크로, 구현지능 분야의 ‘앱스토어’ 생태계 구축을 목표로 한다.

RoboOS 2.0은 소뇌 기능의 무적응 등록 메커니즘을 실현하여 개발 진입장벽을 대폭 낮췄다. 일반적인 시나리오에서 관련 코드량이 기존 수동 등록 방식의 1/10에 불과하다. 1.0 버전과 비교하여 RoboOS 2.0은 엔드투엔드 추론 체인에 대한 시스템 수준 최적화를 진행했으며, 전체 성능이 30% 향상되었고, 전체 체인 평균 응답 지연시간은 3ms 이하로 줄었으며, 엔드-클라우드 통신 효율성은 27배 향상되었다.

구현대뇌 RoboBrain 2.0은 현재 전 세계 최강의 오픈소스 구현대뇌 대형모델로, 다양한 공간 추론 및 작업 계획 지표에서 주류 대형모델을 능가한다. RoboOS 2.0과 RoboBrain 2.0은 프레임워크 코드, 모델 가중치, 데이터셋 및 평가 기준을 포함하여 완전히 오픈소스로 공개되었다.

전원자 미시생명모델 OpenComplex2

물리세계의 또 다른 중요한 구성요소인 미시세계를 위해서는 전원자 미시생명모델 OpenComplex2가 개발되었다. 이 모델은 생물분자 연구에서 정적 구조 예측에서 동적 형태 분포 모델링으로의 중대한 돌파를 실현했다. 생물분자 시스템의 연속적 진화 에너지 랜드스케이프를 표현할 수 있으며, 확산 생성 모델링과 생물 실험 데이터의 융합을 통해 원자 분해능 수준에서 분자 상호작용 및 평형 형태 분포를 포착한다.

디지털에서 물리세계로, AI 실용화 가속

오우다오에서 오우지에 시리즈 대형모델 발표까지, 이는 BAAI가 AGI 실현을 탐색하는 중요한 한걸음이다. 작년 BAAI 컨퍼런스에서 왕중위안(王仲远)은 대형모델 기술 경로 진화에 대한 견해를 제시했다. AGI 가능한 기술 진화 경로는 대형언어모델에서 통합된 멀티모달 대형모델로, 그 다음 물리세계와 미시세계로 진입하여 세계모델을 형성하고, 최종적으로 AGI 시대 도래를 추진할 것이라고 했다.

현재까지 이러한 판단이 실제로 검증되고 있다. AI의 장기적 목표는 실제 문제 해결에 활용되는 것이며, 현재 대형모델 연구개발은 이미 현실세계를 해체하는 새로운 단계에 진입했다.

AI 산업 발전을 이끄는 최고 기관으로서 BAAI는 설립 이후 여러 차례 AI 발전 기회를 예견해왔다. 2020년 BAAI는 백인 기술공관단을 구성하여 현재까지 오우다오 1.0, 2.0, 3.0 시리즈 모델을 연속 발표했으며, 풀스택 대형모델 기술 오픈소스 체계를 구축하고 국내 다수 유명 대형모델 스타트업을 인큐베이팅 했다.

명칭에서도 진화를 확인할 수 있다. 오우다오의 ‘도(道)’는 대형언어모델의 체계적 방법론 탐색을 대표하고, 오우지에의 ‘지에(界)’는 가상과 현실 세계 경계의 지속적 돌파를 나타낸다.

오픈소스 생태계 지속 확장

더욱 중요한 것은 AI 산업 발전의 중심이 지속적으로 변화하는 가운데에도 오픈소스가 BAAI가 지켜온 일관된 색깔이라는 점이다.

BAAI가 구축한 모델, 알고리즘, 데이터, 평가, 시스템을 아우르는 대형모델 오픈소스 기술 체계 FlagOpen은 현재까지 약 200개 모델과 160개 데이터셋을 오픈소스로 공개했다. 이 중 모델 전 세계 총 다운로드량은 6억 4천만 회를 초과했고, 오픈소스 데이터셋 다운로드량은 약 113만 회, 오픈소스 프로젝트 코드 다운로드량은 140만 회를 넘어섰다.

특히 오픈소스 모델 분야에서 범용 벡터 모델 BGE는 작년 10월 중국 최초로 Hugging Face 월간 다운로드 순위 1위에 오른 오픈소스 모델이 되었으며, 작년 말 기준 2023년 발표된 모든 모델 중 전 세계 다운로드량 1위를 기록했다. 또한 오픈소스 경량 장편 비디오 이해 모델 Video-XL 2는 단일 그래픽카드에서 최대 만 프레임의 비디오 입력을 효율적으로 처리할 수 있도록 지원한다.

오픈소스 만능 시각 생성 모델 OmniGen은 극간소 아키텍처를 채택하여 대형모델 기반과 VAE 모듈로만 구성되어 개발 및 배포 비용을 낮췄으며, 광범위한 지시 학습을 통해 시각 생성 능력의 고도 통합을 실현했다.

BAAI가 구축한 AI 시스템 소프트웨어 스택 FlagOS도 업그레이드를 실현했다. 새로 추가된 통합 컴파일러 FlagTree, 통합 통신 라이브러리 FlagCX, 자동 배포 플랫폼 도구 FlagRelease를 통해 국내외 11개 제조업체의 18종 이기종 AI 하드웨어에 대한 통합 지원을 실현했다.

BAAI

BAAI의 글로벌 AI 산업 발전 선도

전체 AI 산업으로 시야를 확대해보면, BAAI의 현재 포지셔닝이 산업에서 갖는 중요성을 더욱 명확히 관찰할 수 있다. 현재 많은 기업들이 멀티모달 기초모델, 구현지능 등 방향으로 탐색을 진행하고 있지만, 기술 루트가 다원적이고 수렴되지 않는다는 것이 문제점이다.

따라서 BAAI는 이를 기반으로 다양한 기술 루트와 방법에 대한 탐색을 더욱 중시하며, 연구가 일정한 성과에 도달하면 오픈소스 방식을 통해 기업들이 활용할 수 있도록 한다.

BAAI는 줄곧 AI 산업 기술 루트 탐색의 최전선에 서서 오픈소스 개방 생태계 구축을 통해 학계와 산업계 발전을 추진해왔다. 현재 AI 산업은 디지털 세계에서 물리세계로 나아가는 과정을 겪고 있으며, BAAI의 역할이 더욱 부각되고 있다.

베이징 BAAI 컨퍼런스는 ‘AI 업계 학술 성회’로서 BAAI 성과 발표와 탐색의 전시 플랫폼일 뿐만 아니라, 국내외 연구자들이 연구 성과를 공유하고 최신 지식을 탐구하며 실무 경험을 교류하는 중요한 의미를 담고 있다.

이번 오우지에 시리즈 대형모델 발표는 중국 AI 기술이 글로벌 선도 수준에 도달했음을 보여주는 중요한 이정표로, 향후 AI가 실제 세계 문제 해결에 더욱 적극적으로 활용될 수 있는 기반을 마련했다는 평가를 받고 있다.

[참고 기사]
https://zhidx.com/p/484408.html