바이트댄스 ‘더우바오(豆包)’, 실시간 비디오 통화 기능 추가

2025년 05월 29일

doubao1

중국의 AI 챗봇 서비스인 더우바오(豆包)실시간 비디오 통화 기능을 새롭게 도입하며 사용자 경험을 한층 업그레이드했다고 발표했다. 바이트댄스가 개발한 이 AI 어시스턴트는 기존 텍스트와 이미지 기반 상호작용에서 한 걸음 더 나아가 실시간 영상을 통한 소통이 가능해졌다.

더우바오

실시간 영상 인식으로 확장된 AI 상호작용

더우바오의 새로운 실시간 비디오 통화 기능은 사용자가 전화 인터페이스에서 비디오 화면을 활성화한 후, 실제 환경을 기반으로 AI와 실시간 질의응답을 할 수 있도록 지원한다. 이는 더우바오의 시각적 이해 능력을 기존의 정적 이미지 분석에서 동적 비디오 분석으로 확장한 것으로 평가된다.

더우바오는 작년 말부터 이미지 이해 기능을 제공해왔으며, 업로드된 사진의 내용을 인식하고 밈(meme) 이미지까지 이해할 수 있는 수준의 고도화된 이미지 분석 능력을 보여왔다. 이번 비디오 통화 기능 추가는 이러한 기술력의 자연스러운 발전으로, 사용자와의 상호작용 장벽을 더욱 낮추고 “보면서 대화하는” 새로운 경험을 제공하는 것을 목표로 한다.

여행과 문화 체험의 새로운 동반자

실시간 비디오 통화 기능의 활용 범위는 매우 광범위하다. 특히 여행 및 문화 체험 분야에서 그 진가를 발휘할 것으로 기대된다. 사용자들은 여행 중 비디오 통화를 통해 현재 위치한 관광지의 역사적 배경, 특색 있는 볼거리, 최적의 여행 루트 등에 대해 실시간으로 문의할 수 있다.

예를 들어, 베이징의 자금성을 방문한 관광객은 더우바오와의 비디오 통화를 통해 특정 궁전의 역사적 의미나 건축적 특징에 대한 상세한 설명을 들을 수 있다. 또한 박물관이나 미술관 관람 시에도 전시품에 대한 배경 정보를 즉석에서 획득할 수 있어, 개인 맞춤형 문화 해설사 역할을 수행한다.

최신 시각 이해 모델 기반 기술력

이번 실시간 비디오 통화 기능의 핵심은 더우바오의 최신 시각 이해 모델에 있다. 이 모델은 콘텐츠 인식, 이해 및 추론, 그리고 내용 서술 능력을 갖추고 있으며, 시각적 입력과 언어적 입력을 융합하여 종합적이고 심층적인 사고와 창작이 가능하다.

특히 대화의 정확성과 시의성을 높이기 위해 비디오 통화 기능에는 실시간 인터넷 검색 기능이 접목되었다. 이를 통해 인터넷상의 최신 정보를 실시간으로 획득하여 사용자에게 더욱 정확하고 현재성 있는 답변을 제공할 수 있게 되었다.

다양한 플랫폼 지원으로 접근성 강화

더우바오의 비디오 통화 기능은 모바일 앱뿐만 아니라 PC 버전에서도 동시에 지원된다. 사용자는 더우바오 앱을 실행한 후 “대화” → “통화 아이콘” → “비디오 통화 시작” 순서로 간단히 기능을 활성화할 수 있다. 이러한 멀티 플랫폼 지원은 사용자들에게 더욱 유연한 선택권을 제공하며, 다양한 상황에서 편리하게 서비스를 이용할 수 있도록 한다.

실생활 적용 사례: AI와 함께하는 쇼핑 체험

더우바오의 실시간 비디오 분석 능력은 예상 외의 분야에서도 활용 가능성을 보여주고 있다. 대표적인 사례가 바로 과일 선별 도우미 기능이다. 이전 ChatGPT가 온라인 상에서 두리안 선별로 화제가 되었던 것처럼, 더우바오 역시 비디오 통화를 통해 두리안 선별을 도와줄 수 있다.

실제 체험에서 더우바오는 비디오 화면을 통해 두리안의 껍질에 있는 가시의 특징을 분석하여 과육의 성숙도를 추정하고, 상세한 선별 조언을 제공하는 것으로 확인되었다. 이는 눈썰미와 경험이 필요한 과일 선별 같은 일상적인 상황에서도 AI의 도움을 받을 수 있음을 보여주는 흥미로운 사례다.

AI 상호작용 방식의 혁신적 발전

더우바오의 실시간 비디오 통화 기능 도입은 AI와 인간의 상호작용 방식이 점점 더 다양해지고 있음을 보여주는 대표적인 사례다. 텍스트 기반 채팅에서 시작된 AI 어시스턴트는 음성 인식, 이미지 분석을 거쳐 이제 실시간 영상 분석까지 가능한 수준으로 발전했다.

이러한 기술 발전은 단순히 기술적 진보에 그치지 않고, 사용자들의 일상생활에 더욱 자연스럽게 스며들 수 있는 AI 서비스의 가능성을 제시한다. 더우바오의 새로운 기능은 특히 시각적 정보가 중요한 상황에서 AI의 활용도를 크게 높일 것으로 전망된다.

중국 AI 시장에서의 차별화 전략

바이트댄스의 더우바오는 이번 실시간 비디오 통화 기능을 통해 중국의 치열한 AI 어시스턴트 시장에서 차별화된 경쟁력을 확보하려는 전략을 보여주고 있다. 알리바바의 통이치엔원, 바이두의 어니봇 등 경쟁 서비스들과의 차별점을 만들어내기 위한 노력의 일환으로 해석된다.

특히 실시간 영상 분석이라는 고도의 기술적 요구사항을 충족시킨 것은 바이트댄스의 AI 기술력이 상당한 수준에 도달했음을 보여주는 증거다. 이는 향후 더욱 복잡하고 정교한 AI 서비스 개발의 발판이 될 것으로 예상된다.

더우바오의 실시간 비디오 통화 기능은 현재 사용자들에게 개방되어 있으며, 다양한 상황에서의 활용 가능성을 스스로 탐색해볼 수 있도록 하고 있다. 이러한 개방적 접근은 사용자들의 창의적인 활용 사례를 발굴하고, 서비스 개선을 위한 피드백을 수집하는 데도 도움이 될 것으로 보인다.

[참고 기사]
https://zhidx.com/p/483499.html