중국 소셜 플랫폼 샤오홍슈(小红书)가 업계 최초로 소셜 네트워크 서비스(SNS) 전용 대규모 언어모델(LLM) ‘RedOne’을 공개했다. 이 모델은 8개 주요 소셜 태스크에서 평균 14.02%의 성능 향상을 달성하며, 소셜 미디어 플랫폼의 콘텐츠 관리와 사용자 상호작용 품질 개선에 새로운 가능성을 제시하고 있다.

소셜 미디어 특화 AI 모델의 필요성
기존의 범용 대모델들이 다양한 분야에서 활용되고 있지만, 소셜 네트워크 서비스 영역은 독특한 특성을 가지고 있어 전용 모델의 필요성이 대두 되어 왔다. 샤오홍슈 NLP팀이 개발한 RedOne은 이러한 요구에 부응하여 탄생한 첫 번째 소셜 전용 대모델이다.
소셜 미디어 데이터는 일반적인 텍스트 데이터와는 현저히 다른 특징을 보인다. 첫째, 높은 비규범화 특성으로 줄임말, 언어유희, 다국어 혼용 표현이 빈번하게 나타난다. 둘째, 강한 맥락 의존성으로 동일한 문장이라도 서로 다른 주제나 커뮤니티 문화에서는 전혀 다른 의미를 갖는다. 셋째, 뚜렷한 감정적 특성으로 사용자들의 감정 표현이 핫이슈나 트렌드에 따라 급격히 변화한다.

RedOne의 3단계 훈련 전략
RedOne은 “지속적 사전훈련(CPT) → 지도학습 미세조정(SFT) → 선호도 최적화(PO)”의 3단계 훈련 전략을 채택했다. 이를 통해 모델이 “소셜을 이해하고, 규칙을 알며, 사용자를 파악하는” 종합적 능력을 갖추도록 설계되었다.

1단계: 지속적 사전훈련(CPT)
첫 번째 단계에서는 소셜 네트워크 영역의 기초 지식을 모델에 주입하는 작업을 진행했다. 연구팀은 고품질 오픈소스 사전훈련 코퍼스와 소셜 네트워크 플랫폼 및 공개 웹페이지에서 수집한 대규모 데이터를 활용했다. 수집된 데이터는 비공식 토론, 짧은 댓글, 풍자적 표현, 감정적 콘텐츠 등 다양한 소셜 커뮤니케이션 양식을 포괄한다.
데이터 품질 관리를 위해 작업 지향적 규칙 필터링과 소형 LLM 기반 필터링을 포함한 정교한 데이터 선별 프로세스를 설계했다. 최종적으로 1000억 개 이상의 토큰을 포함하는 대규모 데이터셋을 구축하여 200억 개 토큰의 고품질 데이터셋으로 정제했다.
2단계: 지도학습 미세조정(SFT)
사전훈련 목표와 실제 응용 요구 사이의 격차를 해소하기 위해 정교하게 설계된 SFT 작업을 수행했다. 연구팀은 콘텐츠 이해, 정보 추출, 의미 매칭, 사용자 행동 모델링, 대화 및 역할 시뮬레이션, 번역 능력 등 6개 핵심 능력을 정의하고 각각을 구체적인 작업에 매핑했다.
특히 이중 단계 혼합 미세조정 방식을 채택하여, 첫 번째 단계에서는 대규모 범용 데이터와 결합된 완전한 SNS 데이터셋으로 모델을 훈련하고, 두 번째 단계에서는 SNS 영역 데이터 비율을 높여 모델을 추가로 정밀 조정했다.
3단계: 선호도 최적화(PO)
마지막 단계에서는 직접 선호도 최적화(DPO)를 통해 모델이 플랫폼 규범과 사용자 선호도에 더 잘 부합하도록 조정했다. 주관적 작업과 객관적 작업으로 구분하여 각각 다른 선호도 쌍 구축 전략을 적용했다. 주관적 작업에서는 전문가의 선호도 레이블링을 통해 인간의 선호도와 일치하는 판별 모델을 훈련했고, 객관적 작업에서는 데이터 레이블에 내재된 구조적 정보를 활용했다.
뛰어난 성능 향상 결과
RedOne은 기존 기초 모델 대비 8개 주요 SNS 작업에서 평균 14.02%의 성능 향상을 달성했다. SNS 이중언어 평가 기준에서도 7.56%의 개선을 보였다. 온라인 테스트에서는 단일 작업 미세조정 기준 모델 대비 유해 콘텐츠 탐지에서 노출률을 11.23% 감소시켰고, 게시물 조회 후 검색에서 클릭률을 14.95% 증가시켰다.
7B 및 32B 규모의 다양한 오픈소스/클로즈드소스 모델과의 비교 실험에서도 RedOne은 범용 작업에서 우수한 성능을 유지하면서 SNS 영역에서 탁월한 효과를 보여주었다. 특히 대부분의 작업에서 더 큰 모델과 비견되는 성능을 달성했으며, 모델 규모가 증가함에 따라 성능이 지속적으로 향상되는 잠재력을 보여주었다.



실제 서비스 적용 성과
샤오홍슈는 RedOne을 실제 서비스에 적용하여 A/B 테스트를 실시했다. 유해 콘텐츠 탐지 업무에서 위반 게시물 노출률을 11.23% 감소시켜 플랫폼의 안전성을 크게 강화했다. 또한 게시물 조회 후 검색 기능에서는 사용자 클릭률이 14.95% 증가하여 콘텐츠 발견과 깊이 있는 상호작용을 효과적으로 개선했다.

구체적인 사례를 살펴보면, “키높이구두” 관련 쇼핑 게시물에 대해 기존 Qwen 모델이 광범위하고 모호한 쇼핑 쿼리를 생성한 반면, RedOne은 “키높이구두”와 같은 핵심 제품 키워드를 정확히 식별하여 사용자의 구체적인 니즈를 명확히 반영했다.

범용성과 일반화 능력 검증
RedOne의 개발 과정에서 연구팀은 영역 특화 훈련 시 범용 능력 보존의 중요성을 강조했다. 분포 외(OOD) 강건성 실험을 통해 범용 영역 데이터를 포함한 훈련이 모델의 일반화 능력을 현저히 향상시킨다는 것을 확인했다. 이러한 장점은 모델 규모가 커질수록 더욱 뚜렷하게 나타났다.

3단계 훈련 전략의 각 단계별 기여도를 측정하기 위한 절제 실험에서도 흥미로운 결과가 나타났다. CPT 도입 후 범용 작업에서의 성능 저하는 거의 무시할 수 있는 수준이었지만, 모든 SNS 작업에서는 대폭적인 성능 향상을 보였다. SFT 추가 후에는 SNS와 소셜 번역 등의 작업에서 성능이 더욱 개선되었고, 최종 PO 단계까지 거쳐 전체적인 성능이 한 단계 더 향상되었다.
소셜 미디어 AI의 새로운 패러다임
RedOne의 등장은 소셜 미디어 플랫폼의 AI 활용에 새로운 패러다임을 제시한다. 기존의 단일 작업 중심 모델들이 갖고 있던 한계를 극복하고, 소셜 네트워크의 복잡하고 다양한 요구사항을 종합적으로 처리할 수 있는 능력을 보여주었다.
특히 소셜 미디어 특유의 언어적 특성과 문화적 맥락을 이해하면서도 플랫폼 규칙과 사용자 선호도를 동시에 고려할 수 있는 능력은 향후 소셜 플랫폼의 콘텐츠 관리와 사용자 경험 개선에 중요한 역할을 할 것으로 기대된다.
연구팀은 RedOne에서 채택한 방법론이 후속 전문 영역 LLM 개발에 참고가 되기를 희망한다고 밝혔다. 또한 소셜 미디어의 콘텐츠 관리와 고품질 상호작용 탐구를 더욱 발전시켜 신뢰할 수 있고 제어 가능하며 지속 가능한 소셜 네트워크 생태계 구축에 기여하고자 한다는 포부를 드러냈다.