키미 K2 발표, 1T 파라미터 MoE 모델로 오픈소스 진출

2025년 07월 12일

키미

중국 AI 스타트업 문샷 AI(月之暗面)가 개발한 대화형 AI ‘키미(Kimi)’가 마침내 반격에 나섰다. 딥시크 R1 발표로 큰 충격을 받은 지 172일 만에, 키미는 새로운 기초 대모델 ‘키미 K2’를 발표하며 오픈소스로 전환한다고 발표했다.

키미

딥시크 충격 172일 후 키미의 역습

키미 K2는 총 1조(1T) 파라미터 규모의 MoE(Mixture of Experts) 아키텍처를 채택했으며, 활성화 파라미터는 320억(32B) 개다. 128K 토큰의 컨텍스트 길이를 지원하며, 특히 코딩, 에이전트, 수학 추론 작업에서 뛰어난 성능을 보인다고 회사 측은 밝혔다.

이번 Kimi K2 발표는 단순한 모델 업데이트가 아니라, 딥시크의 파괴적 혁신에 대한 Kimi의 전략적 대응으로 해석된다. 딥시크 R1이 등장한 이후 중국 AI 시장의 판도가 크게 바뀌면서, Kimi를 포함한 여러 AI 스타트업들이 생존 위기에 직면했기 때문이다.

오픈소스 전환으로 경쟁력 확보

키미 K2의 가장 주목할 만한 특징은 발표와 동시에 오픈소스로 공개된다는 점이다. Kimi는 두 가지 버전을 제공한다:

Kimi-K2-Base : 명령어 파인튜닝을 거치지 않은 기초 사전 훈련 모델로, 연구 목적과 맞춤형 시나리오에 적합
Kimi-K2-Instruct : 범용 명령어 파인튜닝 버전(비추론 모델)으로, 대부분의 질답과 에이전트 작업에서 우수한 성능 발휘

라이선스는 수정된 MIT 라이선스(Modified MIT License)를 따른다. 기본적으로는 가장 관대한 MIT 라이선스를 적용하지만, Kimi K2 기반 제품이나 서비스의 월간 활성 사용자가 1억 명을 초과하거나 월 매출이 2,000만 달러를 넘을 경우, 해당 제품의 사용자 인터페이스에 ‘Kimi K2’ 표시를 해야 한다는 조건이 추가됐다.

벤치마크에서 오픈소스 SOTA 달성

키미는 K2 모델이 여러 주요 벤치마크에서 오픈소스 모델 중 최고 성능(SOTA)을 달성했다고 발표했다.

에이전트와 프로그래밍 능력 면에서 Kimi K2는 SWE Bench Verified에서 43.4%의 성과를 기록해 기존 오픈소스 모델들을 크게 앞섰다. 또한 Tau2 벤치마크에서 68.7%, AceBench에서도 최고 점수를 달성했다.

도구 호출 능력에서도 뛰어난 성과를 보였다. 복잡한 명령을 자동으로 분해해 실행 가능한 ToolCall 구조로 변환하는 능력이 크게 향상됐다. 실제 데모에서는 연예인 콘서트 관람을 위한 연간 계획 수립부터 항공편·호텔 예약, 여행 일정 계획, 캘린더 생성, HTML 요약 보고서 작성, 이메일 발송까지 원스톱으로 처리하는 모습을 보여줬다.

수학 등 과학 분야에서도 강화된 성능을 입증했다. Kimi K2는 검증 가능한 작업(코딩, 수학)뿐만 아니라 자체 평가 메커니즘을 도입해 검증이 어려운 작업에서도 향상된 성과를 보인다.

혁신적인 기술적 특징들

키미 K2에는 세 가지 핵심 기술 혁신이 적용됐다.

첫째, MuonClip 최적화기를 도입했다. 기존 Adam 최적화기를 버리고 혁신적인 Muon 최적화기를 사용했다. 대규모 훈련에서 발생하는 attention logits 과대화 문제를 완화하기 위해 MuonClip을 제안하고 이를 조 단위 파라미터 규모로 확장해 훈련 안정성과 토큰 사용 효율성을 높였다. Kimi K2는 15.5조 토큰의 안정적인 훈련을 완료했으며, 전 과정에서 loss spike가 발생하지 않았다.

둘째, 대규모 에이전트 도구 사용 데이터 합성 기술을 개발했다. 수백 개 영역과 수천 개 도구를 아우르는 다중 턴 도구 사용 시나리오를 대규모로 생성할 수 있는 합성 파이프라인을 구축했다. 고품질 샘플은 LLM 평가를 통해 선별 된 후 훈련에 활용됐다.

셋째, 범용 강화학습을 적용했다. Kimi K2는 검증 가능한 작업(코딩, 수학)에서의 강화학습은 물론, 자체 판단 메커니즘(self-judging)을 도입해 검증이 어려운 작업의 보상 부족 문제를 해결했다. 검증 가능한 작업을 통해 지속적으로 critic을 최적화 해 일반화 작업 성능을 향상 시켰다.

실제 테스트 결과

키미 K2 발표와 동시에 웹과 앱에서 바로 사용할 수 있게 됐다. 실제 테스트에서 Kimi K2는 간단한 프롬프트 만으로도 요구 사항을 정확히 이해하고 우수한 효과의 코드를 작성하는 능력을 보여줬다.

키미 K2 홍보 웹페이지 제작 요청에 대해서는 간결한 디자인의 웹페이지를 생성했으며, ‘즉시 체험’과 ‘오픈소스 모델 다운로드’ 버튼은 실제 올바른 URL로 연결되도록 구현됐다.

물리 시뮬레이션 요청에서는 갤턴 보드(Galton Board) 시뮬레이션을 구현했는데, 구체적인 요구 사항이 없었음에도 불구하고 행 수와 공 개수 조정 슬라이더를 자동으로 설계하는 세심함을 보였다.

다만 개인 비서 역할을 맡겨 린쥔제(林俊杰) 콘서트 관람 계획을 요청했을 때는 이미 지난 일정 들을 제안하는 등 실용성에서는 아직 개선의 여지가 있었다. 이는 도구 호출 기능이 아직 정식 출시되지 않은 것과 관련이 있을 것으로 보인다.

중국 AI 시장의 격변과 키미의 대응

키미 K2 발표는 중국 AI 시장의 격변 속에서 나온 전략적 대응으로 해석된다. 2024년 전체 데이터를 보면, AI 지능 어시스턴트 웹 시장에서는 키미 지능 어시스턴트, 더우바오 AI, 원신이언(文心一言)이 TOP 3를 형성해 70% 시장 점유율을 차지했다. 앱 시장에서는 더우바오와 키미 지능 어시스턴트가 80% 시장 점유율을 차지하며 양강 구도를 이뤘다.

하지만 2025년 1월 20일 딥시크 R1이 등장하면서 상황이 급변했다. 딥시크 R1은 국내외에서 폭발적인 반응을 일으키며 춘절 연휴 기간 전국민적 화제가 됐다. 이에 텐센트도 딥시크의 오픈소스 흐름에 편승해 적극적으로 움직였다.

그 결과 2025년 상반기 데이터를 보면, 웹과 앱 모두에서 상위 구도가 DDKT(더우바오, 딥시크, 키미, 텐센트 위안바오)로 바뀌어 90% 시장 점유율을 차지하게 됐다. 키미는 여전히 주요 플레이어로 남았지만, 위기감은 내외부에서 모두 감지할 수 있을 정도였다.

특히 Kimi의 데이터 성장은 거액의 투자 유치 후 마케팅 투자 전략과 밀접한 관련이 있었는데, 딥시크와 텐센트 위안바오가 앞선 모델만으로도 빠른 돌파를 이뤄낸다면 이런 전략의 정당성에 의문이 제기될 수밖에 없었다.

더욱이 DDKT 중에서 Kimi는 현금창출원(cash cow) 지원 없이 버텨야 하는 유일한 스타트업이었다. 딥시크 이후 AI 대모델 ‘6소룡’ 창업 구도 중 최소 2곳이 대모델 자체 연구를 포기했을 정도로 시장 상황이 어려워진 가운데, Kimi에 대한 근본적 의문이 제기됐다:

“딥시크 이후에도 기초 대모델을 자체 연구할 필요가 있는가?”

양즈린 CEO의 복귀와 미래 전략

172일간 논란 속에서 자취를 감췄던 키미 CEO 양즈린(杨植麟)이 K2 오픈소스 대모델로 명확한 답을 내놨다:

“키미는 포기하지 않으며, 자체 연구 대모델을 포기하지 않겠다.”

키미의 향후 전략도 분명해졌다. 더 강력한 오픈소스 대모델을 구축해 전방위적 SOTA를 달성하고, 기술의 선도성을 다시 증명하겠다는 것이다.

어떤 의미에서는 딥시크 창립자 량원펑(梁文锋)이 같은 광둥성 출신 후배인 양즈린을 깨워놓았을 뿐만 아니라, AGI 경쟁의 초심을 되찾는 데도 도움을 줬다고 볼 수 있다.

키미 K2의 발표는 단순한 모델 출시를 넘어, 중국 AI 업계에서 치열한 경쟁이 계속되고 있으며 게임이 아직 끝나지 않았다는 강력한 메시지를 전달한다. 키미는 테이블을 떠나지 않겠다는 의지를 분명히 했으며, 오픈소스 전환을 통해 새로운 경쟁 우위를 확보하려 한다.

[참고 기사]
https://www.qbitai.com/2025/07/308332.html

댓글 남기기