L’actualité de l’intelligence artificielle chinoise continue de surprendre avec Moonshot AI, soutenue par Alibaba, qui repousse les limites. Le 1er août, la plateforme Kimi a lancé la version haute vitesse de son modèle Kimi K2, augmentant la vitesse de sortie de 10 à 40 tokens par seconde tout en maintenant la même qualité et taille de modèle. Nommée « kimi-k2-turbo-preview », cette mise à jour cible les applications à haute vitesse, marquant un pas de plus pour les modèles open-source chinois face aux géants comme OpenAI et Anthropic. Dans cet article, nous explorons les fonctionnalités, les performances et les implications de cette avancée.
Qu’est-ce que Kimi K2 et sa version speed ?
Kimi K2, initialement lancé mi-juillet 2025, est un modèle Mixture-of-Experts (MoE) avec 1 trillion de paramètres totaux et 32 milliards actifs, excellant en codage, tâches agentiques et intégration d’outils. Il surpasse des modèles propriétaires comme ChatGPT et Claude en codage, tout en étant 60-70% moins cher. La version Speed, disponible sur la plateforme ouverte de Kimi, quadruple la vitesse de réponse sans compromis sur la performance, idéal pour des scénarios en temps réel comme les agents autonomes ou les applications interactives.
Parmi ses capacités clés :
- Codage avancé : Meilleures notes sur SWE-Bench Verified et Tau2, surpassant les modèles open-source existants.
- Tâches agentiques : Excellente décomposition de problèmes complexes et utilisation d’outils, sans support multimodal ou chain-of-thought pour l’instant.
- Multilingue et créatif : Fort en génération de contenu, avec une ouverture totale du chatbot Kimi sans besoin de beta.
Sur X, des experts comme Simon Willison soulignent que cette version est 5x plus rapide pour des résultats équivalents, renforçant son attractivité pour les développeurs.
Améliorations par rapport aux modèles précédents
Par rapport à la version originale de Kimi K2 (lancée le 12 juillet), la Speed Edition optimise l’inférence sans altérer les paramètres, résultant en des réponses 4x plus rapides. Globalement, Kimi K2 se classe troisième parmi les modèles non-raisonneurs, derrière Sonnet et Opus, et égalise Gemini en capacités agentiques, tout en étant open-source et abordable. Des benchmarks comme LiveBench AI confirment sa supériorité, et il est disponible sur des plateformes comme Together AI pour un déploiement scalable.
Cependant, des défis persistent pour les firmes chinoises : malgré des modèles top-tier comme Kimi, les restrictions US sur les puces limitent leur entraînement et exécution. Des utilisateurs sur X notent son excellence en recherche multi-tours, surpassant même Deep Research d’OpenAI dans certains tests.
Disponibilité et tarification
Kimi K2 Speed Edition est accessible immédiatement via l’API de Moonshot AI et des partenaires comme Together AI, avec un pricing compétitif (jusqu’à 70% moins cher que les alternatives). Le chatbot Kimi est pleinement ouvert, gratuit pour un usage basique, et adapté aux entreprises via des abonnements scalables. Des intégrations comme sur ChatLLM ou LiveBench AI facilitent les tests.
Implications et perspectives futures
Cette mise à jour renforce la position de la Chine en IA open-source, excitant les chercheurs mondiaux. Moonshot AI vise à reclaim sa part de marché avec des modèles performants et économiques, potentiellement transformant les secteurs du codage et des agents IA. Toutefois, des débats émergent sur les droits IA et les pauses dans le progrès, comme discuté dans des newsletters spécialisées.
À l’avenir, Kimi pourrait évoluer vers le multimodal et le raisonnement avancé, intensifiant la compétition globale. Pour tester, visitez la plateforme Moonshot AI dès maintenant – une victoire pour l’open-source qui accélère l’innovation IA.
