Lors de sa conférence annuelle Build 2026 à San Francisco, Microsoft a présenté une famille de sept modèles d’intelligence artificielle développés en interne, une initiative visant à diminuer sa dépendance envers les acteurs spécialisés comme OpenAI ou Anthropic. Cette annonce s’inscrit dans une stratégie plus large de réduction des coûts et de maîtrise de la chaîne de valeur technologique, alors que les géants de l’IA se préparent à des introductions en Bourse historiques.
Ce qu'il faut retenir
- Sept modèles d’IA maison, dont MAI-Thinking-1 et MAI-Code-1-Flash, conçus pour rivaliser avec les solutions d’OpenAI et Anthropic en termes de performance et de coût.
- MAI-Thinking-1, premier modèle de raisonnement de Microsoft, affiche 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, surpassant selon l’entreprise GPT-5.5 d’OpenAI en qualité après ajustement pour McKinsey.
- La puce quantique Majorana 2 améliore la stabilité de ses qubits de quelques millisecondes à 20 secondes en moyenne, une avancée qualifiée par Microsoft de « passage du téléphone rechargeable quotidien à un appareil autonome plusieurs années ».
- Microsoft investit 13 milliards de dollars dans OpenAI et jusqu’à 5 milliards dans Anthropic, tout en proposant leurs modèles via Azure.
- Anthropic a déposé un dossier confidentiel pour une IPO le 1er juin 2026, quelques jours après une levée de fonds de 65 milliards de dollars, valorisant l’entreprise à 965 milliards.
« Nous pensons que le moment est venu pour chaque entreprise de passer du simple usage d’un modèle de pointe à une participation pleine et entière à la frontière », a déclaré Satya Nadella, PDG de Microsoft, lors de la conférence. Cette déclaration résume la volonté du géant technologique de s’affranchir des redevances versées aux fournisseurs tiers en internalisant la conception de ses modèles d’IA.
Parmi les sept modèles dévoilés, MAI-Thinking-1 se distingue comme le premier modèle de raisonnement de Microsoft, entièrement entraîné sur des données propres et sous licence commerciale. Avec 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, il est optimisé pour traiter des instructions complexes en plusieurs étapes, raisonner sur de longs contextes et générer du code. Selon Microsoft, des évaluations en aveugle menées par Surge, un partenaire indépendant, ont montré que ce modèle était préféré à Claude Sonnet 4.6 d’Anthropic, et qu’il rivalisait avec Claude Opus 4.6 sur les tests de référence en programmation.
Autre innovation majeure, MAI-Code-1-Flash est un modèle spécialisé dans la conversion de descriptions textuelles en code source pour des applications et sites web. Il est déjà en cours de déploiement dans GitHub Copilot et Visual Studio Code, deux outils phares de l’écosystème de développement. En exécutant ces modèles sur son infrastructure Azure, Microsoft espère supprimer les redevances actuelles versées aux fournisseurs tiers et répercuter ces économies sur les développeurs, selon le groupe.
« Après avoir ajusté nos modèles pour le cabinet de conseil McKinsey, nous surpassons GPT-5.5 d’OpenAI en termes de qualité, tout en visant un coût dix fois plus efficace », a indiqué Mustafa Suleyman, directeur général de Microsoft AI. Cette affirmation s’appuie sur des données tarifaires publiques extrapolées à l’ensemble des tailles de modèles, un argument clé dans la stratégie de compétitivité du groupe.
Une puce quantique en progression, mais encore loin de la maturité commerciale
Microsoft a également révélé des avancées significatives dans le domaine de l’informatique quantique avec sa puce Majorana 2. Selon Zulfi Alam, vice-président corporate de Microsoft Quantum, cette nouvelle version est « mille fois plus fiable » que sa prédécesseure, avec des qubits stables en moyenne 20 secondes — contre quelques millisecondes auparavant. « Nous comparons cette amélioration au passage d’un téléphone qu’il faut recharger chaque jour à un appareil qui tient plusieurs années », a-t-il précisé.
Cette puce, qui ne compte pour l’instant que 12 qubits, repose sur une technologie de qubits dits topologiques, basée sur les propriétés d’une quasi-particule théorisée dans les années 1930 par le physicien italien Ettore Majorana. Le chemin vers cette avancée n’a pas été sans embûches : en 2018, Microsoft avait dû retirer un article publié dans la revue Nature affirmant avoir identifié cette particule. Malgré ce revers, le groupe a poursuivi ses recherches et améliore aujourd’hui sa puce de seconde génération en remplaçant l’aluminium par le plomb comme supraconducteur.
« Nous disposerons en 2029 d’une machine quantique capable de résoudre des problèmes raisonnables, commercialement viables », a annoncé Zulfi Alam. Cependant, les travaux autour de Majorana 2 n’ont pas encore été soumis à une évaluation par les pairs, ce qui suscite des demandes d’informations supplémentaires de la part de certains physiciens.
La course aux IPO des acteurs de l’IA s’accélère, poussant Microsoft à l’autonomie
La stratégie d’autonomie affichée par Microsoft intervient alors que les entreprises dans lesquelles il a massivement investi se préparent à des introductions en Bourse d’une ampleur inédite. Anthropic, créateur du modèle Claude, a déposé confidentiellement un dossier pour une IPO le 1er juin 2026, quelques jours seulement après avoir levé 65 milliards de dollars (59 milliards d’euros) lors d’un tour de table de série H, portant sa valorisation à 965 milliards de dollars (877 milliards d’euros).
OpenAI, partenaire historique de Microsoft, prépare également un dépôt confidentiel pour une entrée en Bourse, dans un contexte où les valorisations du secteur de l’IA atteignent des sommets. Microsoft, qui s’est engagé à hauteur de 13 milliards de dollars (11,8 milliards d’euros) auprès d’OpenAI et a investi jusqu’à 5 milliards (4,5 milliards d’euros) dans Anthropic, propose déjà les modèles des deux sociétés via sa plateforme Azure.
Alors que le géant technologique cherche à réduire sa dépendance envers les acteurs tiers, la réussite de cette transition dépendra de l’acceptation de ses modèles par les utilisateurs et de la capacité à industrialiser ses innovations quantiques. Une chose est sûre : la bataille pour l’autonomie technologique dans l’IA s’annonce comme l’un des enjeux majeurs de cette décennie.