La start-up californienne Anthropic a annoncé, d’après Le Monde, la mise en place de restrictions techniques sur son modèle d’intelligence artificielle Mythos, rendu accessible en avril à un groupe restreint de partenaires. Ces mesures visent à encadrer les requêtes liées à la cybersécurité, un domaine où les risques de dérive ou d’utilisation malveillante sont jugés particulièrement élevés.

Ce qu'il faut retenir

  • Anthropic restreint l’usage de son IA Mythos pour limiter les requêtes en cybersécurité.
  • Le modèle a été déployé en avril auprès d’un cercle restreint de partenaires.
  • Ces garde-fous s’ajoutent aux mesures de sécurité déjà existantes.

Une IA conçue pour un public élargi, mais sous surveillance renforcée

Anthropic, fondée en 2021 par d’anciens chercheurs d’OpenAI, a développé Mythos comme une alternative aux modèles concurrents, avec une approche axée sur la sûreté. Selon les informations rapportées par Le Monde, la version grand public de Mythos intègre désormais des filtres spécifiques pour bloquer ou restreindre les demandes liées à la conception de logiciels malveillants, l’exploitation de failles informatiques ou toute autre activité susceptible de compromettre des systèmes critiques. Ces garde-fous s’inscrivent dans une démarche plus large de l’entreprise pour promouvoir une IA responsable.

« Nous avons observé que certains utilisateurs pouvaient tenter d’exploiter Mythos à des fins non prévues, notamment en cybersécurité offensive », a déclaré un porte-parole d’Anthropic, soulignant que ces ajustements étaient nécessaires pour éviter des usages contraires à l’éthique ou illégaux. L’entreprise n’a pas précisé si ces restrictions seraient étendues à d’autres domaines sensibles comme la biologie synthétique ou la manipulation de l’information.

Un déploiement progressif, encadré par des partenaires sélectionnés

Le modèle Mythos a été dévoilé en avril 2026 à un groupe limité de partenaires, principalement des chercheurs et des entreprises technologiques. Anthropic avait alors insisté sur son potentiel pour des applications grand public, comme l’assistance aux développeurs ou la génération de contenus éducatifs. Cependant, Le Monde révèle que l’accès au modèle était déjà assorti de clauses contractuelles interdisant certaines utilisations, notamment en lien avec la sécurité informatique.

Ces limitations techniques, bien que discrètes, marquent une évolution dans la stratégie des acteurs de l’IA. Après les polémiques autour de modèles comme celui de Mistral AI ou Meta, qui avaient été critiqués pour leur manque de contrôle, Anthropic semble vouloir anticiper les risques en amont. « Nous préférons ajuster nos outils en amont plutôt que de réagir a posteriori », a ajouté le porte-parole, évoquant les leçons tirées des dérives observées sur d’autres plateformes.

Cybersécurité : un enjeu central pour l’avenir des IA génératives

Les craintes autour des IA génératives en matière de cybersécurité ne sont pas nouvelles. Dès 2023, des études avaient montré que certains modèles pouvaient aider à rédiger des codes malveillants ou à identifier des vulnérabilités. En 2024, l’agence européenne ENISA avait alerté sur les risques liés à l’utilisation détournée de ces outils, notamment par des groupes criminels ou des États. Anthropic n’est pas la seule à agir : des entreprises comme Google ou Microsoft ont également renforcé leurs politiques d’usage pour leurs modèles les plus puissants.

Pour autant, ces mesures divisent. Certains experts estiment qu’elles sont indispensables pour éviter une course aux armements numériques, tandis que d’autres y voient une censure excessive qui bride l’innovation. « Limiter l’accès à la cybersécurité, c’est comme interdire aux médecins d’étudier les maladies », a réagi un chercheur en sécurité informatique, sous couvert d’anonymat. Anthropic n’a pas encore communiqué de détails techniques sur ses garde-fous, laissant planer des incertitudes sur leur efficacité réelle.

Et maintenant ?

Anthropic devrait préciser dans les prochaines semaines les modalités exactes de ces restrictions, notamment si elles seront étendues à d’autres domaines ou si des audits indépendants seront mis en place pour évaluer leur impact. Une date clé à surveiller est le mois de septembre 2026, lorsque la société prévoit d’élargir l’accès à Mythos à un public plus large. Reste à voir si ces mesures suffiront à convaincre les régulateurs, qui pourraient imposer des règles plus strictes d’ici 2027.

En attendant, la question de l’équilibre entre innovation et sécurité reste entière. Une chose est sûre : le débat sur les garde-fous des IA génératives ne fait que commencer.

Selon Le Monde, Anthropic restreint principalement les demandes liées à la cybersécurité offensive, comme la création de logiciels malveillants, l’exploitation de failles informatiques ou toute activité susceptible de nuire à des systèmes critiques. La liste exacte des requêtes interdites n’a pas été publiée.