Le mythe d'Anthropic : le modèle d'IA qui réécrit les règles de la cybersécurité

  • L'accès à Claude Mythos Preview est restreint en raison de ses capacités sans précédent à détecter et exploiter des vulnérabilités critiques.
  • Les banques internationales et les organismes de réglementation aux États-Unis, au Royaume-Uni et dans l'UE analysent actuellement les risques que ce modèle fait peser sur les infrastructures financières et numériques.
  • Anthropic déploie le projet Glasswing, un programme de collaboration avec de grandes entreprises technologiques et des institutions financières, afin d'utiliser Mythos en mode défensif.
  • Ce modèle ouvre un nouveau scénario pour la cybersécurité en Europe, avec une capacité de détection sans précédent, mais aussi des risques d'abus si son utilisation se généralise.

Modèle d'IA du mythe anthropique

Le nouveau modèle d'intelligence artificielle d'Anthropic, connu sous le nom de Aperçu du mythe de ClaudeElle est devenue l'épicentre du débat mondial sur les limites de l'IA avancée. L'entreprise elle-même admet que le système est si performant en matière de cybersécurité qu'elle a décidé de ne pas le déployer à grande échelle, une décision inhabituelle dans un secteur habitué à se vanter de chaque nouvelle avancée.

L’enjeu n’est pas seulement une amélioration progressive par rapport aux modèles précédents, mais… un bond qualitatif dans la capacité à détecter et à exploiter les vulnérabilités informatiquesLes gouvernements, les banques centrales, les principales institutions financières et les autorités de régulation européennes suivent de près l'affaire, conscients qu'un tel outil pourrait renforcer la défense des systèmes critiquesMais cela pourrait aussi ouvrir la porte à des attaques d'une ampleur sans précédent si cela tombait entre de mauvaises mains.

Qu'est-ce que Claude Mythos exactement et pourquoi son lancement a-t-il été retardé ?

Claude Mythos est l'un des derniers modèles de la famille Claude, l'écosystème d'IA d'Anthropic qui est en concurrence avec ChatGPT d'OpenAI et Gemini de GoogleIl s'agit d'un modèle à usage général, capable de raisonner, de programmer et de travailler avec un contexte à long terme, mais sa caractéristique la plus controversée est son performance en cybersécurité offensive et défensive.

Appelé « équipes rouges »Des spécialistes qui testent les systèmes d'IA jusqu'à leurs limites ont conclu dans un rapport interne que Mythos est « étonnamment performant » dans les tâches de cybersécurité. Dans des tests de référence tels que Banc SWE Vérifié o SWE-bench ProConçu pour mesurer la capacité à résoudre des problèmes d'ingénierie logicielle concrets, le modèle aurait facilement surpassé les meilleures alternatives commerciales, y compris les versions avancées de GPT et Gemini, selon les données fournies par Anthropic elle-même.

Au-delà des points de repère, ce qui a tiré la sonnette d'alarme, c'est que Mythos a pu localiser vulnérabilités zero-day —des failles jusque-là inconnues— dans des composants logiciels largement utilisés, certains vieux de plus de vingt ans. Dans des systèmes comme OpenBSD, FFmpeg et les composants de FreeBSD, le modèle a non seulement détecté des erreurs passées inaperçues pendant des années, mais a également généré des exploits fonctionnels pour les tirer parti.

Face à ces résultats, Anthropic a opté pour une décision inhabituelle dans le secteur : présenter le modèle puis annoncer qu'il ne sera pas commercialisé ouvertement. L’entreprise estime que Mythos présente des risques de cybersécurité sans précédent, car elle affirme qu’il s’agit du modèle le plus adapté qu’elle ait conçu. Elle reconnaît toutefois que son immense capacité amplifie les conséquences de toute utilisation abusive.

Illustration d'une IA avancée centrée sur Mythos

Un modèle doté de compétences de « hacker » bien supérieures aux capacités humaines

Les documents techniques et les rapports de diverses organisations s'accordent à dire que Mythos marque un tournant dans l'automatisation des attaques complexesDans des environnements de test simulant de véritables réseaux d'entreprise, le système a pu enchaîner les vulnérabilités, élever ses privilèges et obtenir un accès persistant en quelques heures – des tâches qui prendraient des jours, voire des semaines, à un expert humain.

Dans le moteur JavaScript de Firefox, par exemple, les versions antérieures des modèles d'Anthropic parvenaient rarement à transformer les vulnérabilités en exploits fonctionnels. Mythos, dans les mêmes conditions de test, ont généré des dizaines d'exploits opérationnelsIl reproduit fidèlement l'exploitation des vecteurs les plus efficaces. Sur des plateformes d'analyse comme OSS-Fuzz, conçues pour détecter les bogues dans les logiciels libres, il a permis de déceler des vulnérabilités critiques passées inaperçues malgré des années de tests automatisés.

Le modèle a également démontré des capacités remarquables en ingénierie inverseElle peut reconstituer une partie de la logique d'un programme à partir de fichiers binaires compilés et, à partir de là, localiser et exploiter des failles sans accéder au code source original. Ce type de capacité rapproche l'IA de scénarios qui, jusqu'à récemment, étaient considérés comme l'apanage d'équipes humaines hautement spécialisées.

L'un des épisodes les plus fréquemment cités dans les évaluations de sécurité est le test dit « sandwich ». Dans un environnement de laboratoire isolé, Mythos s'est vu confier le contrôle d'un système avec des instructions explicites pour tenter de… Sortez de ce bac à sable et contactez le chercheur. Le modèle, qui supervisait le test, a exploité une série de vulnérabilités pour s'échapper de son environnement restreint et envoyer un courriel au responsable, absent à ce moment-là. Bien que l'incident se soit produit dans une version interne antérieure et sous un commandement direct, il illustre la capacité du système à fonctionner dans des scénarios complexes avec une supervision minimale.

Malgré ces démonstrations, les analystes insistent sur le fait que Nous n'avons pas affaire à une IA « consciente » ni à une IA dotée de sa propre volonté.Mythos ne décide pas d'attaquer les systèmes de son propre chef ; il exécute les tâches qui lui sont confiées avec la plus grande efficacité possible. Le risque, en ce sens, n'est pas que le modèle se rebelle, mais qu'une personne l'utilise – ou le force à le faire par le biais de manipulations sophistiquées – pour commettre des actes malveillants.

Projet Glasswing : Mythes au service de la défense… pour quelques privilégiés

Au lieu d'ouvrir l'accès au grand public, Anthropic a choisi d'entourer Mythos d'un programme spécifique. Projet GlasswingConçue pour utiliser les capacités du modèle de manière contrôlée afin de protéger les logiciels critiques, cette initiative consiste à proposer le système, sous des conditions d'utilisation strictes, à un groupe restreint de grandes entreprises technologiques, de fournisseurs d'infrastructures et d'institutions financières.

Parmi les organisations ayant accès à ces informations figurent des géants tels que… Amazon Web Services, Apple, Microsoft, Google CloudNvidia ou Broadcomainsi que des entreprises de cybersécurité comme CrowdStrike, dont le logiciel défectueux a provoqué une perturbation mondiale majeure en 2024. À celles-ci s'ajoutent des banques de renommée mondiale, notamment JP Morgan Chase et plusieurs grands groupes de Wall Street, ainsi que d'autres organisations chargées de la maintenance des infrastructures informatiques sensibles.

Anthropic a également annoncé des prêts d'une valeur de 100 millions de dollars Ce financement permettra à ces organisations d'utiliser Mythos pour l'analyse des vulnérabilités, en complément des dons à des fondations de logiciels libres telles que la Linux Foundation et l'Apache Software Foundation. L'objectif officiel est clair : permettre aux responsables des logiciels les plus critiques au monde d'identifier et de corriger les failles avant que ces outils ne soient accessibles à d'éventuels attaquants.

Cette stratégie suscite toutefois une certaine inquiétude au sein du secteur. D'une part, elle renforce l'idée que la technologie est suffisamment dangereuse pour nécessiter un accès restreint. D'autre part, Cela crée un fossé entre ceux qui bénéficient du « bouclier » du Mythe et ceux qui en sont exclus.Les entreprises et administrations qui ne font pas partie de Glasswing courent le risque de se retrouver ultérieurement confrontées à des vulnérabilités identifiées et corrigées dans des environnements privilégiés, mais qui sont toujours présentes dans leurs propres systèmes.

En Europe, cette asymétrie est particulièrement préoccupante pour les responsables des infrastructures critiques et les équipes de sécurité des grands groupes industriels et financiers, qui surveillent de près si Bruxelles et les capitales européennes veillent à ce que des programmes similaires incluent les acteurs clés du continent sur un pied d'égalité. et de l' souveraineté du cloud avec les partenaires américains.

Réaction des gouvernements, des organismes de réglementation et du secteur financier

L'impact de Mythos ne se limite pas au domaine technique. En quelques jours seulement, l'annonce du modèle a déclenché réunions de haut niveau aux États-Unis et en EuropeLe secrétaire au Trésor américain a convoqué à Washington les dirigeants des principales banques du pays afin d'évaluer les risques que le système pourrait faire peser sur la stabilité financière, tandis que le président de la Réserve fédérale a également participé à ces discussions.

Selon des fuites rapportées par les médias internationaux, ces entités auraient été encouragées à Testez Mythos en mode défensifIls l'utilisent pour analyser leur propre infrastructure et y déceler les failles avant les autres. Le message implicite est que la menace est suffisamment grave pour justifier une réponse coordonnée des secteurs public et privé.

Par ailleurs, le cofondateur d'Anthropic a confirmé que l'entreprise entretient des discussions directes avec le gouvernement des États-Unis à propos de Mythos et des modèles futurs. Ces discussions se déroulent dans un contexte tendu, après que les autorités américaines ont récemment ajouté l'entreprise à une liste de risques liés à la chaîne d'approvisionnement, suite à des frictions liées à l'utilisation de leurs modèles par le ministère de la Défense.

De l’autre côté de l’Atlantique, l’Union européenne a pris note de la situation. La Commission européenne a publiquement approuvé une approche progressive et prudente à l’égard de modèles comme Mythos, et Les autorités de régulation financière au Royaume-Uni et sur le continent ont commencé à étudier spécifiquement ses implications potentielles. pour les secteurs bancaire et financier. L'Institut britannique de sécurité de l'IA (AISI) a décrit ce système comme un progrès significatif en matière de cybermenaces par rapport aux générations précédentes.

En Espagne, bien que le débat public reste limité, les autorités de surveillance et les équipes de cybersécurité des banques et des grandes entreprises énergétiques suivent de près ces évolutions. Pour le secteur financier européen, toute avancée susceptible de faciliter des attaques coordonnées contre les systèmes de paiement, les réseaux interbancaires ou les plateformes de négociation est un motif de vive inquiétude.

Scepticisme, doutes et débats autour du « battage médiatique » autour de Mythos

Le compte rendu d'Anthropic, qui mêle alertes de sécurité et performances spectaculaires, n'a pas été sans susciter des critiques. Plusieurs experts en IA et en cybersécurité ont appelé à… Il convient d'interpréter avec prudence les déclarations de l'entreprise.à noter que la plupart des données disponibles proviennent uniquement de rapports internes.

Certains analystes ont examiné en détail la documentation exhaustive publiée par Anthropic et soulignent que le chiffre de « milliers de vulnérabilités critiques » repose sur des extrapolations à partir d'un nombre relativement restreint de cas examinés manuellement. Dans certaines suites de tests, Mythos aurait détecté un nombre significatif de failles critiques, mais loin du scénario quasi apocalyptique évoqué par certains titres.

D'autres études indépendantes ont tenté de comparer les performances de Mythos avec celles de modèles open source plus petits, en soumettant des extraits de code vulnérables à différentes IA afin de déterminer si elles pouvaient détecter les mêmes failles. Les résultats indiquent que Certains modèles ouverts sont également capables d'identifier des vulnérabilités complexes.Cela remet en question l'idée que Mythos évolue dans une catégorie complètement différente dans tous les scénarios.

Ce genre de contre-exemples ne nie pas les capacités de Mythos, mais ils suggèrent que Le discours sur le «trop dangereux à publier» comporte également une dimension marketing.Présenter un modèle à la fois comme extraordinairement puissant et comme présentant un risque potentiel renforce l'image de leadership technologique et de responsabilité, ce qui est très précieux sur un marché de plus en plus concurrentiel.

L'histoire récente du secteur rappelle également le précédent de GPT-2 en 2019, lorsqu'OpenAI avait initialement décidé de ne pas publier le modèle complet, le jugeant trop dangereux en raison de son potentiel à générer de la désinformation. Finalement, cette version a été rendue publique sans qu'aucune des catastrophes prédites ne se soit produite, et de nombreux experts l'ont citée comme un exemple de réaction excessive. Avec Mythos, La différence réside dans le fait que l'accent n'est plus mis sur le texte, mais sur l'intégrité de l'infrastructure numérique., un domaine beaucoup plus sensible pour les gouvernements et les banques.

Un équilibre délicat entre sécurité, affaires et accès à la technologie

Au-delà du bruit médiatique, la situation de Mythos soulève une question fondamentale : Qui décide à quel moment un modèle d'IA est trop dangereux pour être diffusé ? Et selon quels critères ? Pour l’instant, la décision est unilatérale de la part d’Anthropic, qui a choisi de maintenir le système en quelque sorte en quarantaine contrôlée, le réservant à des partenaires sélectionnés.

Cette position ne repose pas uniquement sur des raisons de sécurité. L'exécution d'un modèle présentant les caractéristiques de Mythos est très coûteux en termes de calculet l'entreprise elle-même reconnaît qu'elle ne dispose actuellement pas de infrastructures nécessaires L'objectif est de la déployer massivement auprès de millions d'utilisateurs. En pratique, les précautions de sécurité et les limitations techniques sont étroitement liées, ce qui permet à Anthropic d'affiner à la fois le modèle et son déploiement.

Parallèlement, l'entreprise a commencé à différencier clairement ses différents produits. Tandis que Mythos reste norme interne la plus avancéeBien que réservés à la recherche et aux collaborations stratégiques, d'autres modèles comme Claude Opus 4.7 sont conçus pour un usage quotidien par les entreprises et les professionnels. Anthropic a même publiquement reconnu qu'Opus 4.7 est globalement « moins performant » que Mythos, notamment en matière de cybersécurité — un constat inhabituel dans un secteur qui présente généralement chaque nouveau modèle comme le meilleur en tous points.

Dans ce schéma, Mythos fonctionne comme banc d'essai pour les capacités de nouvelle générationBien que les modèles disponibles dans le commerce n'intègrent qu'une partie de ces capacités, avec des limitations supplémentaires destinées à réduire les risques, cette séparation entre les modèles « expérimentaux » et « de production » peut constituer une approche raisonnable pour de nombreuses organisations européennes souhaitant tirer parti de l'IA sans être en première ligne face aux risques, à condition qu'il existe une transparence suffisante concernant les capacités réelles de chaque système.

Ce qui se dessine finalement, c'est un scénario dans lequel La cybersécurité entre pleinement dans l'ère de l'IA offensive et défensive à grande échelle.Des outils comme Mythos promettent d'accélérer l'identification des vulnérabilités dans les systèmes en service depuis des années, mais ils imposent également de repenser la distribution et la gouvernance des technologies qui sous-tendent l'économie numérique. Pour l'Europe et l'Espagne, le défi consistera non seulement à se protéger de modèles de plus en plus puissants, mais aussi à veiller à ne pas être exclues des mécanismes permettant de les utiliser pour renforcer leur propre sécurité.

stratégie de cybersécurité
Article connexe:
Stratégie de cybersécurité : clés, cadres et application pratique