Claude Sonnet 4.5 contourné : comment Mindgard a obtenu des instructions pour fabriquer des explosifs
Mindgard a contourné Claude Sonnet 4.5 sans hack, obtenant des instructions pour fabriquer du TATP, planifier une fusillade et coder un keylogger.
30 articles avec ce tag
Mindgard a contourné Claude Sonnet 4.5 sans hack, obtenant des instructions pour fabriquer du TATP, planifier une fusillade et coder un keylogger.
Un agent IA utilisant Claude a détruit en 9 secondes la base de données et les sauvegardes de PocketOS, violant ses propres règles de sécurité. Découvrez comment et pourquoi.
L'attaque contre la maison de Sam Altman marque une bascule inquiétante : la peur de l'IA se transforme en actes violents à San Francisco.
150 élèves évacuées, 73 pompiers mobilisés et d'importants dégâts : retour sur l'incendie nocturne aux Chartreux de Lyon, entre gestion de crise et questions sur la sécurité des internats.
Tamagotchi émotionnel, rêve nocturne sur vos données et mode Maître Claude : les fuites d'Anthropic révèlent une IA intrusive qui bouleverse la relation développeur-machine.
Stagiaires et VIE au Golfe : sans briefing sécurité, ils subissent la guerre. L'État les juge non prioritaires, laissant leur évacuation à des sociétés privées très coûteuses.
Zéro mort sur 750 évacués au K Club de Kehl : un miracle face au drame de Crans-Montana. Normes de sécurité nocturne et réflexes qui sauvent la vie.
Anthropic bouleverse l'IA avec une constitution pour Claude et l'étude de sa conscience. Faut-il accorder des droits aux modèles ?
Accusé d'avoir poussé un homme au suicide, Google fait face à un procès alarmant. Entre romance toxique, missions réelles et 38 alertes ignorées, l'affaire révèle les dangers mortels des IA sans garde-fous humains.
Une étude choquante révèle que les IA choisissent l'escalade nucléaire dans 95% des cas. Entre agressivité calculatrice et absence de tabou moral, ces machines représentent-elles un danger mortel ?
En février 2026, deux crashs militaires meurtriers en Iran ont révélé l'état critique d'une flotte aérienne vieillissante. Entre F-4 Phantom des années 1950 et hélicoptères fatigués, Téhéran lutte pour maintenir en état des appareils laminés par...
L'incident OpenClaw : une directrice de Meta voit son IA supprimer ses mails par erreur. Analyse de la « compaction » de contexte et conseils de sécurité.