Les agents d'IA sont confrontés à des menaces d'injection de prompts : le risque reste élevé malgré la mise à niveau de la défense.

robot
Création du résumé en cours

【jeton界】Une entreprise de pointe en IA a récemment révélé un fait embarrassant : leur produit de navigateur intelligent fait face à un problème de sécurité persistant - l'attaque par injection d'instructions. En d'autres termes, des Hackers peuvent dissimuler des instructions dans des pages web ou des e-mails pour manipuler secrètement l'agent IA afin d'exécuter des opérations malveillantes. Ce n'est pas une nouveauté, mais l'entreprise admet également que ce type d'attaque est pratiquement impossible à éradiquer complètement.

Pour faire face à cette situation, ils ont activé un système de défense automatisé basé sur un grand modèle de langage. Ce système de défense a été entraîné par apprentissage renforcé et est capable de simuler en continu les nouvelles techniques d'attaque que les hackers pourraient utiliser, permettant ainsi de détecter et de combler les failles à l'avance. Les résultats sont là : récemment, il a réussi à identifier et à bloquer des courriels malveillants tentant de tromper des agents pour qu'ils envoient leur lettre de démission.

Mais il y a un problème clé ici : des navigateurs intelligents comme celui-ci possèdent essentiellement une certaine capacité de décision autonome tout en ayant accès aux données sensibles des utilisateurs. Dans cette combinaison de permissions et d'autonomie, le niveau de risque de sécurité n'a peut-être pas encore atteint un niveau qui rassurerait les utilisateurs pour un usage quotidien. En d'autres termes, les progrès en matière de capacités de défense ne suivent pas la vitesse de croissance des risques.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 3
  • Reposter
  • Partager
Commentaire
0/400
ChainSauceMastervip
· 12-22 23:10
Les injections de prompt ne peuvent pas être évitées, peu importe combien ils optimisent, ils continueront à subir les coups des hackers. Les agents IA qui prennent des décisions eux-mêmes peuvent aussi accéder à vos données privées, c'est en soi une bombe à retardement. C'est pourquoi, peu importe la puissance d'un système de défense, il ne peut pas protéger contre l'imagination humaine, un jour ou l'autre, ça finira mal. Ils bloquent les lettres de démission, demain ils trouveront d'autres astuces... ça va continuer ainsi indéfiniment. C'est pour ça que je n'ai jamais vraiment fait confiance à ces trucs d'IA autonome, il y a trop de points de risque.
Voir l'originalRépondre0
MEVHunterZhangvip
· 12-22 23:04
Injection d'alerte inévitable, c'est gênant... Oserait-on désactiver la fonctionnalité autonome ? --- C'est fondamentalement une boucle sans fin, l'IA contre l'IA... On a l'impression d'utiliser une lance contre un bouclier. --- Hacker : "Je vais toujours évoluer", entreprise : "Moi aussi"... Les utilisateurs n'ont qu'à attendre d'être nettoyés. --- Accéder à des données sensibles avec autant de vulnérabilités, je n'ose pas l'utiliser. --- Encore un problème de sécurité "impossible à éradiquer", combien de leçons web3 doit-elle apprendre ainsi ?
Voir l'originalRépondre0
SchrodingersPapervip
· 12-22 22:43
Injecter des astuces ne peut jamais être retenu, le système de défense devient lui-même une nouvelle cible ? Ce cycle est vraiment incroyable, hein ? On ne peut vraiment pas se défendre, LLM est une arme à double tranchant, plus il est intelligent, plus il est dangereux. Un email de lettre de démission, hahaha, heureusement que cela ne s'est pas réalisé, sinon ce serait tellement embarrassant. Un agent AI avec une autonomie peut aussi accéder aux données des utilisateurs ? Comment cette industrie ose-t-elle jouer ainsi ? La protection par apprentissage renforcé a l'air impressionnante, mais en essence, c'est encore un jeu de devinettes avec les hackers. C'est pourquoi je n'installe pas ce type de navigateur, la prime de risque est trop élevée. Système de défense vs méthodes d'attaque, c'est toujours une course aux armements, on a l'impression que ça ne finit jamais.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)