Les chercheurs ont automatisé le Jailbreaking des LLM Avec d'autres LLM
Les chercheurs ont automatisé le Jailbreaking des LLM Avec d'autres LLM
09 December 2023
Les chercheurs ont mis au point une technique d'apprentissage automatique automatisée, appelée TAP, qui peut rapidement exploiter les vulnérabilités des modèles à grand langage (LLM) et leur faire produire des réponses nocives et toxiques.