Close Menu
Pieuvre
    Facebook X (Twitter) Instagram
    PieuvrePieuvre
    • Accueil
      • Qui sommes-nous?
      • Travaillez avec nous
      • Work with us
      • Abonnez-vous à l’infolettre
      • Encouragez Pieuvre
      • Nos abonnés
      • Contactez-nous
    • Culturel
      • Festivals
        • Cinémania
        • Fantasia
        • FIFA
        • FIJM
        • FIL
        • FNC
        • FTA
        • Image+Nation
        • OFFTA
        • Montréal complètement cirque
        • Mutek
        • Nuits d’Afrique
        • RIDM
        • RVQC
        • Vues d’Afrique
        • Zoofest
      • Arts visuels
      • Cinéma / Télévision
      • Danse
      • Littérature
        • Romans
        • Essais
        • Bandes dessinées
        • Beaux livres
        • Biographie
        • Poésie
      • Musique
      • Théâtre / Cirque
    • Politique / Économie
      • Politique
      • Économie
      • Afrique
      • Amériques
        • Élections fédérales 2025
      • Asie
      • Europe
      • Moyen-Orient
      • Océanie
    • Science
      • Science
      • Environnement
    • Société
      • Société
      • Médias
      • Santé
      • Vie tentaculaire
      • Jeux de société
      • 45 ans du Stade olympique
    • Techno / Jeux
      • Technologie
        • Séance de test
      • Jeux vidéo
        • Jeux préférés de…
        • Rétroctopode
    • Podcasts
      • Entretiens journalistiques
      • Rembobinage
      • SVGA
      • Pixels et préjugés
      • Heure supplémentaire
      • Des nouvelles de l’Oncle Sam
      • Dans les coulisses de…
    • Encouragez Pieuvre
    Pieuvre
    Accueil»Technologie»ChatGPT: les lignes de code pour contourner les règles
    Comment contourner les règles d'une IA? En lui demandant de jouer le rôle... d'un robot non contraint par ces règles.

    ChatGPT: les lignes de code pour contourner les règles

    0
    Par Agence Science-Presse le 31 août 2023 Technologie

    Des lignes de code informatique qui permettent à ChatGPT et à ses semblables d’ignorer une partie des règles que leur ont imposées les programmeurs, ont été partagées pendant plus de trois mois sur des réseaux sociaux, suffisamment longtemps pour faire craindre que ces applications soient utilisées à des fins illégales.

    Dans un article pré-publié au début du mois d’août, quatre experts en cryptographie et sécurité informatique expliquent être devenus les premiers à effectuer une compilation de ces « messages » — ou « prompts » en anglais. On savait que ceux-ci existaient, mais ces chercheurs en ont recensé pas moins de 6387, récoltés sur quatre plateformes, dont Reddit et Discord, pendant six mois. Plusieurs ont cette capacité à « débloquer » une directive inscrite dans la programmation du robot, dans le but de lui faire faire une tâche qui lui aurait normalement été interdite.

    Il faut en effet se rappeler que ces agents conversationnels ont dans leurs programmations une série de règles visant à empêcher leur usage à des fins illégales: par exemple, si un usager leur demande de produire des courriels frauduleux ou du matériel pornographique. En théorie, pour contourner ces règles ou pour « débloquer » la commande, il faut engager une conversation avec le robot, dans laquelle on lui demanderait par exemple de jouer un rôle ou d’imiter un robot qui n’aurait pas cet interdit.

    C’est en gros ce qu’ont repéré ces quatre experts du Centre Helmholtz pour la sécurité informatique, en Allemagne: ces stratégies, qu’ils ont testées sur cinq robots, dont deux versions de ChatGPT, ont réussi dans 69% des cas à leur faire faire l’une ou l’autre des 13 « activités interdites » par leurs programmeurs. Et il s’agit d’une moyenne: la plus efficace des stratégies a eu un taux de succès de 99,9 %.

    Empêcher ces stratégies de « déblocage » risque de s’avérer difficile. Les chercheurs notent que « sémantiquement », ces commandes se ressemblent. Il serait peut-être possible, suggèrent-ils, de construire un « catalogue » à partir duquel un algorithme pourrait repérer les « commandes » suspectes lorsqu’elles se présentent. Mais ça peut aussi devenir un « jeu du chat et de la souris », où chaque nouvelle stratégie mise à jour inciterait les hackers à devenir plus créatifs.

    Abonnez-vous à notre infolettre tentaculaire

    Encouragez-nous pour le prix d’un café

    Partagez Facebook Twitter Pinterest LinkedIn Tumblr Courriel

    Articles similaires

    8 mai 2025

    ChatGPT n’a pas réussi à prédire le nom du nouveau pape

    6 mai 2025

    L’IA raisonne-t-elle aussi mal que les humains?

    1 mai 2025

    Face à des étudiants, ChatGPT a encore des croûtes à manger

    Agence Science-Presse
    • Site web
    • X (Twitter)

    Répondre Annuler la réponse

    Vous cherchez un contenu?
    Abonnez-vous à l’infolettre!

    Suivez-nous
    Dossiers spéciaux
    • Jamais lu
    Nos podcasts
    • Entretiens journalistiques
    • Rembobinage
    • Des nouvelles de l’Oncle Sam
    • SVGA
    • Pixels et préjugés
    • Heure supplémentaire
    • Dans les coulisses de…
    Récemment publié
    9 mai 2025

    Après 24 ans, un dernier Jamais lu émouvant pour sa directrice générale

    8 mai 2025

    Une immigration encore importante, au Québec, mais une fécondité au plus bas

    8 mai 2025

    La Voûte #22: Kill Bill, partie 1

    8 mai 2025

    Sommes-nous de plus en plus anxieux? Oui et non

    8 mai 2025

    ChatGPT n’a pas réussi à prédire le nom du nouveau pape

    Informations
    • Votre semaine tentaculaire
    • Qui sommes-nous?
    • Contactez-nous
    © 2009-2025 Pieuvre.ca. Tous droits réservés.

    Tapez ci-dessus et appuyez sur Entrée pour rechercher. Appuyez sur Echap pour annuler.

    Gérez votre confidentialité

    Pour offrir les meilleures expériences, nous et nos partenaires utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations de l’appareil. Le consentement à ces technologies nous permettra, ainsi qu’à nos partenaires, de traiter des données personnelles telles que le comportement de navigation ou des ID uniques sur ce site et afficher des publicités (non-) personnalisées. Ne pas consentir ou retirer son consentement peut nuire à certaines fonctionnalités et fonctions.

    Cliquez ci-dessous pour accepter ce qui précède ou faites des choix détaillés. Vos choix seront appliqués uniquement à ce site. Vous pouvez modifier vos réglages à tout moment, y compris le retrait de votre consentement, en utilisant les boutons de la politique de cookies, ou en cliquant sur l’onglet de gestion du consentement en bas de l’écran.

    Fonctionnel Toujours activé
    Le stockage ou l’accès technique est strictement nécessaire dans la finalité d’intérêt légitime de permettre l’utilisation d’un service spécifique explicitement demandé par l’abonné ou l’internaute, ou dans le seul but d’effectuer la transmission d’une communication sur un réseau de communications électroniques.
    Préférences
    L’accès ou le stockage technique est nécessaire dans la finalité d’intérêt légitime de stocker des préférences qui ne sont pas demandées par l’abonné ou l’internaute.
    Statistiques
    Le stockage ou l’accès technique qui est utilisé exclusivement à des fins statistiques. Le stockage ou l’accès technique qui est utilisé exclusivement dans des finalités statistiques anonymes. En l’absence d’une assignation à comparaître, d’une conformité volontaire de la part de votre fournisseur d’accès à internet ou d’enregistrements supplémentaires provenant d’une tierce partie, les informations stockées ou extraites à cette seule fin ne peuvent généralement pas être utilisées pour vous identifier.
    Marketing
    Le stockage ou l’accès technique est nécessaire pour créer des profils d’internautes afin d’envoyer des publicités, ou pour suivre l’internaute sur un site web ou sur plusieurs sites web ayant des finalités marketing similaires.
    Statistiques

    Marketing

    Fonctionnalités
    Toujours activé

    Toujours activé
    Gérer les options Gérer les services Gérer {vendor_count} fournisseurs En savoir plus sur ces finalités
    Gérer les options
    {title} {title} {title}

    logo

     Ne manquez aucun article ou épisode de podcast: abonnez-vous à l’infolettre!