{"id":18065,"date":"2024-09-04T11:20:34","date_gmt":"2024-09-04T15:20:34","guid":{"rendered":"https:\/\/notes.math.ca\/article\/a-propos-de-lia-generative\/"},"modified":"2024-09-11T11:42:40","modified_gmt":"2024-09-11T15:42:40","slug":"a-propos-de-lia-generative","status":"publish","type":"article","link":"https:\/\/notes.math.ca\/fr\/article\/a-propos-de-lia-generative\/","title":{"rendered":"\u00c0 propos de l&rsquo;IA g\u00e9n\u00e9rative"},"content":{"rendered":"<p>\u00a0<\/p>\n<p>Ce mois-ci, nous vous proposons un article de George Gr\u00e4tzer dans lequel il d\u00e9crit (et d\u00e9montre!) l\u2019utilisation de ChatGPT pour l\u2019\u00e9criture. Comme vous le savez probablement, ce robot conversationnel est bas\u00e9 sur un grand mod\u00e8le de langage (GML). Ces mod\u00e8les sont int\u00e9ressants d\u2019un point de vue math\u00e9matique, et ils r\u00e9ussissent mieux qu\u2019on ne pourrait le penser \u00e0 produire un texte d\u2019apparence naturelle.<\/p>\n<p>Je ne suis pas un expert en GML, mais ce que je comprends s\u2019explique peut-\u00eatre plus simplement par analogie avec un mod\u00e8le de langage plus petit et plus simple, datant du 20e si\u00e8cle, parfois connu sous le nom de \u00ab presse dissoci\u00e9e \u00bb (<em>\u00ab\u00a0dissociated press\u00a0\u00bb<\/em>). Cet algorithme, facilement mis en oeuvre par de petits programmes, et essentiellement un processus de Markov qui \u00e9tend de mani\u00e8re r\u00e9p\u00e9t\u00e9e une cha\u00eene de mots ou de caract\u00e8res <span class=\"wp-katex-eq\" data-display=\"false\">A_o A_1cdots A_n<\/span> sur la base des probabilit\u00e9s que la sous-cha\u00eene <span class=\"wp-katex-eq\" data-display=\"false\">A_{n-M}cdots A_{n-1}A_{n}<\/span> dans un texte source soit suivie de divers choix pour <span class=\"wp-katex-eq\" data-display=\"false\">A_{n+1}<\/span> (o\u00f9 <span class=\"wp-katex-eq\" data-display=\"false\">M<\/span> est fixe et <span class=\"wp-katex-eq\" data-display=\"false\">n<\/span> augmente).<\/p>\n<p>Au niveau des lettres, cela donne une soupe \u00e0 l\u2019alphabet pour <span class=\"wp-katex-eq\" data-display=\"false\">M=0<\/span> ou <span class=\"wp-katex-eq\" data-display=\"false\">M=1<\/span>. Au fur et \u00e0 mesure que <span class=\"wp-katex-eq\" data-display=\"false\">M<\/span> augmente, le r\u00e9sultat devient pronon\u00e7able, et finalement reconnaissable comme du fran\u00e7ais (en supposant que ce soit la langue du texte source). Pour des valeurs encore plus grandes, la grammaire devient g\u00e9n\u00e9ralement correcte; et finalement, le r\u00e9sultat est une sorte d\u2019ensemble construit \u00e0 partir de morceaux du texte source, comme un train roulant sur des rails avec seulement des points de commutation tr\u00e8s occasionnels. La version au niveau des mots \u00e9volue de la m\u00eame mani\u00e8re et un peu plus rapidement. Dans chaque cas, il existe un \u00ab point id\u00e9al \u00bb o\u00f9 le r\u00e9sultat est agr\u00e9ablement surr\u00e9aliste, un peu dans le style des travaux de l\u2019Ouvroir delitt\u00e9rature potentielle (OuLiPo), influenc\u00e9 par les math\u00e9matiques.<\/p>\n<p>Les grands mod\u00e8les de langage font \u00e0 peu pr\u00e8s la m\u00eame chose, mais avec des algorithmes de mod\u00e9lisation plus sophistiqu\u00e9s, empil\u00e9s sur plusieurs strates. Ils sont normalement form\u00e9s non pas \u00e0 partir d\u2019un seul texte source, mais \u00e0 partir d\u2019autant d\u2019\u00e9crits que les cr\u00e9ateurs peuvent mettre la main dessus. Et c\u2019est l\u00e0 que se situe la premi\u00e8re controverse. L\u2019utilisation de mat\u00e9riel pirat\u00e9 \u00e0 cette fin, comme \u00e0 toute autre fin, est certainement contraire \u00e0 l\u2019\u00e9thique et ill\u00e9gale. Mais qu\u2019en est-il du mat\u00e9riel, toujours sous droits d\u2019auteur, qui a \u00e9t\u00e9 mis \u00e0 la disposition du public? Le GML le plagie-t-il? Il est important de comprendre qu\u2019un GML ne stocke pas une copie de son mat\u00e9riel de formation : il stocke plut\u00f4t une foule d\u2019 \u00ab observations \u00bb \u00e0 son sujet, \u00e0 diff\u00e9rents niveaux d\u2019abstraction. Comme c\u2019est essentiellement ce que fait un lecteur humain, il pourrait sembler raisonnable que le GML soit autoris\u00e9 \u00e0 le faire aussi, \u00e0 moins que le travail ait \u00e9t\u00e9 publi\u00e9 avec des restrictions sp\u00e9cifiques sur son utilisation.<\/p>\n<p>Cette question est toutefois compliqu\u00e9e par les rapports sur l\u2019IA g\u00e9n\u00e9rative qui recrache des versions \u00e0 moiti\u00e9 m\u00e2ch\u00e9es mais reconnaissables du mat\u00e9riel d\u2019apprentissage, une sorte de \u00ab cryptomn\u00e9sie \u00bb. Je ne comprends pas tr\u00e8s bien pourquoi cela se produit, mais il se peut que certains mots ou noms n\u2019apparaissent que dans une seule oeuvre source, laissant le mod\u00e8le avec la \u00ab croyance \u00bb que si une cha\u00eene de texte contient, par exemple, un personnage appel\u00e9 Humbert Humbert, il n\u2019y a pas beaucoup de chemins \u00e0 suivre, et reconstituant des morceaux du roman de Nabokov. Quelqu\u2019un qui n\u2019a jamais lu \u00abLolita \u00bb pourrait avoir beaucoup de mal \u00e0 s\u2019en rendre compte : par cons\u00e9quent, les textes cr\u00e9atifs produits par une IA g\u00e9n\u00e9rative doivent \u00eatre publi\u00e9s (sitant est qu\u2019ils le soient) avec beaucoup de prudence!<\/p>\n<p>Ces IA g\u00e9n\u00e9ratives ont tendance \u00e0 \u00e9crire de bonnes phrases, qui s\u2019embo\u00eetent souvent pour former des paragraphes plausibles. ChatGPT ne vous dira probablement pas que \u00ab les id\u00e9es vertes incolores dorment furieusement \u00bb (<em>\u00ab\u00a0colorless green ideas sleep furiously\u00a0\u00bb<\/em>) \u00e0 moins qu\u2019on ne lui ait demand\u00e9 de citer Noam Chomsky. Cependant, \u00e0 mesure que l\u2019\u00e9chelle augmente, la tentative d\u2019imiter la \u00ab chambre chinoise \u00bb (<em>\u00ab\u00a0Chinese room\u00a0\u00bb<\/em>) de Searle commence souvent\u00e0 s\u2019effondrer. Cette prose si convaincante peut \u00e9noncer quelque chose de compl\u00e8tement faux : c\u2019est ce qu\u2019on appelle une \u00ab hallucination \u00bb. Il n\u2019y a rien d\u2019\u00e9tonnant \u00e0 ce que cela se produise : le programme ne conna\u00eet rien du monde! Nous pouvons imaginer un programme de Dissociated Press, form\u00e9 sur (par exemple) le texte de<em> Oliver Twist<\/em>, qui utilise suffisamment de lettres dans sa table de recherche pour produire des phrases \u00e0 peu pr\u00e8s grammaticales impliquant les personnages familiers, mais pas assez pour saisir l\u2019intrigue du livre. Les utilisateurs ont eu de s\u00e9rieux probl\u00e8mes \u00e0 ce sujet. R\u00e9cemment, l\u2019IA g\u00e9n\u00e9rative a \u00e9t\u00e9 utilis\u00e9e pour r\u00e9diger un document juridique. Malheureusement, l\u2019IA a invent\u00e9 certaines sources qu\u2019elle citait; le juge n\u2019apas appr\u00e9ci\u00e9 et l\u2019avocat a \u00e9t\u00e9 sanctionn\u00e9. Dans de tels cas, un mod\u00e8le de document \u00e0 l\u2019ancienne serait probablement plus s\u00fbr.<\/p>\n<p>George (comme vous le verrez) est un adepte enthousiaste de la premi\u00e8re heure, et il vous parlera du plaisir qu\u2019il y a \u00e0 l\u2019utiliser. Vous devrez d\u00e9cider vous-m\u00eame dans quelle mesure vous l\u2019utiliserez \u00e0 des fins plus s\u00e9rieuses.<\/p>\n<p>\u00a0<\/p>\n","protected":false},"author":11,"template":"","section":[23],"keyword":[],"class_list":["post-18065","article","type-article","status-publish","hentry","section-editorial-2"],"toolset-meta":{"author-4-info":{"author-4-surname":{"type":"textfield","raw":""},"author-4-given-names":{"type":"textfield","raw":""},"author-4-honorific":{"type":"textfield","raw":""},"author-4-institution":{"type":"textfield","raw":""},"author-4-email":{"type":"email","raw":""},"author-4-cms-role":{"type":"textfield","raw":""}},"author-3-info":{"author-3-surname":{"type":"textfield","raw":""},"author-3-given-names":{"type":"textfield","raw":""},"author-3-honorific":{"type":"textfield","raw":""},"author-3-institution":{"type":"textfield","raw":""},"author-3-email":{"type":"email","raw":""},"author-3-cms-role":{"type":"textfield","raw":""}},"author-2-info":{"author-2-surname":{"type":"textfield","raw":""},"author-2-given-names":{"type":"textfield","raw":""},"author-2-honorific":{"type":"textfield","raw":""},"author-2-institution":{"type":"textfield","raw":""},"author-2-email":{"type":"email","raw":""},"author-2-cms-role":{"type":"textfield","raw":""}},"author-info":{"author-surname":{"type":"textfield","raw":"Dawson"},"author-given-names":{"type":"textfield","raw":"Robert"},"author-honorific":{"type":"textfield","raw":""},"author-email":{"type":"email","raw":"rjmdawson@gmail.com"},"author-institution":{"type":"textfield","raw":"Saint Mary's University"},"author-cms-role":{"type":"textfield","raw":"Editor, CMS Notes"}},"unknown":{"downloadable-pdf":{"type":"file","raw":"https:\/\/notes.math.ca\/wp-content\/uploads\/2024\/09\/4-A-propos-de-lIA-generative-\u2013-Notes-de-la-SMC.pdf","attachment_id":18235},"article-toc-weight":{"type":"numeric","raw":"2"},"author-surname":{"type":"textfield","raw":"Dawson"},"author-given-names":{"type":"textfield","raw":"Robert"}}},"_links":{"self":[{"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/article\/18065","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/article"}],"about":[{"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/types\/article"}],"author":[{"embeddable":true,"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/users\/11"}],"version-history":[{"count":12,"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/article\/18065\/revisions"}],"predecessor-version":[{"id":18229,"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/article\/18065\/revisions\/18229"}],"wp:attachment":[{"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/media?parent=18065"}],"wp:term":[{"taxonomy":"section","embeddable":true,"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/section?post=18065"},{"taxonomy":"keyword","embeddable":true,"href":"https:\/\/notes.math.ca\/fr\/wp-json\/wp\/v2\/keyword?post=18065"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}