Le plus grand braquage de l’histoire est en cours (et il est légal)
Et le plus élégant, c’est qu’il est caché derrière une innovation de rupture.
Le casse du siècle n’a pas eu lieu dans une banque. Le plus grand braquage de l’histoire est en cours dans le calme absolu, derrière des serveurs climatisés, des communiqués triomphants et des démonstrations lisses où des intelligences artificielles rédigent, dessinent, codent et imitent des voix comme si elles avaient toujours su le faire.
Sauf qu’elles n’ont rien “inventé” seules. Elles ont mangé. Massivement.
Des articles, des livres, des photos, du code, des forums, des archives, des catalogues culturels... Des milliards de fragments de travail humain aspirés, nettoyés, compressés, puis revendus sous forme de services « intelligents ». [1, 2]
Voilà le cœur du sujet. Le récit officiel parle de révolution technologique. Le récit réel quant à lui évoque aussi l'extraction : extraction de valeur, extraction de mémoire, extraction de travail.
Sections principales de l'article :
- Pourquoi le pillage par l'IA n’a rien de magique
- Le braquage devient légal quand le droit arrive en retard
- Le vieux monde appelait ça de la copie. Le nouveau appelle ça de l’entraînement
- Le vrai jackpot n’est pas la technologie, c’est la rente
- Le journalisme est en première ligne, et ce n’est pas un hasard
- Artistes, auteurs, musiciens : même guerre, autre décor
- Ce que l’IA vole vraiment (ce ne sont pas seulement des contenus)
- Il faut sortir de la naïveté
- La vraie question
Et le plus troublant, c’est ceci : une partie de ce pillage s’abrite derrière le droit existant. En Europe, des exceptions de fouille de textes et de données permettent certains usages sur des contenus accessibles légalement, sauf opposition exprimée selon des formes bien précises, notamment lisibles par machine pour les contenus en ligne [3, 4].
Autrement dit : si vous n’avez pas mis la bonne pancarte, dans le bon format, au bon endroit, votre œuvre devient une ressource exploitable. Le coffre était à vous. La serrure aussi. Mais c’était à vous d’écrire vous-même l’avertissement que les robots accepteraient (peut-être) de lire.
Pourquoi le pillage par l'IA n’a rien de magique
Il faut arrêter de parler de l’IA comme d’une apparition mystique. Le mécanisme est industriel. Il suit une chaîne simple.

D’abord, des robots parcourent le web. Ils collectent des pages, des images, des textes, des métadonnées. Ensuite, tout cela est trié, filtré, dédoublonné, converti en unités exploitables par les modèles. Enfin, ces masses de contenus servent à entraîner des systèmes capables de prédire, reformuler, résumer, imiter et recombiner.
Le papier fondateur sur GPT-3 donnait au moins un mérite à ses auteurs : il montrait une partie de la « cuisine ».