On a beaucoup entendu parler de GPT2 ou GPT3, ces énormes programmes informatiques capables de produire des textes très réalistes, et même de la poésie. GPT2 et GPT3 sont en fait des « modèles », des espèces de bases de connaissances, alimentés par des milliards de phrases et de textes glanés sur Internet, et « digérés » afin de pouvoir produire des textes nouveaux, inspirés des textes anciens, mais en même temps très différents.
Ajouter des contraintes
Pour produire de la poésie, il « suffit » dây ajouter des contraintes : surveiller les rimes et la longueur des vers, respecter la structure globale, lâabsence de répétition en position rimée, etc. Les systèmes de génération automatique connaissent un certain succès (on en trouve un nombre phénoménal sur Internet) car la tâche est amusante, ludique, mais aussi complexe si on veut produire des textes avec du sens (et encore plus si on veut contrôler ce qui est dit).
On a donc ici un cadre idéal pour expérimenter (souvent hors contrainte de financement) : la génération de poésie est souvent un loisir et un passe-temps, chez le chercheur comme chez lâamateur éclairé.
Une question se pose toutefois. Ces systèmes sont-ils dignes d’attention ?
Sur le plan littéraire, la plupart des systèmes sont encore, il faut bien lâavouer, assez rudimentaires et ont du mal à rivaliser avec du Baudelaire ou du Rimbaud. Les plus avancés sont toutefois bluffants, et câest avant tout la base dâentraînement qui joue un rôle crucial (câest-à -dire lâensemble des textes qui ont permis au système dâapprendre. On peut en effet fournir à un système un jeu de données réduit, mais spécialisé (des Åuvres de poètes du XIXe siècle par exemple) pour « spécialiser » un système, lâadapter à moindre coût. On peut alors obtenir des systèmes qui rédigent des paragraphes à la manière de Balzac, ou de la poésie à la manière de Baudelaire.
Il faut toutefois noter que les résultats apparaissant dans la presse (quâil sâagisse de génération de prose ou de poésie) sont souvent le fruit de multiples essais, voire le fruit dâun travail de postédition de la part du journaliste.
Le projet Oupoco
Le projet Oupoco (Ouvroir de poésie combinatoire) que nous avons développé avec une équipe du laboratoire LATTICE, avait un but plus modeste. à lâimage de lâexpérience de Queneau dans Cent mille milliards de poèmes, notre ambition première était de produire des milliards de poèmes simplement en recombinant des vers issus dâun corpus poétique français représentatif.
à cette fin, nous avons assemblé une base de plus de 4000 sonnets dâauteurs allant du début du 19e jusquâau début du XXe siècle. Alors que tous les vers de Queneau riment ensemble, il nous a fallu déterminer automatiquement la rime de chaque vers afin de pouvoir produire de la poésie avec rimes. Le projet était donc dès lâorigine davantage un projet dâanalyse quâun projet de génération (comme en témoigne cette vidéo.
Ce projet peut paraître dommageable, en ce quâil ferait passer la poésie pour du « nâimporte quoi ». Mais le but est évidemment bien différent. Des expériences concrètes et la rencontre avec le public nous ont montré que cette crainte est en grande partie injustifiée. Le public (jeunes et vieux, femmes et hommes) est amusé, intrigué, veut en savoir plus. Un public dâordinaire peu attiré par la poésie sâintéresse à ce qui est produit. Le public nâest pas naïf, même quand il sâagit dâenfants : il voit bien le caractère fabriqué, étrange et ludique de lâaffaire. Il sait que derrière ce qui est produit se cachent dâautres textes et lâincongruité dâun vers hors norme pousse souvent à aller voir le contexte original, câest-à -dire le poème dâorigine.
Le générateur de poésie, avec les dispositifs de diffusion qui vont avec (comme la Boîte à poésie, une Åuvre dâart conçue par lâAtelier Raffard-Roussel et permettant dâobtenir un objet portatif intégrant le générateur de poésie dâOupoco), permettent à un public large de renouer avec la poésie, alors que câest une forme souvent délaissée même par les lecteurs régulier.
Quant aux expériences en génération pure (où la poésie produite nâest pas composée à partir de vers préexistants, mais est réellement conçue par ordinateur), elles amènent à réfléchir à dâautres aspects. Sur le texte lui-même : quelle est la richesse du texte produit ? Quâest-ce qui fait la valeur dâun texte poétique ? Si on est dans le cadre dâune génération « à la manière de » (de façon similaire à la production de musique « à la manière de »), on peut sâinterroger sur la valeur du résultat, sur les caractéristiques dâun auteur, sur ce qui fait le style dâun auteur, finalement.
Différents niveaux de créativité
Ces questions amènent enfin à sâinterroger sur la notion de créativité elle-même. Margaret Boden, une informaticienne anglaise ayant développé une théorie sur la question, distingue trois niveaux de créativité, chez les humains comme chez les ordinateurs : la « créativité exploratrice », qui consiste juste à étendre un peu ce qui existe déjà (écrire un poème à la façon de Hugo) ; la « créativité combinatoire », qui consiste à combiner de façon originale des éléments existants autour de nous, mais de nature éloignée (les travaux de lâOulipo, mêlant littérature et contraintes mathématiques sont probablement de cet ordre). La troisième forme de créativité, qualifiée de « transformationnelle », est dâune autre nature, elle change radicalement la façon de voir la réalité et produit généralement toute une nouvelle lignée dâÅuvres. Margaret Boden parle de lâinvention du cubisme par Picasso ; on peut penser à lâabandon des codes du roman dans les années 1950, autour du nouveau roman, mais la notion de rupture en littérature serait un concept à discuter en lui-même.
Le système Oupoco, recombinant juste des vers existants, est indéniablement de nature exploratrice, même si cette exploration est fondée sur la combinatoire. Le Graal de la créativité par ordinateur serait dâatteindre la créativité transformationnelle, au sens que Boden accorde à ce mot. Un ordinateur serait-il capable dâatteindre ce niveau ? On peut en douter, car ce niveau implique une certaine conscience de soi, une prise de recul par rapport au réel, pour imaginer des mécanismes complètement nouveaux. Lâapprentissage artificiel, à la source de la plupart des développements récents et médiatiques en matière dâIA (intelligence artificielle), est très bon pour généraliser et recombiner les milliards de données reçues en entrée, mais est incapable de « faire un pas de côté », pour réellement transformer le réel.
Notons enfin que les humains apprennent aussi à partir de stimulis et par imitation. La nature et la réalité de la créativité transformationnelle nâest pas complètement prouvée. Peut-être quâà partir des milliards de perceptions reçues au cours de sa vie lâhomme est capable de recombiner de manière suffisamment libre pour donner lâimpression dâune créativité transformationnelle. On est alors au cÅur de la cognition !
Ont participé à Oupoco les personnes suivantes : Claude Grunspan, Mylène Maignant, Clément Plancq, Frédérique Mélanie Becquet, Marco Naguib, Yann Raphalen, Mathilde Saurat, ainsi que lâAtelier Raffard-Roussel.
Thierry Poibeau, DR CNRS, Ãcole normale supérieure (ENS) â PSL
Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire lâarticle original.
source : www.influencia.net