jeudi 7 décembre 2017

Intelligence Artificielle - L'abstraction en reconnaissance automatique

Une équipe de chercheurs du Lamsade (Laboratoire d'analyse et modélisation de systèmes pour l'aide à la cision, Université Paris-Dauphine/CNRS), composée des chercheurs-enseignants, maître de conférences, Florian Yger et Benjamin Negrevergne de Paris-Dauphine, et Adrian Lecoutre, étudiant à l'INSA de Rouen, travaillent à mettre au point une Intelligence Artificielle: Le "Rasta Project"
pour Recognising Artistic Style Automatically
capable de reconnaître le style d'une peinture à partir de 25 styles prédéterminés: Abstract Art, Abstract Expressionism, Art Informel, Art Nouveau (Modern), Baroque, Color Field Painting, Cubism, Early Renaissance, Expressionism, High Renaissance, Impressionism, Magic Realism, Mannerism (Late Renaissance), Minimalism, Naïve Art (Primitivism), Neoclassicism, Northern Renaissance, Pop Art, Post-Impressionism, Realism, Rococo, Romanticism, Surrealism, Symbolism et Ukiyo-e suivant la nomenclature proposée par le le site WikiArt (ou Wikipeinture) plateforme collaborative dédiée à la peinture.

Le Rasta project donne une probabilité de reconnaissance des styles des peintures à partir de ceux intégrés dans le logiciel par techniques d'apprentissage automatique sans avoir recours ni aux métadonnées, ni au différentiel colorimétrique.



La méthode de "reconnaissance des formes" repose sur le "deep-learning", c'est-à-dire l'apprentissage profond de la machine via la technique dite "des réseaux de neurones". La méthode n'est pas nouvelle, elle a été inventée dans les années 1950. Elle revient en force depuis les années 2000 et acquiert une célébrité médiatique avec la victoire d'Alpha-Go, programme de jeu de Go en 2015 et par la puissance démultipliée de calcul des machines. Le Rasta project fonctionne par couches successives, les premières sont dévolues à la reconnaissance visuelle. Chaque couche répond à une suite de protocoles différents. Le réseaux de neurones (nom métaphorique de la succession de couches) doit ainsi apprendre "par lui-même", pour classer de nouvelles images correctement, images qui lui seraient présentées et qui ne sont pas textuellement dans la data initiale. 





Pour l'instant L'IA bloque à un certain palier, en effet plus la reconnaissance est spécifique plus IA est performante, mais ayant atteint un apex ses performances décroissent ou confusent.



Ainsi si le "Rasta" reconnait Kandinsky (Fugue 1914) comme art abstrait à 100 %, ou un Mondrian figuratif (Arbre Rouge 1908-09) comme post-impressionniste,  il ne reconnait pas une Naissance de Vénus(1984) de Andy Warhol inspiré par la "Vénus de Botticelli" comme "Pop Art" mais comme "surréalisme à 94%, Informel à 2% et Naïf à 2 %" ... affichant sa généalogie stylistique ascendante, la machine reconnait l'inspiration de Warhol.



Mais pour une crucifixion d'Andrea del Castagno (v.1419-1457) qui est reconnue comme du Symbolisme à 26% et de la Renaissance Primitive à 26 % la machine propose sa généalogie descendante (son influence sur) avec comme bonne réponse "Romantisme" à 32%. Bien évidemment cet écueil provient en partie de la construction préalable et des choix discutables de WikiArt, dont nous devons admettre les présupposés (succinct) en art puisque cette data-base sert de support aux chercheurs de Lamsade. Ainsi la machine trouve la bonne réponse à 50% en moyenne, mais elle reconnait systématiquement les gravures japonaises au style caractéristique Ukiyo-e, mais se perd dans les catégories abstraites subtiles, entre minimalisme, Color field painting, Abstract art, Expressionisme abstrait... Le problème semble donc plutôt venir de la catégorisation des items initiaux de la base utilisée indépendante du Rasta project.

Un outil d'arbitrage ?

On peut s'interroger de l'intérêt relatif de cet outil en l'état et de sa classification de démonstration et de recherche, au-delà de la prouesse technique de programmation en Intelligence Artificielle. Il nous semble que développée cette technique (en en changeant la nomenclature de références) pourrait bien devenir un vrai "Shazam" (logiciel de reconnaissance musicale) des arts visuels, permettant de retrouver des œuvres analogues, au style similaire. On imagine l'utilité qu'un tel outil pourrait apporter pour les bases d'objets volés, qui malgré les maquillages et les changements d'attribution se retrouveraient reconnus puisque la reconnaissance se fait sans métadonnée, à la différence des Smartify,  Magnus ou Google Image qui eux utilisent de plus le différentiel de colorimétrie. On pense également à l'utilité qu'un tel outil pourrait avoir pour les bases de données d'artistes comme celle de l'ADAGP, permettant la reconnaissance les styles des artistes et pouvant devenir un outil remarquable pour la recherche des droits d'auteurs plastiques sur Internet, bien que l'utilisation d'une nomenclature de datas visuels sous droits (de moins de 75 ans) pose un problème déontologique.

Enfin, on imagine que ce type efficace d'outils logiciels  pourrait servir au classement des bases de données de peinture non classées, comme celles des Réalités Nouvelles, ouvrant même à de nouvelles définitions des pratiques de l'abstraction. On pourrait également envisager de créer un secrétariat virtuel des Réalités Nouvelles, automatisant ou aidant les choix du jury à accepter ou à refuser telle pratique ou telle œuvre, rejetant les œuvres figuratives en particulier, mais également  les sempiternelles n-ièmes citations, redites, rabâchages de style daté... Il faudra alors que le comité des Réalités Nouvelles - dans sa grande sagesse - définisse ce qui est acceptable ou pas dans une catégorisation des items de l'abstraction : grande question !

La question de la reconnaissance des images étant proche de celui de la génération automatique des images on peut également penser que cet outil - à terme - générera lui-même ses propres œuvres... et citations !

Un outil qui va, peut-être, se révéler à un avenir glorieux !


Erik Levesque