Contenus

IA : si c’est gratuit, c’est vous le… turc


Avant la robotique et l’intelligence artificielle, les premières expérimentations dans le domaine des « automatismes Â» avaient déjà donné naissance à quelques fantaisies trop belles pour être vraies. Le « turc mécanique Â», un automate présenté au public en 1770 comme capable de jouer aux échecs et qui affronta les têtes couronnées de toute l’Europe, était en fait un canular, opéré par un humain caché à l’intérieur d’un mécanisme.

Aujourd’hui, malgré les avancées dans l’IA et la robotique, les robots ont encore besoin des humains pour de nombreuses tâches, ce qui est en fait plutôt rassurant ! Reste à clarifier un élément : si tout travail mérite salaire, comment le gâteau doit-il être partagé entre les créateurs d’IA et les utilisateurs qui les entraînent ?

Micro-travailler plus

En 2005, Amazon reprit de façon très assumée le terme de « turc mécanique Â» comme nom de son service de crowdsourcing de petites tâches par des humains, ou micro-travail, en échange de micro-rémunération. La place de marché « Amazon Mechanical turk Â», ou MTurk, compte à présent des centaines de milliers de travailleurs ou turkers, prêts à réaliser des tâches payées 20 cents, pour un salaire médian de 2 Dollars de l’heure. Cet exemple est encore loin du scénario idéal d’hybridation homme-machine qui bénéficierait en priorité aux humains. En fait, oublier la contribution des humains à toutes les étapes du « cycle de la donnée Â», de sa préparation à son analyse, serait comme oublier qu’à l’intérieur du turc mécanique il y avait un humain plié en deux pour donner l’impression d’une formidable avancée technologique.

L’humain peut donc pour le moment encore remercier le paradoxe de Moravec : « le plus difficile en robotique est souvent ce qui est le plus facile pour l'homme Â», c’est-à-dire les tâches sensorimotrices comme reconnaitre un objet, un visage, une voix. Dans son ouvrage « Mind Children Â» paru en 1988, le chercheur Hans Moravec explique qu’« un milliard d’années d’expérience sur la nature du monde et la façon d’y survivre ont été codées dans les grandes parties sensorielles et motrices hautement évoluées du cerveau humain ». Ainsi, les problèmes que nous trouvons faciles à résoudre résultent de millénaires d’évolution de l’Homme.

Donner pour recevoir

Une économie parallèle, basée sur le travail gratuit des internautes, s’est également mise en place de façon très naturelle pour de nombreuses sociétés technologiques, comme Google avec ses captchas, les petits tests de Turing permettant de déterminer si vous êtes un humain ou un robot. Chaque jour des centaines de millions de Captchas sont résolus par des humains, par exemple en reconnaissant parmi différentes photos celle qui montre un feu rouge. Ces tests permettent à la fois de sécuriser l’accès à des services en bloquant des robots spammeurs, mais aussi d’employer de façon positive tout ce temps passé par des humains à enrichir les métadonnées d’images (avec un texte descriptif) et bâtir des jeux de données qui pourront être exploités par des algorithmes d’intelligence artificielle. Or, pouvoir accéder à des données – notamment métier - en volume et en qualité (images, texte ou données numériques) est une clé de performance majeure pour l'IA et « le principal facteur d’accélération ou de limitation des innovations Â» (source : rapport « Intelligence Artificielle, état de l’art et perspectives pour la France Â» publié par le Pôle interministériel de Prospective et d’Anticipation des Mutations économiques (Pipame), février 2019).

Cercle vertueux et neurones convolutifs

Autre exemple intéressant de ces « Ã©changes de bon procédés Â» entre humains et IA, l'outil de traduction en ligne « Linguee Â», bien connu des communicants et marketeux, car il est gratuit et très efficace. Mais saviez-vous que cet outil gratuit vient alimenter une base de données permettant d'entraîner l'intelligence artificielle d'un logiciel payant de traduction de la société allemande DeepL ?

La société Linguee a été créé à Cologne en 2008 et son outil de traduction gratuit mis en ligne en 2010. Les traductions sont basées sur la comparaisons des requêtes des internautes avec des textes aspirés sur des sites gratuits comme ceux de la commission européenne, du bureau des brevets ou encore de l’Unesco. Les traductions sont donc totalement réalisées par des humains puisque basées sur de vrais textes. En 2007 l’équipe de Linguee a lancé son logiciel de traduction pour 7 langues (Français, anglais, allemand, espagnol, néerlandais et polonais – auxquels se sont ajoutés le Russe et Portugais depuis décembre 2018) et changé le nom de la société en DeepL. Comme l’indique ce nom, le service utilise du Deep Learning, ou apprentissage profond, basé sur des réseaux de neurones convolutifs constitués sur la base de données de Linguee. L’utilisation du mot neurones nous montre là encore que le « vivant Â» n’est pas loin. Ce sont des réseaux inspirés par la biologie, dans lesquelles les connexions entre neurones se basent sur le mode de fonctionnement du cortex visuel des mammifères.

Histoire de boucler la boucle de ce cercle vertueux basé sur la collaboration homme/animaux-machines - et de conclure cet article sur une vertigineuse mise en abîme - DeepL, associé à Quantmetry, a réalisé fin 2018 la traduction intégrale de l'anglais vers le français de l'ouvrage de référence « Deep Learning ». C’est en fait le premier livre au monde traduit par une intelligence artificielle (et relu avant publication par des scientifiques qui n’auraient fait que quelques ajustements « Ã  la marge Â»). Il aura fallu 12h à l’IA pour traduire les 800 pages de l’ouvrage, mais aussi trois mois de développement. La communauté scientifique peut désormais disposer de ces outils de traduction gratuitement, en mode open source, et pour le commun des mortels DeepL Pro est disponible sur abonnement à partir de 5,99 Euros par mois. Bien sûr vous pouvez aussi continuer d’utiliser le site gratuit de Linguee, ou « turker Â» pendant 4 heures pour payer votre abonnement mensuel.

Séverine Godet

Plus d'articles Contenus

+ TOUS LES ARTICLES Contenus
  • Bigflo, Oli, NEB et l’IA

    Tribune de Mathieu Vicard, directeur général de l’agence ...

  • Commerce, publicité, IA, influence, consommation, média, RH… 30 chiffres qu’il fallait retenir de ce début d’année

    Les mois de Janvier et Février sont toujours très intéressants pour une lecture globale des marchés qui nous entourent. Tel l’hiver qui sâ...

  • Michaël Nathan (SIG) – Savoir parler à tous : la communication publique à l’heure de l’expérience utilisateur

    Placée sous l’autorité directe du premier ministre, le Service d’information du Gouvernement (SIG) informe notamment le grand public des a...