Apprendre à parler aux robots

Author(s): 
<There’s a permission on file, I tell you, for an explorat’ree to the Cognitive Science la-bore’tree at the University. He’ll be interacting with robots even as we speak...>

(Michael Joyce dans afternoon, a story, 1987)

[User] - What are you?
- I am a person, here to prove myself human.
(Jabberwacky, 18 août 2010)

 

L’humain a de tout temps été un animal social fasciné par sa propre nature. Depuis la création des premiers ordinateurs, il a cherché à les doter de caractéristiques humaines, à en faire d’autres lui-mêmes. Créer une intelligence proprement machinistique ne lui a jamais suffi; il lui fallait réussir à façonner une intelligence artificielle anthropomorphique, permettant d’humaniser la machine et de communiquer avec elle d’égal à égal. Ultimement, l’ordinateur serait humain ou ne serait pas.

Un des premiers défis que se sont fixés les informaticiens a ainsi été de parvenir à créer un jour une machine capable de passer le test de Turing, c’est-à-dire de converser avec un individu de chair et de sang sans que celui-ci ne puisse déterminer s’il s’agit bien, quelque part à l’autre bout du terminal, d’un être humain ou d’un ordinateur qui génère les réponses s’affichant à l’écran. Mais s’attaquer à un tel défi impliquait de se lancer dans la course aux «chatterbots», ces logiciels capables de converser en temps réel avec un utilisateur humain.

Quelque 45 ans après l’apparition d’ELIZA, le premier chatterbot de l’histoire, où en sommes-nous? Avons-nous réussi à apprendre à parler aux robots? Et dans l’avenir, à quoi nous servirons ces nouvelles formes d’intelligence artificielle?

Les débuts: ELIZA

Le logiciel ELIZA a été créé par Joseph Weizenbaum en 1964-1966 dans le cadre du Projet MAC (Multi Access Computing / Machine-Aided Cognition), mené au Massachussetts Institute of Technology. ELIZA fonctionne selon un arrangement à deux niveaux:

Because the conversations must be about something, that is, because they must take place within some context, the program was constructed in a two-tier arrangement, the first tier consisting of the language analyzer and the second of a script. [1]

Dans un premier temps, ELIZA analyse les entrées soumises par l’utilisateur pour en décomposer la structure en unités significatives et isoler les mots-clefs. Ensuite, ELIZA doit se référer à un script complémentaire pour intégrer ces unités et ces mots-clefs à l’intérieur de phrases pré-formatées qui seront renvoyées comme «réponses» ou «questions» à l’utilisateur.

Pour démontrer l’efficacité d’ELIZA, Joseph Weizenbaum a créé le script «Doctor», imitant les techniques de psychothérapie rogerienne. En effet, selon Weizenbaum, «[t]he Rogerian psychotherapist is relatively easy to imitate because much of his technique consists of drawing his patient out by reflecting the patient's statements back to him» [2]. Parce qu’ELIZA fonctionne en reprenant constamment ce qui a déjà été dit par l’utilisateur (logique réactive non-innovatrice), il permet d’offrir facilement une performance convaincante, proche de la parodie, de la pratique psychothérapeutique.

ELIZA

Toutefois, l’utilisation de scripts fermés limite grandement les capacités d’ELIZA. Il s’agit bien d’une intelligence artificielle, mais d’une intelligence artificielle contextuelle rigide, appartenant à la catégorie des «scripted AI». ELIZA ne peut parler que de ce qui est déjà inclus dans le script, et ne fonctionne que si l’utilisateur fait appel à des formules grammaticales reconnues par le système.

Un nœud de problèmes…

Un chatterbot scripté (scripted AI) finira toujours par atteindre sa propre limite. Dès qu’un utilisateur parle du beau temps à un chatterbot scripté conçu pour discuter de services bancaires, l’illusion de présence humaine se brise et la machine se révèle. Même chose si l’utilisateur se met brusquement à converser dans une langue inconnue du chatterbot, à multiplier les fautes d’orthographe ou à utiliser des mots familiers plutôt que les termes standardisés.

Pour dépasser ces difficultés, les informaticiens ont dû se détourner des chatterbots scriptés pour développer des chatterbots évolutifs, identifiés comme des «learning AI». Ce tournant implique un changement de définition de l’intelligence, d’une vision réactive logique (à partir du déjà donné) à une vision prédictive émotive (recherche de la réaction appropriée) plus proche d’une réelle sensibilité humaine.

Le projet Jabberwacky

Le projet Jabberwacky, visant à développer un chatterbot capable de passer le test de Turing en exploitant une logique évolutive d’apprentissage, a été mis sur pied par le Britannique Rollo Carpenter en 1982. Le premier prototype fonctionnel du chatterbot, baptisé Jabberwacky (du nom du projet lui-même), a vu le jour en 1988 et a été mis en ligne quelque neuf ans plus tard, en 1997. Le Jabberwacky n’utilise pas de script pour converser avec l’utilisateur; il fonctionne plutôt comme un moteur de recherche, exploitant une banque de données évolutive constituée de l’ensemble de ses conversations antérieures. À partir de la dernière phrase entrée par l’utilisateur, le Jabberwacky cherche les conversations antérieures pour localiser des phrases similaires. Les autres répliques déjà entrées (à tour -1, tour -2, tour -3, etc.) servent ensuite à affiner la recherche pour limiter les résultats aux conversations ayant des profils thématiques relativement similaires. Au lieu de reprendre le contenu des répliques antérieures de l’utilisateur pour composer une réponse logique, le Jabberwacky utilise ce système de recherche pour identifier une conversation de référence où un autre utilisateur a déjà fourni une réponse humaine à un énoncé similaire. Ultimement, c’est cette réponse humaine qui est appelée à l’écran. Une nouvelle recherche est effectuée à chaque nouveau tour, et les énoncés inscrits par l’utilisateur s’ajoutent parallèlement en temps réel à la banque des énoncés disponibles. Bref, l’utilisateur converse avec les fantômes de tous les utilisateurs précédents, réunis dans une seule entité.

Jabberwacky

Les réactions du Jabberwacky ne présentent ainsi souvent aucun lien logique formel avec les énoncés précédents, mais ne sont pas pour autant dépourvues de cohérence. N’étant pas conçu pour extraire un sens de ce qui est dit par l’utilisateur mais plutôt pour apprendre à réagir de façon humainement appropriée, le Jabberwacky intègre les réactions émotives surprenantes qui donnent leur saveur particulière aux conversations humaines. Et plus il y a d’utilisateurs qui conversent avec le Jabberwacky, plus ses réactions gagnent en subtilité. En effet, plus la banque des conversations de référence est importante, plus les chances d’y trouver un énoncé approprié sont grandes. Aussi, contrairement à ELIZA, le Jabberwacky peut intégrer sans problème des énoncés en langue étrangère et travailler sur du matériel grammaticalement incorrect. En date du 18 août 2010, le Jabberwacky possédait un répertoire de près de 42 millions d’énoncés.

De 1988 jusqu’au milieu des années 2000, le projet Jabberwacky était essentiellement expérimental et ludique. Grosso modo, Rollo Carpenter disait simplement souhaiter être le premier à créer un chatterbot évolutif aussi performant, grâce aux millions d’internautes participant au Jabberwacky par leurs discussions. Mais le projet a depuis pris un tout autre tournant… Au lieu de se concentrer sur le perfectionnement de la seule entité Jabberwacky, Carpenter s’est mis à lui créer des avatars. Ainsi sont apparus George et Joan, un an plus tard.

George

Au lieu de laisser George et Joan utiliser librement la banque de données du Jabberwacky, Carpenter les a dotés de données identitaires de base – nom, âge, occupation, etc. – et de schémas émotifs. Ainsi, George et Joan sont devenus des chatterbots évolutifs semi-scriptés. La personnalité de George, «porte-parole» de Jabberwacky, a été conçue pour être plus attirante pour un certain public éduqué, issu du domaine des arts et des médias. On a même pu le voir en entrevue sur les ondes d'ABC NEWS… Quant à Joan, représentée par une jeune femme à l’allure professionnelle, elle accueille maintenant les visiteurs sur le site d’Icogno, compagnie spécialisée dans le développement de logiciels d’intelligence artificielle ayant travaillé sur le projet Jabberwacky. Au-delà des visées premières du projet, Carpenter est en train de décliner le Jabberwacky en une foule d’avatars commercialisables. Les internautes peuvent même, pour 30$ par année, obtenir leur propre avatar. Celui-ci peut être semi-scripté pour utiliser certains motifs conversationnels plutôt que d’autres et présenter certains traits de caractère précis. Il peut aussi être personnalisé selon une série de données identitaires de base (nom, âge, etc.). Ces avatars peuvent être mis en ligne sur les sites personnels des acheteurs. Toutes les conversations qu’auront ces avatars demeurent toutefois la propriété de Jabberwacky, qui les assimile à sa banque centrale d’énoncés… Le Jabberwacky est en train de devenir une identité tentaculaire, constitué de la fusion d’une multitude d’avatars singuliers et capable de revêtir à tour de rôle la personnalité de chacun d’entre eux. (D’ailleurs, en allant sur le Jabberwacky, une petite fenêtre au-dessus de la conversation indique maintenant à quel avatar l’internaute s’adresse au fur et à mesure que la conversation évolue.)

Après cette seconde phase de développement visant l’ajout de personnalités alternatives pour le Jabberwacky, Carpenter s’est lancé dans l’exploration des habitudes de conversation d’un des groupes-cibles par excellence sur le plan économique: les jeunes de 15 à 35 ans. En 2008, le chatterbot Cleverbot était en effet mis en ligne, avec une interface plus simple. Mais au-delà du nom, Cleverbot est le Jabberwacky. Autrement dit, Cleverbot fonctionne sur la banque d’énoncés du Jabberwacky et participe à son développement. La seule différence est que Cleverbot est plus convivial, disponible en application payante pour téléphone cellulaire, et a été l’objet d’un marketing plus important pour attirer le public. (Cleverbot est maintenant répertorié dans le Urban Dictionary et fait partie de la culture populaire sur le Web, connaissant grâce aux internautes qui le visitent tous les derniers mèmes, les dernières blagues, les paroles des chansons de Rick Astley, etc.) Bref, pour 2,99$ par mois, un utilisateur peut s’amuser pendant ses temps libres à enseigner au Jabberwacky comment parler comme lui et ainsi devenir le parfait porte-parole pour une nouvelle génération de consommateurs.

Cleverbot

Rollo Carpenter est en train de mettre la table pour une révolution des ventes et du service à la clientèle, à travers la technologie du Jabberwacky. En effet, en visitant le site Web de la compagnie Existor, le dernier né de l’empire de Carpenter, on a l’impression de naviguer en pleine science-fiction: derrière tous les gentils avatars du Jabberwacky se terre tout un discours sur l’avenir des VPA (Virtual Personal Assistants) dans la restructuration des entreprises et des avantages de l’AI Avatar Marketing pour fidéliser la clientèle, en limitant les investissements en personnel humain. Tout cela est présenté sur le ton le plus joyeux, dans la mystérieuse section «answers» du site de la compagnie. Si l’aspect très futurologiste du discours fait d’abord sourire (l’esthétique du site n’est d’ailleurs pas sans rappeler celles de faux sites technologistes canularesques, comme Bioteknica et Havidol – couleurs pastels, énoncés brefs sur-vitaminés, etc.), le rythme galopant auquel le Jabberwacky acquiert de nouvelles connaissances laisse toutefois perplexe. Avec les efforts conjugués de Cleverbot et de tous les avatars du Jabberwacky, sommes-nous si loin du futur annoncé par Carpenter?

Existor

Depuis la naissance d’ELIZA, les chatterbots ont connu des développements phénoménaux. Grâce au passage des chatterbots scriptés aux chatterbots évolutifs et évolutifs semi-scriptés, nous commençons à entrevoir la possibilité de réussir, enfin, le fameux test de Turing. Mais que se passera-t-il ensuite? Sans vouloir donner dans l’anticipation façon I, Robot (Isaac Asimov, 1950), à quoi sommes-nous en train de donner naissance en discutant avec tous les avatars du Jabberwacky disséminés sur le Web, dont le très populaire Cleverbot? J’ai hâte de voir si, dans vingt ans, je reconnaîtrai une ligne tirée d’une de mes vieilles recettes de chili dans une conversation avec le chatterbot de ma compagnie de placement immobilier…

[1] et [2] Weizenbaum, Joseph (2003 [1976]) "From Computer Power and Human Reason. From Judgment to Calculation" dans Noah Wardrip-Fruin et Nick Montfort, The New Media Reader, p. 369. Cambridge (MA) et Londres (Angl.): The MIT Press.