Modéliser l'intercompréhension et l'acceptabilité d'un robot-compagnon
Les progrès en matière de robotique ont amené les chercheurs et les industriels à faire évoluer le concept
d’utilisation du robot de la fabrication de produit à l’accompagnement de personnes. On parle alors de robots
compagnons. De tels robots sont aujourd’hui développés à travers les laboratoires de recherche : Paro (Shibata
2007) ou Reeply au Japon (Satake 2009), iCub en Europe (Arbib 2008) Mds ou Leonardo au USA (Thomaz
2007) ou par des entreprises Aibo par Sony (SONY), Asimo par Honda (HONDA)…
Chaque robot s’attache à résoudre des aspects particuliers de l’interaction avec l’humain. Dans les thématiques
de recherche associées on notera entres autres :
• La reconnaissance de l’émotion chez un humain en étudiant la voix, le visage ou la posture,
• La génération d’émotions avec un robot,
• Le compréhension par le robot du sens de ce qui est dit par la voix, montrer par des gestes, exprimer
avec le corps
• La génération de mouvement du robot pour lui donner un « air naturel »
Les effets de ces recherches sont une augmentation des connaissances sur les traitements d’acquisitions
d’informations : vision, voix, posture et sur le rendu des robots : mouvements expressions, synthèse vocale,
texture de la « peau » …
En général les expérimentations menées sont à court terme. On met en présence un robot et un humain
pendant une période de temps de quelques minutes ou de quelques heures, puis on interroge la personne sur
son ressenti. Il n’existe pas aujourd’hui d’étude à long terme sur une interaction entre un robot et un humain.
Dans une perspective de vieillissement de la population, nombre de projets ont pour ambition de développer
des robots qui seront présents avec la personne sur de longues périodes de temps et de façon continue. C’est
le cas par exemple pour les robots compagnons d’aide à la personne. Dans ce cas le problème de
l’acceptabilité du robot pour une interaction longue et continue n’est pas encore étudié.
On peut alors s’interroger sur ce qui rendrait un robot acceptable au quotidien pour une personne.
Il est raisonnable de penser que quelques conditions vont être nécessaires :
- Sécurité : confiance dans le robot, il se déplace avec « naturel », ses gestes sont précis, il ne fait pas
des « bruits bizarres », il n’est pas « imposant » …
- Efficace : les tâches qui lui sont assignées sont réalisées vite et bien, il ne tombe pas en panne, il est
autonome …
- Compréhension : le comportement du robot n’est pas surprenant, il est en rapport avec ce qu’on lui a
dit ou ordonné, il est prédictible, il est sympathique, il est empathique.
Les contraintes de sécurité et d’efficacité sont aujourd’hui traitées par les recherches en robotique. Par contre la
contrainte de compréhension est souvent simplifiée et se résume à des réponses standardisées à des ordres
simples avec des réponses toutes faites. Ceci amène une question qui est l’objet de la recherche que nous
proposons ici :« Quel doit être le niveau de compréhension d’un robot compagnon pour être acceptable à long terme par un
humain? »
Ce sujet est aujourd’hui non étudié en tant que tel et surtout pas dans une perspective de définir les
fonctionnalités qu’il faudra intégrer au robot pour résoudre le problème de son acceptabilité à long terme.
Il est clair que les chercheurs en STIC n’ont pas la culture nécessaire pour appréhender seuls ces problèmes. Il
convient donc de s’inspirer des études en sciences humaines. En effet il parait clair que l’étude de la
communication entre les humains sera le point de départ du modèle que l’on pourra élaborer pour une
interaction homme/machine. Il convient donc de proposer un modèle d’ intercompréhension homme robot qui
puisse rendre la robot acceptable par l’homme à long terme.
Accompagner l’éducation aux interactions verbales plurilingues et interculturelles
L’émergence de la problématique interactionnelle en sciences du langage depuis les années a profondément
reconfiguré les enjeux de la recherche sur les pratiques linguistiques des humains, dépassant le paradigme
structuraliste dominante entre 1950 et 1980 et s’y substituant comme vecteur d’innovation scientifique depuis
lors. Considérant que la langue est, non pas une structure réglée pré-existante et mise en oeuvre dans la parole
(approche structuraliste), mais un flux de pratiques socialement organisées et organisantes émergent des
interactions, la recherche actuelle en science du langage a considérablement transformé ses méthodes
(passant de l’introspection expérimentale à l’enquête ethnographique de terrain), ses concepts (le répertoire
verbal et l’interaction en contextes sociaux diglossiques se substituant aux concepts de langue et de structure),
ses perspectives notamment en termes d’enseignement-apprentissage non plus des « langues » mais
d’enseignement-apprentissage des compétences plurielles à interagir en contextes linguistiques et culturels
spécifiques (Calvet, 2004 ; Blanchet, Calvet et Robillard, 2007).
Dès l’émergence de l’analyse des interactions en sociolinguistique (Gumperz, 1989a et b [traductions française
d’articles parus entre 1964 et 1982], le transfert de la notion de compétence à communiquer a été opéré dans
l’enseignement des langues (Hymes, 1984 ; Salins, 1992) donnant lieu à ce que l’on a appelé la « révolution
communicative » en didactique des langues. Le développement de cette approche a conduit à un ré-examen
approfondi et à une reconfiguration théorique des modalités d’acquisition des compétences linguistiques (Gajo
et Mondada, 2000), ouvrant vers la conceptualisation des compétences plurilingues et pluriculturelles — et non
plus simplement [mono-]linguistiques — (Castellotti et Py, 2002). C’est cette conceptualisation qui constitue la
base du Cadre Européen Commun de Référence pour l’Enseignement des Langues (2001 [1996] ; cf. Coste,
Moore et Zarate, 1997), aujourd’hui adopté dans l’ensemble des pays d’Europe, en Amérique du nord, au
Maghreb, et tendant à devenir LA référence mondiale. La mise oeuvre de ce cadre se concrétise par l’approche
actionnelle fondée sur une définition sociopragmatique des interactions verbales et paraverbales, qui dépasse
largement le champ des sciences du langage et convoque des facteurs notamment psychosociaux et
socioculturels (Blanchet, Moore et Rahal, 2008).
Or, ces facteurs restent à intégrer dans l’appareil conceptuel de référence pour une meilleure transposition
didactique, trop centrée jusqu’ici sur les aspects langagiers. Enfin, les usages de plus en plus développés de
ressources technologiques dans l’enseignement-apprentissage des compétences plurilingues et pluriculturelles
(les TICE) pose un double problème puisqu’ils impliquent également la maitrise de compétence à l’interaction
homme-machine, l’élaboration d’ergonomies de communication électronique adaptées à la fois aux ergonomies
sociocognitives, aux contextes culturels éducatifs et aux aspects spécifiques de l’objet visé (les compétences
aux interactions verbales plurilingues et pluriculturelles).
Vers des modèles généraux d’interaction et de communication en éthologie
Un certain nombre d’espèces animales partage avec l’homme une capacité d’adapter la communication au contexte social. L’apprentissage vocal est pour l’essentiel sous influence sociale (Snowdon & Hausberger 1997)et mène à des phénomènes d’identités de groupe ou de population via des "badges vocaux" ou des "dialectes" rappelant à une échelle plus simple les phénomènes de même nom chez l’homme (Hausberger et al. 2008a,
Henry et al. en prep.). L’interaction sociale joue un rôle crucial dans l’acquisition des compétences à produire,
percevoir et comprendre les signaux. Des "règles de communication" existent qui mènent à une coordination
temporelle des interlocuteurs ("tours de parole") et font que l(autre, selon qu’il s’y conforme ou non, sera
considéré comme un interlocuteur valide ou non (Hausberger et al. 2008b). Des singes peuvent même montrer
une attention particulière aux individus plus âgés, montrant que l’acceptabilité de l’autre dépend de ses
caractéristiques et des règles de fonctionnement sociales (Lemasson & Hausberger, sous presse).Chez les oiseaux chanteurs, comme chez l’homme, l’interaction sociale est généralement nécessaire non
seulement pour l’acquisition du chant (Baptista & Gaunt 1997, Kuhl 2003) mais pour apprendre la bonne
utilisation dans le contexte social approprié (West et al. 1997). Plus remarquable encore, seule une relation
sociale forte permet de développer les capacités perceptuelle à "entendre" l’autre (Cousillas et al. 2006, 2008,
Hausberger et al. 2009) : "cerveau social" et "cerveau vocal" se coordonnent (Kuhl 2003). De façon assez
similaire, c’est la qualité de l’interaction qui va déterminer la relation qu’humains et animaux domestiques
développent. On peut ainsi montrer qu’un cheval établit une "mémoire" généralisée et plus ou moins positive,
selon la qualité des interactions passées de l’homme (Fureix et al. 2009, Sankey et al. sous presse). Dans
l’autre sens, nos résultats chez l’oiseau suggèrent qu’une relation forte, même avec un substitut social, pourrait
agir au niveau central et lever des inhibitions.
L’interaction quotidienne avec un animal familier semble bien de fait avoir un impact sur le développement
cognitif et social d’enfants autistes (Grandgeorge et al. soumis) ;
Qu’ont donc tous ces phénomènes en commun ? Qu’est-ce qui fait qu’un partenaire devient ou non un
interlocuteur privilégié ? Quels sont ces processus assez puissants pour modifier le développement
cérébral/cognitif ?
La mise en commun de ces questionnements sur l’animal, leur approche "expérimentale" sur ce contexte
exceptionnel de la relation homme-animal avec les questionnements de sociolinguistique, puis leur
modélisation devrait permettre de faire 1) émerger des processus communs, 2) d’amener à des modèles
généraux pour 3) des applications majeures dans divers domaines allant de l’éducation, la thérapie jusqu’à l’ergonomie et le conseil en entreprises. Mieux différencier bases biologiques et culturelles dans le
fonctionnement |