2-1 Extensions des sciences cognitives

2-1.1 Résolution de problème et apprentissage en IA

Le modèle IPS[2] (Newell & Simon, 1972) explique comment l'humain accompli des tâches de résolution de problème. Cette activité est décrite comme un processus de traitement de l'information. Le modèle de Newell & Simon ressemble à s'y méprendre au schéma des composantes d'un ordinateur. Nous avons là une entrée, une mémoire, un processeur qui est capable de traiter des informations sous forme symbolique et une sortie. Le modèle ne décrit pas la transformation entre modalités analogique et symbolique que le récepteur et l'effecteur doivent accomplir.

Les symboles sont organisés en structures désignatives ou en programmes.

Selon ce point de vue, une action intelligente est le résultat de la manipulation d'une représentation de la tâche dans le but d'accomplir un objectif. L'application d'un opérateur à la représentation de la tâche modifie les relations entre les objets présents dans la situation. Le modèle travaille sur une représentation interne du problème à résoudre et transforme la structure de l'état courant jusqu'à ce que l'état final soit atteint. Résoudre un problème revient à chercher un chemin menant de l'état initial à l'état souhaité dans un espace d'états possibles. Des heuristiques, par exemple des fonctions de coût, permettent d'optimiser le choix d'une règle d'inférence. Les plans d'action et les critères permettant de choisir entre plusieurs actions sont également connus sous l'appellation de stratégies.

Figure 2-1: Modèle "Information Processing System"

Le modèle IPS a été revu et a donné lieu à l'architecture Soar (State Operator Result) qui regroupe les fonctions essentielles mobilisées dans la résolution de problème. Les connaissances déclaratives, comme les connaissances procédurales sont définies en termes de productions. (Une règle de production est une liste de conditions qui, lorsqu'elle s'unifie avec le contenu de la mémoire de travail, donne lieu à une action particulière). Un programme d'intelligence artificielle est fait de règles qui sont des énoncés du type SI condition ... ALORS action x. L'expertise d'un système consiste à savoir choisir et appliquer les bonnes règles à un moment donné.

L'originalité de Soar est d'être capable d'apprendre lorsqu'il est confronté à des impasses dans la recherche d'un chemin menant de l'état initial à l'état final du problème. L'apprentissage a lieu par un mécanisme de "chunking" qui consiste à créer une nouvelle règle de production à partir de l'état du système au moment de l'impasse et de l'action qui a permis de la dépasser. L'application donnée en exemple dans le tutoriel SOAR[4] est la résolution du problème des blocs où le système commande un bras-robot pour empiler des plots selon une configuration donnée. D'autres applications du système SOAR sont le jeu des échecs ou encore la recherche de chemin pour sortir d'un labyrinthe.

La théorie d'acquisition des compétences ACT (Anderson & Corbett, 1992) montre quel modèle de l'apprentissage est sous-jacent à ce type d'approche. L'apprentissage consiste à compiler plusieurs cas particuliers (les connaissances sont d'abord déclaratives) en une règle de production générale, puis d'exercer celle-ci pour l'automatiser. L'exécution d'une tâche complexe, comme la programmation en LISP, correspond pour Anderson à l'alignement séquentiel de centaines de règles de production apprises indépendament les unes des autres. Pour ces auteurs il n'existe pas de styles d'apprentissage différents, au plus, les uns apprennent plus vite que d'autres.

Nous avons à faire à un modèle behavioriste de l'apprentissage selon lequel une compétence est décomposable en éléments minimaux qui sont appris par exercice. La seule différence entre un pigeon auquel on ferait apprendre une séquence comportementale par modelage et l'élève humain est que ce dernier peut apprendre les briques de savoir indépendament les unes des autres alors que le pigeon doit être conditionné en suivant exactement la séquence comportementale souhaitée. Le renforcement est direct pour le pigeon, - on lui donne de la nourriture à chaque ébauche de comportement qui va dans le sens souhaité - , indirect pour l'élève: en apprenant LISP il réussira ses examen et sera promis à une brillante carrière.

Kurt Reusser (à paraître) décrit les 4 modules qui composent généralement les environnements d'apprentissage informatisés[5] inspirés de l'approche "pure" de l'IA. Il est par ailleurs très critique quant à l'optimisme démesuré que l'automatisation et l'individualisation possibles de l'apprentissage par de tels systèmes ont soulevé.

  1. Le module expert contient une représentation des connaissances intrinsèques au domaine enseigné tel que le détiennent normalement les experts: faits, concepts et stratégies. Il contient également un programme qui est capable de résoudre les problèmes du domaine en utilisant les représentations précédemment évoquées et en les appliquant à un cas particulier.

  2. Le module de l'apprenant effectue une simulation cognitive de l'apprenant. Il doit permettre un diagnostic et une évaluation de faible granularité de la compréhension de l'apprenant, de son niveau de connaissance et des processus de raisonnement qu'il utilise. Par ailleurs il sert à identifier les connaissances et les compétences émergentes chez l'apprenant.

  3. Le module tuteur sert à orchestrer l'intervention pédagogique du système. Il doit pour cela être capable

  4. Le module d'interface utilisateur est responsable de l'ergonomie de l'interaction, c'est à dire de la communication entre système et utilisateur ainsi que de la manipulation directe, des graphiques et de la compréhension du langage naturel.

Les théories de l'apprentissage situé remettent vivement en question cette vision individuelle et décontextualisée du fonctionnement cognitif. Elles mettent l'accent sur le contexte d'apprentissage, une réalité entièrement absente dans la théorie ACT. En effet, il paraît de plus en plus évident que les conduites ne sont pas réglées par des plans d'actions stockés en mémoire comme dans les systèmes à base de règles. Les sujets ont plutôt tendance à régler leur conduite en fonction des différentes situations auxquelles ils sont soumis et ils n'agissent de façon similaire dans deux contextes distincts que par analogie perceptivo-motrice. Un sujet peut changer brusquement de but et d'intention au cours de la résolution d'une tâche, changeant par la même la signification du contexte dans lequel il est engagé. Pour les auteurs comme Suchman (1987) et Lave (1988), c'est l'interaction entre un agent et un contexte qui doit être qualifié d'intelligente, ce qualificatif n'ayant aucun sens quand il est appliqué au seul agent.

La section suivante est consacrée à l'approche de Smith (1994) qui utilise les composantes des architectures cognitives présentées ci-dessus (mémoire, stratégie, processeur) dans la perspective de la cognition distribuée, c'est à dire en suivant l'idée qu'un système cognitif est constitué de plusieurs humains et des artéfacts qu'ils utilisent.


[2] IPS est l'abréviation de 'Information Processing System'
[3] "Intelligence Artificielle" est dorénavant abrégée par IA
[4] http://ai.eecs.umich.edu/people/peter/soar/intro.html
[5] également connus sous le nom 'Intelligent Tutoring Systems'

Mémoire STAF - 24 OCT 1996

Generated with Harlequin WebMaker