Le terme de manipulation directe a été introduit par Schneiderman (1982) pour nommer un style d'interaction caractérisé par:
Les interfaces reposant sur la manipulation directe offrent à l'utilisateur l'illusion de travailler directement sur les objets de la tâche plutôt que de transmettre des commandes à une machine. Comparez par exemple la commande "DELETE fichier-X" du DOS avec le correspondant en "manipulation directe" qu'offre le système d'exploitation de Macintosh: déplacer l'icône représentant le fichier-X jusque sur l'icône représentant la poubelle.
Les interfaces reposent sur la manipulation directe tant dans des logiciels de jeux (par exemple, certains simulateurs de vol), des traitements de texte WYSIWYG ('what you see is what you get') où l'on manipule directement le texte tel qu'il sera imprimé (exemple, en faisant glisser les taquets de justification), les logiciels de dessin (tracer une forme avec la souris plutôt que d'utiliser la commande du type "draw circle 90 25 30") et Authorware lui-même qui repose sur la programmation graphique. Parmi, les quatre styles d'interaction décrits, la manipulation directe est celui qui dispose du plus grand potentiel de développement dans les années futures. En effet, la création d'interfaces dits de 'réalité virtuelle' permettant de manipuler un objet en trois dimensions, de pénétrer virtuellement dans un objet permettra de créer de nouvelles métaphores qui rendront transparentes des manipulations qui sont encore complexes aujourd'hui.
Le succès de la manipulation directe s'explique par le fait qu'il réduit quasiment les connaissances requises aux concepts propres à la tâche. Les concepts propres à l'ordinateur et la syntaxe des commandes sont fortement simplifiés. L'interface convient donc aux novices, aux utilisateurs intermittents et aux experts. L'apprentissage est rapide et repose généralement sur une métaphore gestuelle prélevée dans le contexte dans lequel cette même est tâche est réalisée lorsqu'elle n'est pas informatisée. L'utilisateur apprécie la sensation de contrôler le système. Il est moins anxieux s'il sait que les opérations sont réversibles.
Selon (Hutchins, Hollan & Norman, 1986), la manipulation directe doit sa convivialité à deux facteurs: un engagement plus fort et une distance plus faible ('directness').
L'engagement correspond à l'impresion psychologique de manipuler un modèle du monde, voire d'y participer, plutôt que de conduire une conversation avec un partenaire. Nous trouvons ici deux métaphores utilisées dans la conception des interfaces: le système représente-t-il un environment sur lequel l'utilisateur agit ou un agent avec qui il communique..
La distance décrit l'écart entre la manière dont un utilisateur conçoit normalement le domaine et la manière dont ce domaine est représenté par l'ordinateur. Hutchins et al (1986) parlent de 'directness'. Un interface indirect force l'utilisateur à transformer la représentation des concepts, tel que lorsqu'il faut expliquer à un interlocuteur par téléphone comme se rendre à un endroit précis. Cet écart influence directement l'effort de l'utilisateur (en termes cognitifs) nécessaire pour traduire ses intentions en actions à l'interface ('articulatory distance').
La manipulation directe recours fortement au gestes deictiques avec le curseur: l'utilisateur pointe sur les arguments de ses commandes. La manipulation directe réduit la 'distance référentielle' (Hutchins, 1989), c'est-à-dire la distance entre l'argument utilisé dans une commande et l'objet concerné, puisque l'argument de la commande est une représentation unique de l'objet concerné. Par exemple, dans la commande 'dupliquer un objet', l'argument 'objet' est le fichier unique représenté par l'icône sur laquelle le sujet à cliqué.
La manipulation direct n'offrira pas de gain de convivialité si ces conditions ne sont pas remplies. Par exemple, le déplacement (assez lent) des icônes dans la version 4a du programme n'apporte pas d'information supplémentaire par rapport à simple sélection de ces icône dans la version 4b: le geste ne peut donc réduire la distanec référentielle par rapport à la destination de l'icône, puisque celle-ci est unique (emplacement sur le billet). La manipulation directe serait davantage justifiée si l'utilisateur devait déplacer ou assembler des objets dans un contexte où leur position relative ou absolue est pertinente. Il s'agit en particulier de logiciels de conception assistée par ordinateur (CAO).
La manipulation directe pose cependant un certain nombre de problèmes.
Les règles concernant la cohérence syntaxique s'appliquent également à la manipulation directe. Par exemple, dans de nombreux programmes de dessin, l'utilisateur doit utiliser les outils de dessin disponibles dans une palette. Lorsque l'utilisateur a utilisé cet outil, certains outils restent actifs tandis que d'autres sont automatiquement désactivés et doivent être re-sélectionnés. Une telle incohérence perturbe l'apprentissage. Pour certaines commandes, l'argument doit être sélectionné avant la commande (par exemple, cliquer sur un objet avant de sélectionner 'copier'), alors que pour d'autres c'est l'inverse (par exemple, sélectionner la command 'ouvrir' avant de cliquer sur le fichier à éditer).
Les interfaces conversationnels offrent des possibilités d'abstraction que ne possèdemt pas la manipulation directe, et vice-versa, la manipulation direct résoud certain sproblèmes de référence inhérents à la langue naturelle. Aussi certains auteurs cherchent à combiner ces deux styles d'interaction (Frohlich, 1993). Dans le système ACCORD (Lee & Zeevat, 1990), l'utilisateur doit mettre à jour une base de données décrivant la position des camions d'une entreprise de transport. L peut par exemple dire 'Il va au dépôt' tout en cliquant sur le camion référé par 'il'.
Enfin, la mariage entre manipulation directe et conversation semble pouvoir
se réaliser autour des théories pramatiques qui analysent
le dialogue en termes d'actes de langage (Brennan, 1990). C