|
|
Principes généraux des coefficients d'associations: Introduction
Avec cette leçon, nous entrons en quelque sorte dans le vif du sujet
des coefficients d'association. Par contre, comme il s'agit d'une première
approche, nous n'entrerons pas encore dans les détails de ceux-ci,
mais plutôt s'agira-t-il de faire un survol très général
du sujet. Ainsi cette leçon se composera de trois parties:
-
Présentation du principe général, autrement
dit de la logique qui est sous-jacente aux coefficients d'associations
-
Définition du domaine d'application, ou quand utilise-t-on
les coefficients
-
Utilisations possibles des coefficients d'association, ou dans
quels circonstances ceux-ci peuvent nous servir
L'objectif de ce survol est que tu acquières déjà une
compréhension générale du fonctionnement des coefficients
d'association, qui devrait te permettre de mieux apréhender, le moment
venu, des explications plus substantielles. |
|
Le principe général qui est sous-jacent aux coefficients
d'association est comme leur nom l'indique celui d'association. Ce dernier
terme peut recouvrir une variété de significations, mais dans
tous les cas, il implique un lien entre au moins deux éléments
selon une modalité au moins. En d'autres termes, une association regroupe
ce qu'il y a de commun entre des éléments particuliers, donc
différents.
Dans le domaine qui nous concerne ici, il n'en va pas autrement: lorsque
l'on parle d'association, cela signifie que l'on s'intéresse au lien
qu'il existe, ou pas, entre deux variables. Pour être plus précis,
il s'agit de voir si un ensemble de cas est distribué de façon
similaire selon deux variables
.
Différents exemples d'associations |
Types d'associations |
Eléments associés |
Nature du lien |
Association de défense des animaux |
membres (individus) |
amour des bêtes |
Association d'idées |
idées |
phénomène psychologique |
Association statistique |
variables (cas) |
distribution |
Avec les coefficients, nous abordons un aspect spécifique de la notion
d'association, à savoir sa force. La force d'une association peut
généralement se mesurer de plusieurs manières.
Si nous prenons l'exemple d'une association de défense
des animaux et de l'environnement telle que le WWF Suisse, nous pouvons
considérer que ses 212.000 membres (plus que le plus grand parti de
Suisse, le Parti Radical avec 150.000 membres) ou que son budget de près
de 24 millions de francs (14 fois plus que celui du parti le plus "riche",
soit le Parti Socialiste avec 1.7 millions) sont des indicateurs d'une
association forte.
Dans le cas d'une association d'idées, nous voyons tout de suite qu'il
est plus difficile d'établir un critère qui rendrait compte
de la force de l'association. Peut-être pourrions-nous étudier
un certain corpus et repérer à chaque fois que nous retrouvons
l'association en question (par exemple l'association entre la couleur noir
et la mort dans le romantisme français), afin d'en attester la
vigueur.
Avec les associations statistiques, nous nous retrouvons dans une situation
plus proche de celles des associations d'intérêts que de celles
des associations d'idées; c'est-à-dire que nous disposons
d'instruments (critères) relativement précis pour mesurer la
force de l'association, les fameux coefficients d'association. Dès
lors, une des tâches principales, qui nous occupera tout au long du
cours, consiste à définir quel instrument, quel coefficient
est le plus adapté à la mesure que l'on veut réaliser.
Pour cela nous apprendrons à connaitre dans quelles condition utiliser
quel coefficient d'association. En reprenant le cas du WWF, il serait possible
que les critères qui ont été choisi, à
savoir le budget et le nombre de membres, ne soient pas de bons instruments
de mesure de la force de cette association; cela pourrait être vrai
dans le cas où le budget serait fortement déficitaire et la
cotisation des membres quasi nulle. Dans ce cas de figure, il s'agirait de
s'en réfèrer à d'autres critères, plus fiables.
A côté de cette problématique de l'adéquation
de l'instrument de mesure sélectionné, il faut toujours garder
en tête que tout instrument de mesure ne produit qu'un résumé
de l'information mesurée, et qu'en ce sens, les coefficients
d'associations au premier plan, ces instruments sont limités et ne
peuvent donc remplacer l'information initiale. Ainsi, si tu te
réfères à la température comme mesure
météorologique, tu obtiendras une information encore trop
grossière pour savoir comment t'habiller pour sortir: l'indication
15° Celsius te permet de savoir qu'il ne neige certainement pas mais
pas s'il pleut, ou si souffle un fort vent. |
|
Comme tu l'auras certainement compris à présent, les coefficients
d'association sont des instruments de mesure, permettant d'évaluer
la force de l'association, ou relation, entre deux variables. Cependant,
comme tout instrument de mesure, les coefficients d'associations ont un champ
d'application limité, c'est-à-dire que tous les types de
coefficients ne sont pas adaptés à tous les types de relations.
Pour reprendre la métaphore de la température, un thermomètre
médical est adéquat pour identifier un cas de fiêvre,
mais d'aucune utilité pour identifier la température de fonte
des métaux.
Dans le présent chapitre, nous ne verrons pas le domaine d'application
pour chaque différent coefficient mais pour les coefficients dans
leur ensemble; en ce sens, nous allons surtout voir dans quels cas il n'est
pas possible d'utiliser les coefficients d'association. Si l'on veut faire
vite, on peut dire que les coefficients d'associations permettent de
résumer les informations contenues dans un tableau croisé et
donc ne s'appliquent qu'aux relations susceptibles d'être
représentées dans un tableau croisé. Ce qui permet d'en
déduire par exemple que l'on n'utilisera pas de coefficients d'association
pour estimer la force de la relation entre deux variables apparaissant dans
un nuage de point.
D'un point de vue plus statistique, que
cela signifie-t-il? Simplement que les coefficients d'association sont
indiqués pour mesurer la force de la relation entre des variables
discrètes et non pas entre des variables continues. Le tableau ci-dessous
résume le type d'analyse appropriée selon le niveau de mesure
des variables dépendante et indépendante.
Niveau de mesure
des variables |
Indépendante |
Dichotomique |
Nominal |
Ordinal |
Intervalle (scale) |
D
é
p
e
n
d
a
n
t
e |
Dichotomique |
Tableau
croisé
(coefficients d'association) |
Recodage
|
Nominal |
Ordinal |
Intervalle (scale) |
Analyse de la variance |
Régression |
Les tableaux croisés constituent donc le domaine d'application des
coefficients d'association. Mais comme tu viens de le voir ci-dessus, les
tableaux croisés recouvrent un champ important de relations
différentes, et selon le niveau de mesure de chacune des variables,
certains coefficients sont adaptés et d'autre pas. Une des leçons
de ce cours sera dans cette optique consacrée à identifier
les différentes familles de coefficients et leurs domaines d'application
respectifs; mais pour l'instant nous allons d'abord nous attarder un moment
sur l'utilité des coefficients d'association en général. |
|
Nous avons vu maintenat que les coefficients d'associations servent à
nous donner une indication sur la force de la relation entre deux variables
présentées dans un tableau croisé. Nous avons vu aussi
qu'aucun coefficient ne peut se substituer à l'information dont il
traite (le tableau croisé est toujours plus riche que le coefficient
qui le résume). On peut dès lors se demander quelle utilité
trouve-t-on dans l'utilisation des coefficients statistiques?
Tout d'abord, il y a bien sûr la fonction de résumé
inhérente aux coefficients (on parle en ce sens de résumés
statistiques). Celle-ci a l'avantage de représenter une quantité,
parfois considérable, d'informations dans un seul résultat.
Ceci peut s'avérer très utile en matière de
présentation, lorsque par exemple il s'agit d'exposer une série
de grandes tendances sans que le détail des relations soit
nécessaire au lecteur/spectateur; dans ce cas en effet, une longue
succession de tableaux s'avérerait fastidieuse, tandis que des
coefficients d'associations peuvent contenir l'information suffisante au
propos, sans pour autant décourager l'attention du lecteur.
Dans le même ordre d'idée, l'utilisation de coefficients permet
de donner une valeur à une relation, ce qui donne un élément
de référence au moment de l'interprétation. En effet,
il y a deux aspects très différents dans les questions de
relations: il y a la relation que l'on pourrait qualifier d'objective,
c'est-à-dire de combien cette variable varie selon cette autre, et
il y a la signification de la relation, c'est-à-dire ce qu'implique
une relation forte ou pas, mais aussi ce qu'est une relation forte. Dans
ce second volet, entre en jeu l'attente théorique que l'on a de la
relation; prenons deux relations, l'une entre la croyance en Dieu et la croyance
au paradis, l'autre entre le sexe et le fait de voter pour le Parti Socialiste.
Si nous obtenons la même relation dans les deux cas, il y a fort à
parier que la relation nous paraisse assez faible dans le premier et très
forte dans le second. En effet, nous pouvions nous attendre a priori à
une très forte relation entre Dieu et le paradis, et en une relation
plutôt faible entre le PS et les femmes. Il y a donc toujours dans
une relation une part d'absolu et une part de relatif, ce que nous permet
justement de mettre en évidence, et de dissocier, les coefficients
d'association.
En rapport avec ce dernier point, nous pouvons trouver une autre
utilité, peut-être même la principale, aux coefficients
d'association, à savoir la possibilité de comparer. Cette
capacité réside justement dans cette espèce de
"neutralité" des coefficients. De la sorte, si les coefficients ne
nous disent rien sur la signification de telle ou telle relation, en revanche
ils nous permettent de savoir si une variable est plus liée avec la
variable x ou avec la variable z. Ainsi, sans avoir à se demander
si les relations en présence sont fortes ou non, les coefficients
nous permettent de dire par exemple que le niveau de post-matérialisme
est plus lié à l'éducation qu'au revenu.
|
|
|