|
-
Distinction entre probabilité
et proportion :
La probabilité, comprise dans l' intervalle
(0;1), exprime le degré de confiance que l'on peut accorder à
l'apparition d'un phénomène, d'une situation inconnue.
Notation : 0.2% (proportion x 100)
La proportion, comprise dans le même
intervalle, est la caractéristique d'une situation connue
qui exprime une partie par rapport à un tout. Notation : .002
(probabilité/100)
La proportion sert à estimer une
probabilité, mais comme
l'indique la loi des grands nombres, lorsque la proportion est calculée
en fonction d'un nombre de plus en plus grand de cas, elle tend vers la
probabilité. |
-
La théorie de la probabilité
:
La théorie de la probabilité, utilisée
en statistique inférentielle, sert à décrire le comportement
des phénomènes aléatoires. Un événement
individuel aléatoire est imprévisible mais un ensemble d'événements
aléatoires a un comportement régulier, régi par des
lois rigoureuses. Ces lois permettent néanmoins de dire quelque
chose sur la probabilité que l'événement individuel
a de se produire ou de se produire d'une certaine manière.
La probabilité est donc définie
comme le degré de confiance que l'on peut accorder à
la réalisation probable d'un événement particulier. |
-
La distribution centrée réduite
:
La notion de distribution centrée réduite
dans les situations où deux épreuves, deux distributions,
ont chacune une échelle et une étendue différentes.
Ceci implique que leurs variables d'origine, leurs moyennes, leurs
variances et leurs écart type, ne sont pas analogues, ce qui rend
la comparaison impossible pour l'analyse des données. C'est pourquoi,
nous procédons à la transformation des variables d'origine
en utilisant la formule du score Z :
La démarche est la suivante :
- On soustrait la
moyenne à Xi, ce qui entraîne la diminution de chaque score
individuel (on remplace le score de départ par une mesure de l'écart
type entre son score d'origine et la moyenne). On soustrait donc
à chaque score une valeur constante, ce qui provoque une translation
de la distribution et fait correspondre la moyenne de la distribution
avec l'origine de l'échelle, le zéro (m-m=0).
- Ensuite, on divise
par l'écart type, ce qui va modifier la structure de l'échelle-même
et la variabilité de la distribution.
Cette démarche permet ainsi de transformer
deux distributions différentes en deux distributions identiques
que l'on nomme distribution normale. Cette distribution est uni modale
(un seul sommet en zéro), symétrique (des deux côtés
de ce sommet) et possède une moyenne égale à zéro.
Cette standardisation permet donc :
- de comparer
les résultats obtenus sur des variables différentes et des
variables d'échelles différentes
- de situer
chaque individu par rapport à un groupe, une population à
laquelle il appartient.
- de déterminer
une proportion d'individus dans une certaine zone de la distribution (relative
à la population). |
-
Utilisation de la table de la loi
normale réduite :
Le but de la table de la loi réduite
est d'associer au score Z une autre valeur, alpha, qu'on peut interpréter
en termes de proportion ou en termes de probabilité.
Cette proportion équivaut à la surface
comprise entre la courbe et l'axe horizontal des valeurs, sachant que la
surface totale sous la courbe (la probabilité totale) est égale
à 1.Alpha représente la proportion ou le pourcentage de la
population qui se trouve aux deux extrémités de la distribution,
et si on veut une seule extrémité, on divise alpha par
2. On appellera le score Z correspondant à une valeur alpha
Z alpha, qui représente à la fois les bornes positive et
négative de l'intervalle ne contenant pas alpha. On peut désormais
considérer alpha comme la proportion d'individus dont le score Z
est extérieur à l'intervalle pré-cité.
|
-
L'opération inverse (de alpha/2
à Xi) :
En partant de la valeur de alpha/2 en tant que
proportion, on la multiplie par 2 afin de trouver la valeur de alpha. Ensuite,
on consulte la table de la loi normale réduite qui en fonction de
cette dernière valeur va nous donner celle du score Z (Z alpha).
Et pour finir, nous utilisons la formule suivante:
|
-
On peut ainsi dire que.....
..... étant donné les deux valeurs
symétriques situées sur l'échelle (-Z alpha et +Z
alpha), la proportion de scores Xi situés entre ces deux limites
est égale à "alpha - 1" ou si vous préférez
|