notions de probabilité

Notions de probabilité

Distinction entre probabilité et proportion :

La probabilité, comprise dans l' intervalle (0;1), exprime le degré de confiance que l'on peut accorder à l'apparition d'un phénomène, d'une situation inconnue. Notation : 0.2% (proportion x 100)
La proportion, comprise dans le même intervalle, est la caractéristique d'une situation connue qui exprime une partie par rapport à un tout. Notation : .002 (probabilité/100)
La proportion sert à estimer une probabilité, mais comme l'indique la loi des grands nombres, lorsque la proportion est calculée en fonction d'un nombre de plus en plus grand de cas, elle tend vers la probabilité.

La théorie de la probabilité :

La théorie de la probabilité, utilisée en statistique inférentielle, sert à décrire le comportement des phénomènes aléatoires. Un événement individuel aléatoire est imprévisible mais un ensemble d'événements aléatoires a un comportement régulier, régi par des lois rigoureuses. Ces lois permettent néanmoins de dire quelque chose sur la probabilité que l'événement individuel a de se produire ou de se produire d'une certaine manière.
La probabilité est donc définie comme le degré de confiance que l'on peut accorder à la réalisation probable d'un événement particulier.

La distribution centrée réduite :

La notion de distribution centrée réduite dans les situations où deux épreuves, deux distributions, ont chacune une échelle et une étendue différentes. Ceci implique que leurs variables d'origine, leurs moyennes, leurs variances et leurs écart type, ne sont pas analogues, ce qui rend la comparaison impossible pour l'analyse des données. C'est pourquoi, nous procédons à la transformation des variables d'origine en utilisant la formule du score Z :

La démarche est la suivante :
     - On soustrait la moyenne à Xi, ce qui entraîne la diminution de chaque score individuel (on remplace le score de départ par une mesure de l'écart type entre son score d'origine et la moyenne). On soustrait donc à chaque score une valeur constante, ce qui provoque une translation de la distribution et fait correspondre la moyenne de la distribution avec l'origine de l'échelle, le zéro (m-m=0).
     - Ensuite, on divise par l'écart type, ce qui va modifier la structure de l'échelle-même et la variabilité de la distribution.
Cette démarche permet ainsi de transformer deux distributions différentes en deux distributions identiques que l'on nomme distribution normale. Cette distribution est uni modale (un seul sommet en zéro), symétrique (des deux côtés de ce sommet) et possède une moyenne égale à zéro.

Cette standardisation permet donc :
      - de comparer les résultats obtenus sur des variables différentes et des variables d'échelles différentes
      - de situer chaque individu par rapport à un groupe, une population à laquelle il appartient.
      - de déterminer une proportion d'individus dans une certaine zone de la distribution (relative à la population).

Utilisation de la table de la loi normale réduite :

Le but de la table de la loi réduite est d'associer au score Z une autre valeur, alpha, qu'on peut interpréter en termes de proportion ou en termes de probabilité. Cette proportion équivaut à la surface comprise entre la courbe et l'axe horizontal des valeurs, sachant que la surface totale sous la courbe (la probabilité totale) est égale à 1.Alpha représente la proportion ou le pourcentage de la population qui se trouve aux deux extrémités de la distribution, et si on veut une seule extrémité, on divise alpha par 2. On appellera le score Z correspondant à une valeur alpha Z alpha, qui représente à la fois les bornes positive et négative de l'intervalle ne contenant pas alpha. On peut désormais considérer alpha comme la proportion d'individus dont le score Z est extérieur à l'intervalle pré-cité.

L'opération inverse (de alpha/2 à Xi) :

En partant de la valeur de alpha/2 en tant que proportion, on la multiplie par 2 afin de trouver la valeur de alpha. Ensuite, on consulte la table de la loi normale réduite qui en fonction de cette dernière valeur va nous donner celle du score Z (Z alpha). Et pour finir, nous utilisons la formule suivante:

On peut ainsi dire que.....

..... étant donné les deux valeurs symétriques situées sur l'échelle (-Z alpha et +Z alpha), la proportion de scores Xi situés entre ces deux limites est égale à "alpha - 1" ou si vous préférez