La Méthode du maximum de vraisemblance

C'est une technique qui, sous l'hypothèse que les variables ont une distribution connue, usuellement la distribution normale, permet d'estimer les paramètres d'un modèle (d'une équation ou d'un système, linéaire ou non linéaire) avec des restrictions sur les paramètres (coefficients, matrice de variances et covariances) ou non. Plus spécifiquement la technique consiste à construire une fonction appelée fonction de vraisemblance (construite à partir de la fonction de densité) et à maximiser son logarithme par rapport aux paramètres inconnus.

Par exemple, soit un modèle de régression simple:

et sont des scalaires,
sont des paramètres à estimer, et
est identique et indépendamment distribué selon une loi normale .

La méthode du maximum de vraisemblance est la suivante:

D'abord, on construit la fonction de vraisemblance qui est définie comme la fonction de densité conjointe des t observations:

Dans nôtre cas, dû au fait que les observations sont indépendantes, cette fonction est calculée comme le produit des fonctions de densité des observations individuelles:

Parce que la variable est distribué selon une loi normale, est aussi distribuée selon une loi normale (une combinaison linéaire de variables normales est aussi normale). Par conséquent la fonction de vraisemblance est:

Ensuite, pour faciliter la solution du problème de maximisation on calcule le logarithme de la fonction de vraisemblance (les résultats de la maximisation de la fonction de vraisemblance exprimée ou non en logarithmes sont identiques):

Finalement on maximise le logarithme de la fonction de vraisemblance par rapport aux paramètres inconnus .

On obtient un système de trois équations constituées par les conditions de premier ordre du problème de maximisation (les dérivées du logarithme de la fonction de vraisemblance par rapport à chacun des paramètres sont égalisées à zéro). Dans ce problème les estimateurs peuvent être facilement obtenus à partir de la solution du système.

Mais, très souvent, on obtient un système d'équations difficile à résoudre, raison pour laquelle on fait appel à des méthodes numériques, basées sur l'utilisation intensive de l'ordinateur (méthodes itératives). Le problème avec cette méthode est qu'on ne peut pas savoir si les estimations maximisent localement ou globalement la fonction de vraisemblance et par conséquent le choix des valeurs initiales pour les paramètres du modèle est important.