LDA : Analyse Discriminante Linéaire
- niko
- 3 juil. 2018
- 1 min de lecture
L’analyse discriminante peut être prédictive ou descriptive. Il s’agit dans le premier cas de construire une fonction de classement (règle d’affectation, …) qui permet de prédire le groupe d’appartenance d’un individu à partir des valeurs prises par les variables prédictives. En ce sens, cette technique se rapproche des techniques supervisées en apprentissage automatique telles que les arbres de décision, les réseaux de neurones, … Elle repose sur un cadre probabiliste. Le plus connu est certainement l’hypothèse de distribution multinormale (loi normale). Additionnée à l’hypothèse d’homoscédasticité, les nuages de points conditionnels ont la même forme, nous aboutissons à l’analyse discriminante linéaire. Elle est très séduisante dans la pratique car la fonction de classement s’exprime comme une combinaison linéaire des variables prédictives, facile à analyser et à interpréter. Cette technique est, avec la régression logistique, très utilisée dans le scoring, lorsque nous voulons par exemple caractériser l’appétence – la propension à acheter – d’un client face à un nouveau produit.

Le classifieur LDA a avec une limite de décision linéaire, généré en ajustant les densités conditionnelles de classe aux données et en utilisant la règle de Bayes.
Le modèle correspond à une densité gaussienne à chaque classe, en supposant que toutes les classes partagent la même matrice de covariance.
Le modèle ajusté peut également être utilisé pour réduire la dimension de l'intrant en le projetant dans les directions les plus discriminatoires.
CODE PYTHON :
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis




Commentaires