Modele de logit

Long, J. Scott (1997). Modèles de régression pour les variables dépendantes catégorielles et limitées. Thousand Oaks, CA: Sage Publications. La régression logistique a été développée par le statisticien David Cox en 1958. 1 [2] le modèle de régression logistique binaire a des extensions à plus de deux niveaux de la variable dépendante: les sorties catégorielles avec plus de deux valeurs sont modélisées par la régression logistique multinomiale, et si les catégories multiples sont ordonnées, par ordinale régression logistique, par exemple le modèle logistique ordinale de cotes proportionnelles. [1] le modèle lui-même modélise simplement la probabilité de sortie en termes d`entrée, et n`effectue pas de classification statistique (ce n`est pas un classifieur), bien qu`il puisse être utilisé pour faire un classifieur, par exemple en choisissant une valeur de coupure et en classant les entrées avec probabilité supérieure à la coupure comme une classe, en dessous de la coupure comme l`autre; C`est une façon courante de faire un classifieur binaire. Les coefficients ne sont généralement pas calculés par une expression de forme fermée, contrairement aux moindres carrés linéaires; Voir § raccord modèle. Logit et probit diffèrent dans la façon dont ils définissent f (*). Le modèle logit utilise quelque chose appelé la fonction de distribution cumulative de la distribution logistique. Le modèle probit utilise quelque chose appelé la fonction de distribution cumulative de la distribution normale standard pour définir f (*). Les deux fonctions prendront n`importe quel nombre et la redimensionner pour tomber entre 0 et 1.

Par conséquent, quel que soit α + βx égal, il peut être transformé par la fonction pour donner une probabilité prédite. Toute fonction qui renverra une valeur entre zéro et un ferait l`affaire, mais il y a un modèle théorique plus profond sous-tendant logit et probit qui exige que la fonction soit basée sur une distribution de probabilité. La logistique et standard CDFS normaux s`avérer commode mathématiquement et sont programmés dans à peu près n`importe quel paquet statistique à usage général. Les modèles logit et probit sont appropriés lorsque vous tentez de modéliser une variable dépendante dichotomeuse, par exemple oui/non, d`accord/désaccord, like/aversion, etc. Les problèmes liés à l`utilisation de la ligne de régression linéaire familière sont plus facilement compris visuellement. Par exemple, disons que nous voulons modéliser si quelqu`un fait ou n`a pas la fièvre Bieber par la quantité de bière qu`ils ont consommé.