Вы находитесь на странице: 1из 3

n estadstica, la regresin logstica es un modelo de regresin para variables dependientes o de respuesta binomialmente distribuidas.

Es til para modelar la probabilidad de un evento ocurriendo como funcin de otros factores. Es un modelo lineal generalizado que usa como funcin de enlace la funcin logit. La regresin logstica es usada extensamente en las ciencias mdicas y sociales. Otros nombres para regresin logstica usados en varias reas de aplicacin incluyen modelo logstico, modelo logit, y clasificador de mxima entropa.

Resumen
La regresin logstica analiza datos distribuidos binomialmente de la forma

donde los nmeros de ensayos Bernoulli ni son conocidos y las probabilidades de xito pi son desconocidas. Un ejemplo de esta distribucin es el porcentaje de semillas (pi) que germinan despus de que ni son plantadas. El modelo es entonces obtenido a base de lo que cada ensayo (valor de i) y el conjunto de variables explicativas/independientes puedan informar acerca de la probabilidad final. Estas variables explicativas pueden pensarse como un vector Xi k-dimensional y el modelo toma entonces la forma

Los logits de las probabilidades binomiales desconocidas (i.e., los logaritmos de los odds) son modeladas como una funcin lineal de los Xi.

Note que un elemento particular de Xi puede ser ajustado a 1 para todo i obtenindose un intercepto en el modelo. Los parmetros desconocidos j son usualmente estimados a travs de mxima verosimilitud. La interpretacin de los estimados del parmetro j es como los efectos aditivos en el log odds ratio para una unidad de cambio en la jsima variable explicativa. En el caso de una variable explicativa dicotmica, por ejemplo gnero, e es la

estimacin del odds ratio de tener el resultado para, por decir algo, hombres comparados con mujeres. El modelo tiene una formulacin equivalente dada por

Esta forma funcional es comnmente identificada como un "perceptrn" de una capa simple or red neuronal artificial de una sola capa. Una red neuronal de una sola capa calcula una salida continua en lugar de una funcin por pedazos. La derivada de pi con respecto a X = x1...xk es calculada de la forma general:

donde f(X) es una funcin analtica en X. Con esta escogencia, la red de capa simple es idntica al modelo de regresin logstica. Esta funcin tiene una derivada continua, la cual permite ser usada en propagacin hacia atrs. Esta funcin tambin es preferida pues su derivada es fcilmente calculable:

Extensiones
Algunas extensiones del modelo existen para tratar variables dependientes multicategricas y/o ordinales, tales como la regresin politmica. La clasificacin en varias clases por regresin logstica es conocida como logit multinomial. Una extensin del modelo logstico para ajustar conjuntos de variables independientes es el campo aleatorio condicional.

Ejemplo
Sea p(x) la probabilidad de xito cuando el valor de la variable predictora es x. Entonces sea

Despus de algn lgebra se prueba que

donde

son los odds en favor de xito.

Si tomamos un valor de ejemplo, digamos p(50) = 2/3, entonces

Cuando x = 50, un xito es dos veces tan probable como una falla. Es decir, se puede decir simplemente que los odds son 2$ a 1

Вам также может понравиться