Вы находитесь на странице: 1из 4

Distribución estadística

Una distribución estadística, o una distribución de probabilidad, describe cómo


se distribuyen los valores para un campo. En otras palabras, la distribución
estadística muestra qué valores son comunes y no comunes.
Existen muchos tipos de distribuciones estadísticas, incluyendo la distribución
normal en forma de campana. Utilizamos una distribución estadística para
determinar cuál es la probabilidad de un valor concreto. Por ejemplo, si
tenemos un valor de chi-cuadrado, podemos utilizar la distribución chi-cuadrado
para determinar cuál es la probabilidad de este valor de chi-cuadrado.

Términos estadísticos
Aparecen muchos términos estadísticos en IBM® Watson Analytics. Es
importante comprender las definiciones de estos términos, ya que se aplican
a Watson Analytics.
 Cambio de R cuadrado de McFadden ajustado

El cambio de R cuadrado de McFadden ajustado es una medida del tamaño del


efecto para la prueba de comparación de modelo. Mide hasta qué punto mejora
el modelo completo la precisión del modelo en comparación con el modelo
reducido.
 R2 ajustado

R2 ajustado es un medida de bondad de ajuste corregida (precisión de modelo)


para los modelos lineales. Identifica el porcentaje de varianza en el campo
objetivo que se explica mediante la entrada o entradas.
 Estadísticas de rama

Las estadísticas de rama proporcionan información sobre la prueba estadística


que se ha utilizado para segmentar los registros en la rama del árbol.
 Categórico

Categórico es un tipo de nivel de medición. Un campo categórico es un campo


con un número limitado de valores distintos. Los valores representan un tipo o
una clase.
 Valor de chi-cuadrado

El valor de chi-cuadrado es un valor en la distribución chi-cuadrado. Una


prueba estadística genera un valor de chi-cuadrado. El valor especifica la
probabilidad de obtener el valor de chi-cuadrado de casualidad. Si la
probabilidad es menor que el nivel de significación, la prueba se considera que
es estadísticamente significativa.
 Continuo

Continuo es un tipo de nivel de medición. Un campo continuo se mide


numéricamente, así que las comparaciones de distancia entre valores son
apropiadas.
 V de Cramér

V de Cramér es una medida de tamaño de efecto para la prueba de chi-


cuadrado de independencia. Mide la fuerza con la que están asociados dos
campos categóricos.
 Regla de decisión

Una regla de decisión es un conjunto de condiciones que clasifican registros.


La regla predice un resultado en el campo objetivo.
 Desviación de la distribución normal

La desviación de la distribución normal es una medida de tamaño del efecto


para la prueba de K-cuadrado de D’Agostino de normalidad. Mide hasta qué
punto una distribución de campo no coincide con la distribución normal teórica.
 Desviación de la distribución general

La desviación de la distribución general es una medida de tamaño del efecto


para la prueba de distribución. Mide hasta qué punto una distribución
condicional no coincide con la distribución marginal del campo objetivo.
 Eta-cuadrado

Eta-cuadrado (η2) es una medida del tamaño del efecto para el análisis de
varianza (ANOVA). Mide la capacidad del efecto en un campo continuo.
 Valor F

El valor F es un valor en la distribución F. Diversas pruebas estadísticas


generan un valor F. El valor se puede utilizar para determinar si la prueba es
estadísticamente significativa.
 Frecuencia

La frecuencia es otra palabra para recuento. Mide el número total de registros o


el número de registros de un grupo específico. En otras palabras, la frecuencia
mide cada cuándo tiempo se produce un valor.
 Controlador clave

Un controlador clave es un campo de entrada o una combinación de campos


de entrada que tiene un efecto estadísticamente significativo en un campo
objetivo. Este efecto es más que una simple asociación porque el efecto está
dirigido. El campo o campos de entradas influyen en los valores del objetivo.
 Capacidad de diferencia de medias

La capacidad de la diferencia de medias es una medida de efecto del tamaño


para la prueba t de muestras emparejadas. Mide hasta qué punto difieren las
dos medias de dos campos continuos.
 Puntuación de z modificado

La puntuación de z modificado es una puntuación estandarizada que mide la


fuerza atípica o cuánto difiere una puntuación concreta de la puntuación típica.
Utilizando unidades de desviación estándar, aproxima la diferencia de la
puntuación de la mediana.
 Distribución normal

La distribución normal es una distribución teórica de valores. A menudo, se


denomina la curva de campana porque la representación visual de esta
distribución se asemeja a la forma de una campana. Es teórica porque su
distribución de frecuencia se deriva de una fórmula, en lugar de la observación
de datos reales.
 Distribución general

La distribución general es la distribución de registros en el campo objetivo


antes de cualquier agrupación con el campo o campos de entrada.
 R2

R2 mide el grado con el que se ajusta un modelo de regresión a los datos


reales. En otras palabras, es una medida de la precisión general del modelo. R
al cuadrado también se conoce como el coeficiente de determinación.
 Nivel de significación

El nivel de significación es el corte para juzgar un resultado como


estadísticamente significativo. Si el valor de significación es menor que el nivel
de significación, el resultado se juzga estadísticamente significativo. El nivel de
significación también se conoce como el nivel alfa.
 Valor de significación

El valor de significación, o valor p, es la probabilidad de que se produzca un


resultado por casualidad. El valor de significación se compara con un corte
predeterminado (el nivel de significación) para determinar si una prueba es
estadísticamente significativa. Si el valor de significación es menor que el nivel
de significación (de forma predeterminada, 0,05), la prueba se considera
estadísticamente significativa.
 Sesgo

El sesgo es una medida de la asimetría de una distribución. La distribución


normal es simétrica y tiene un valor de desvío de 0.
 Error estándar

El error estándar es una estimación de cuánto varía el valor de una estadística


de prueba de muestra a muestra. Es una medida de la incertidumbre de la
estadística de prueba. El error estándar podría abreviarse como error est.
 Distribución estadística

Una distribución estadística, o una distribución de probabilidad, describe cómo


se distribuyen los valores para un campo. En otras palabras, la distribución
estadística muestra qué valores son comunes y no comunes.
 Importancia estadística

La importancia estadística es un fallo sobre si un resultado se produce fruto de


la casualidad. Cuando un resultado es estadísticamente significativo, se quiere
dcir que es poco probable que el resultado se produzca fruto de la casualidad o
debido a la fluctuación aleatoria.
 Valor t

Un valor t es el resultado de una prueba estadística. El valor se encuentra en la


distribución t de Student que es apropiado para los grados de libertad. La
ubicación especifica la probabilidad de obtener el valor t por casualidad. Si la
probabilidad es menor que el nivel de significación, el resultado se juzga que es
estadísticamente significativo.