Вы находитесь на странице: 1из 5

Precio y capacidad de combustible de diferentes modelos de

automóviles
Para realizar este modelo, hemos obtenido una base de datos de vehículos llamada vehiculos1
que cuenta con 153 registros de automóviles, dentro de esta base de datos vamos a considerar
las variables precio en millones y capacidad de combustible.

 Y = Variable explicada (v. dependiente) = precio en millones

 X = Variable explicativa (v. independiente) = capacidad de combustible

Inicialmente se ve una relación lineal positiva entre estas variables.

Coeficientesa

Coeficientes
Coeficientes no estandarizados estandarizados

Modelo B Error estándar Beta t Sig.

1 (Constante) 8,239 1,194 6,899 ,000

Capacidad de combustible 1,423 ,065 ,873 22,024 ,000

a. Variable dependiente: Precio_millones

En la columna Sig. se muestran lo p valores, como estos son cero todo nivel de
significancia es mayor, por lo cual se rechaza la hipótesis nula que los parámetros del
modelo toman el valor cero, es decir los parámetros son significativos, entonces:

 a=8,239
 b=1,423

Resumen del modelob

R cuadrado Error estándar


Modelo R R cuadrado ajustado de la estimación

1 ,873a ,763 ,761 3,22078

a. Predictores: (Constante), Capacidad de combustible


b. Variable dependiente: Precio_millones

 R² = 0,763

Este valor significa que el porcentaje de reducción en la variación total que se consigue al
predecir con la recta de regresión es del 76,3% en lugar de usar la media muestral para predecir
la variable explicada. En conclusión el modelo funciona muy bien.

 Y = 8,239 + 1,423X

Este modelo implica que un incremento en una unidad en la variable capacidad de combustible
produce un incremento medio de 1,423 unidades en el precio de un vehículo.

Relación entre uso y la edad en las tarjetas de crédito


Se ha utilizado la base de datos tarjetas crédito que cuenta con 886 registros de usuarios de
tarjetas de crédito. Para este estudio se utilizaron las variables ordinales Edad y Utilización
categorizadas de la siguiente forma:
Edad * Categoría Utilización tabulación cruzada
Tabla de contingencias

Categoría Utilización

Ocasional Frecuente Habitual


Utilización Utilización Utilización Total

Edad Menor a 40 187 74 143 404

Entre 41 y 60 235 60 109 404

Mayor a 60 51 8 19 78
Total 473 142 271 886

Se hará una prueba Chi cuadrado de independencia, para la cual:

Hipótesis de contraste:

 H0 = Las variables Edad y Utilización son independientes.


 H1 = Las variables Edad y Utilización no son independientes.

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (2 caras)

Chi-cuadrado de Pearson 16,700a 4 ,002


Razón de verosimilitud 16,878 4 ,002
Asociación lineal por lineal 13,604 1 ,000
N de casos válidos 886

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mínimo esperado es 12,50.

Entonces el valor del estadístico para la prueba Chi cuadrado es 16,7.


Para el cual p-value =0.2% demasiado bajo luego para cualquier valor de significancia
superior a este, la hipótesis nula se rechaza, las variables Edad y Utilización no son
independientes, luego tiene sentido hacer análisis de asociación entre variables ordinales.

Medidas simétricas

Error estándar
Valor asintóticoa Aprox. Sb Aprox. Sig.

Ordinal por ordinal Gamma -,205 ,052 -3,907 ,000


N de casos válidos 886
a. No se supone la hipótesis nula.
b. Utilización del error estándar asintótico que asume la hipótesis nula.
 H0 = Las variables Edad y Utilización no están asociadas.
 H1 = Las variables Edad y Utilización están asociadas.

El p-value=0 por lo cual se rechaza la hipótesis nula de que las variables no están asociadas.
Como el valor del estadístico Gamma es -0,205 el cual es bajo se puede interpretar que existe
una asociación moderada y negativa entre las variables Edad y utilización. Entre más edad
menos utilización de la tarjeta crédito (pero esta asociación no es fuerte).

Genero y la relación entre las diferentes categorías


Utilizando la misma base de datos pero analizando las variables nominales Género y Categoría
establecimiento categorizadas de la siguiente forma:

Genero*CategoriaEstablecimiento tabulación cruzada


Recuento

CategoriaEstablecimiento

Automovil Entreteni Musica - Restaur Salud y Vestuario -


es miento Hogar Libros antes Belleza Accesorios Total

Genero Femenino 94 21 13 24 83 63 167 465

Masculino 120 18 22 39 71 44 107 421


Total 214 39 35 63 154 107 274 886

Prueba Chi cuadrado de independencia:

Hipótesis de contraste:

 H0 = Las variables Genero y Establecimiento son independientes.


 H1 = Las variables Genero y Establecimiento no son independientes.

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (2 caras)

Chi-cuadrado de Pearson 24,599a 6 ,000


Razón de verosimilitud 24,732 6 ,000
Asociación lineal por lineal 17,328 1 ,000
N de casos válidos 886

Entonces el valor del estadístico para la prueba Chi cuadrado es 24,599.


P – value =0 siempre se rechaza la hipótesis nula. No son independientes, tiene sentido hacer
análisis de asociación entre variables nominales.

Medidas simétricas

Valor Aprox. Sig.

Nominal por Nominal Coeficiente de contingencia ,164 ,000


N de casos válidos 886

Ya que el coeficiente de contingencia es 0,164 y es significativo para cualquier nivel, implica que
existe una asociación entre las variables Género y utilización leve al ser 0,164 pequeño.

Вам также может понравиться