Вы находитесь на странице: 1из 7

Politécnico Grancolombiano

Probabilidad
Estadística Descriptiva
Proyecto de aula
Andy Domínguez
Fernanda Moreno
José Novoa

Politécnico Grancolombiano - Estadística Descriptiva


Índice

1. Introducción
2. Objetivo
3. Variables y escala de medición
4. Exploración de datos
a. ¿Qué genero/categoría de aplicación es la más frecuente?
b. ¿Cómo se comporta el género de las aplicaciones con respecto a la variable
Installs?
c. ¿De qué género es la aplicación que tiene más rating?
d. ¿Cuál es el género de las aplicaciones con pago que los usuarios más
utilizan?
e. ¿Cuál es el comportamiento de Reviews contra el tipo de aplicación?
f. ¿Cuáles son las tres versiones de Android más usadas para las aplicaciones?
g. ¿Cómo es el comportamiento del tipo de aplicación en términos de las
descargas?
h. ¿Cómo sería la aplicación ideal?
5. Medida descriptiva de la variable precio (Price)
6. Conclusiones

Introducción
Basándonos en las herramientas que nos brinda la estadística descriptiva realizamos
preprocesamiento de datos y análisis exploratorio una muestra de 10842 aplicaciones,
muestra suministrada Google Play Store, aplicaciones con características que se describirán
más adelante.

Objetivo
Extraer información útil que permita describir las características más relevantes de la
muestra tomada de las aplicaciones de Google Play Store.

Variables y escala de medición.

En la muestra de datos se evidenciaron errores y datos perdidos, como grupo decidimos


manipular estos datos de la siguiente manera:

Las aplicaciones sin características cuantitativas importantes como: Rating, Reviews, Size e
Installs no fueron tomadas en cuenta para procesos en los que se necesitasen.

Politécnico Grancolombiano - Estadística Descriptiva


Exploración de datos.

¿Qué género/categoría de aplicación es la más frecuente?

Para responder esta pregunta se realizó una tabla de frecuencias de la variable cualitativa
Genres, al ser muchos géneros se filtró por los diez con mayor repetición, en la cual se
pudo evidenciar los diez géneros/categorías más populares, siendo la moda el género Tools.
Nota: La variable género y la variable contienen los mismos datos.

¿Cómo se comporta el género de las aplicaciones con respecto a la cantidad de


Installs?
Para responder esta pregunta hicimos uso de la tabla de frecuencias anterior y cruzamos las
variables Genres e Installs, dejamos para responder esta pregunta un top cinco de genero de
aplicaciones y filtramos por instalaciones superiores a 10 millones.

Politécnico Grancolombiano - Estadística Descriptiva


El género Tools se mantuvo en el primer lugar siendo el genero más popular y también el
que más instalaciones tiene superando a los demás géneros con un 24,41% de
instalaciones.

¿De qué género es la aplicación que tiene más rating?

Se realizó una tabla de frecuencias de la variable Genres contra la variable Rating, se filtró
la variable Rating dejando únicamente los valores (1-5) esta tabla nos muestra que el
género que tiene más Rating es el género de Education, esto puede ser debido a que siendo
de tal naturaleza los usuarios toman como importante calificar estas aplicaciones.

¿Cuál es el género de las aplicaciones con pago que los usuarios más utilizan?

Para responder esta pregunta recurrimos a filtrar con ayuda de tablas dinámicas la variable
Genres y la variable Type que es la que nos indica si la aplicación es de tipo pago o no.

Nota: Nuevamente se filtro por el top 10 de los géneros, dado el volumen de datos.

Politécnico Grancolombiano - Estadística Descriptiva


Se puede concluir que los usuarios están dispuestos en invertir en aplicaciones las cuales
ayude en su salud.

¿Cuál es el comportamiento de Reviews contra el tipo de aplicación?

Se realizó el cruce de las variables Reviews contra la variable tipo, se sacó la frecuencia y
la frecuencia relativa de estas variables, después de esto, se extrajo la información más
relevante y graficó la información para poder verla de manera más fácil.

Como se puede ver las


aplicaciones que reciben
más Reviews son las
aplicaciones de tipo Free,
superando a las de tipo Paid
con un 92, 62%

Sin embargo, al no poder


saber la naturaleza de estas
Reviews podríamos hacer el
mismo ejercicio con las
variables Rating y Type
respectivamente:

Rating tiene el mismo comportamiento si se


cruza con la variable tipo.

Politécnico Grancolombiano - Estadística Descriptiva


¿Cuáles son las tres versiones de Android más usadas para las aplicaciones?
Para responder a esta pregunta, se realizó una distribución de frecuencias frente a la
variable Android Ver. Lo que se puede evidenciar es que la versión de Android que se
utiliza es: “Varies with device” lo que
quiere decir que las aplicaciones las
están desarrollando para que se ajuste
a las necesidades del dispositivo.

¿Cómo es el comportamiento del tipo de aplicación en términos de las descargas?

Para responder esta simple pregunta se realizó el cruce de la variable Type y la variable
Installs, luego de esto para poder ver mejor el resultado se realizó un diagrama boxplot.

Como era de esperar, dada la cantidad de descargas obtenidas por el tipo de aplicación
gratuita el grafico muestra una clara diferencia entre tipos.

¿Cómo sería la aplicación ideal?


Para responder a esta pregunta intentaremos recopilar la información que ya hemos tomado
e intentar interpretarla.

 Genero: El genero que se destacó tanto por aplicaciones descargadas y por Rating
fue: Tools

Politécnico Grancolombiano - Estadística Descriptiva


 Tipo: El tipo de aplicación más usada en Free.
o Género: El género más descargado en tipo Paid Medical, esto si se quiere
desarrollar una aplicación de tipo Paid.
 Android versión: Lo ideal es que se desarrolle una aplicación que se acomode a las
necesidades del dispositivo del usuario.
 Size: Con un tamaño que se ajuste a cada dispositivo.

Medida descriptiva de la variable precio (Price), ¿Cuál es el comportamiento de la


variable precio?

Se realizaron medidas descriptivas frente a la


variable precio (Price), se reveló que, en al menos la
muestra tomada, el valor máximo de una aplicación
es de $400 (dólares), su Media está en $40,3
dólares, lo que quiere decir que en promedio los
usuarios que invierten en la compra de aplicaciones
invierten en promedio un 10,075% de la cantidad
máxima.

Conclusión.
La estadística descriptiva nos brinda herramientas que permiten organizar, presentar,
describir y visualizar datos que por si solos y simple vista no dicen mucho, pudimos
encontrar características interesantes de la muestra de datos dada por Google Play Store con
dichas herramientas.

Politécnico Grancolombiano - Estadística Descriptiva

Вам также может понравиться