Академический Документы
Профессиональный Документы
Культура Документы
Tipos de datos
Dato estadstico: Es un conjunto de valores numricos que tienen relacin significativa entre s. Los mismos pueden ser comparados, analizados e interpretados en una investigacin cualquiera. Variable: Es un elemento de inters que puede tomar muchos valores numricos diferentes. Constante : Tiene un valor numrico fijo.
Variable cuantitativa : Es aquella cuyos valores se pueden expresar como cantidades numricas.
Variable cualitativa : Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos
Datos Nominales
Los datos medidos en una escala nominal representan el nivel mas bajo de la jerarqua y consisten en categoras en las que se registra el numero de observaciones. Las categoras son mutuamente excluyentes puesto que un individuo, objeto o medida puede incluirse solo en una de ellas.
Datos Ordinales
Una escala ordinal se compone de distintas categoras en las que hay implcito un orden. Los datos medidos en una escala nominal debido a las categoras estn ordenadas.
Datos de Intervalo
Escala de intervalos se produce cuando se toman medidas numricas sobre algunos elementos y se pueden determinar con exactitud los intervalos entre esas medidas.
Datos de Razn
La escala de razn: consiste en medidas numricas para las cuales las distancias entre los nmeros tienen un tamao constate y conocido, y donde la razn entre los nmeros tiene algn significado.
o Datos secundarios: son los datos ya compilados y estn disponibles para el anlisis estadsticos.
Muestra pequea. No se pueden proyectar los resultados. Deben hacerse preguntas sencillas. La entrevista debe ser breve. Se emplea mucho tiempo. Tasas bajas de respuesta. Se emplee mucho tiempo, costosa La entrevista debe ser breve.
Cuestionarios Puede cubrir una rea geogrfica por correo grande, poco costosa, preguntas estandarizadas. De puerta en puerta Abordaje en un centro comercial. Entrevistas personales Puede cubrir un rea geogrfica grande, fcil de llevar a cabo, alta tasa de respuesta. Rpida, poco costosa, fcil de llevar a cabo. Pueden usarse ayudas visuales. Pueden usarse ayudas visuales, flexibilidad para el entrevistador, las respuestas se pueden analizar con profundidad.
La recoleccin de datos es el proceso mediante el cual el individuo, a travs de la observacin sistemtica y apoyado en un instrumento, registra de manera selectiva los indicadores del estado de las variables.
Ejemplo: Estudio relacionado con la estatura de un grupo que consta de 38 personas: 18 hombres y 20
mujeres. Datos recolectados:
ESTATURA (EN METROS) HOMBRES 1.79 1.69 1.66 1.68 1.65 1.69 1.83 1.72 1.79 1.77 1.80 1.72 1.84 1.79 1.72 1.77 1.69 1.83 1.57 1.60 1.65 1.63 MUJERES 1.70 1.64 1.64 1.62 1.69 1.62 1.58 1.60 1.65 1.64 1.57 1.70 1.62 1.60 1.57 1.61
Siguiente paso: ordenar los datos de acuerdo a cierto criterio dependiendo del estudio a realizar.
Ejemplo:
1.60
1.60 1.61 1.62 1.62
1.62
1.63 1.64 1.64 1.64
1.65
1.65 1.65 1.66 1.68
1.69
1.69 1.69 1.69 1.70
1.70
1.72 1.72 1.72 1.77
1.77
1.79 1.79 1.79 1.80
1.83
1.83 1.84
Distribucin
Conjunto, arreglo o grupo de valores numricos.
Frecuencia
Nmero de veces que se repite (aparece) el mismo dato estadstico en un conjunto de observaciones de una investigacin determinada A las frecuencias se les designan con las letras fi, y por lo general se les llaman frecuencias absolutas.
Distribucin de frecuencias
Lista de clases o categoras de datos junto con el nmero de valores que caen dentro de cada una.
1 2 3 4 5
Determinacin del rango de la serie Nmero adecuado de clases Amplitud de la clase Intervalo de la clase Marca de la clase Frecuencia de la clase Frecuencia relativas Frecuencias acumuladas y acumuladas relativas
6
7 8
Rango (R)
Intervalo de menor tamao que contiene a los datos. Es calculable mediante la resta del valor mnimo al valor mximo. Permite obtener una idea de la dispersin de los datos. Tambin llamado recorrido estadstico.
Ejemplo:
Clases
Divisiones o categoras en las cuales se agrupan un conjunto de datos ordenados con caractersticas comunes. Son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites.
Ejemplo:
De acuerdo al ejemplo anterior, el nmero de clases se calcula de la siguiente manera:
Amplitud de clase
Es el rango de valores encontrados dentro de una clase. Se puede determinar encontrando la diferencia entre el valor ms grande en el conjunto de datos y el valor ms pequeo, y dividindolo entre el nmero de clases que se quiere. Se designa con las letras Ic. Tambin llamada tamao de la clase.
Ejemplo:
De acuerdo al ejemplo anterior, la amplitud de clases se calcula de la siguiente manera:
Ejemplo:
De acuerdo al ejemplo anterior, los intervalos de clase quedan de la siguiente manera:
Intervalo 1 2
3
4 5 6
1.660
1.705 1.750 1.795
1.704
1.749 1.794 1.840
Marca de clase
Es el valor de los datos que se ubica en la posicin central de la clase y representa todos los dems valores de esa clase. Este valor se utiliza para el calculo de la media aritmtica. Tambin se llama punto central.
Ejemplo:
Continuando con el mismo ejemplo, la marcas de clase de los intervalos de clase identificados quedan de la siguiente manera:
Intervalo 1.570 1.614 1.615 1.659 1.660 1.704 1.705 1-749 1.750 1.794 1.795 1.840
Frecuencia de la clase
Se le denomina frecuencia absoluta y se le designa con las letras fi. Es el nmero total de valores de las variables que se encuentran presente en una clase determinada, de una distribucin de frecuencia de clase.
Ejemplo:
Continuando con el mismo ejemplo, las frecuencias de clase quedan de la siguiente manera:
Intervalo 1.570 1.614 1.615 1.659 1.660 1.704 1.705 1-749 1.750 1.794 1.795 1.840
fi 8 10 8 3 5 4 38
Frecuencia relativa
La frecuencia relativa, o porcentajes, para una distribucin de frecuencias se calculan dividiendo la frecuencia real entre el nmero total de objetos clasificados. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).
Ejemplo:
Continuando con el mismo ejemplo, las frecuencias relativas quedan de la siguiente manera:
Intervalo
Marca de clase
fi
fr
fr %
1.570 1.615
1.615 1.660 1.660 1.705 1.705 1-750 1.750 1.795 1.795 1.840
1.5925
1.6375 1.6825 1.7275 1.7725 1.8175
8
10 8 3 5 4
8/38 =
10/38 = 8/38 = 3/38 = 5/38 = 4/38 =
0.21
0.26 0.21 0.08 0.13 0.11
21 %
26 % 21 % 8% 13 % 11 %
38
1.00 100 %
Frecuencias acumuladas
Son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribucin de frecuencia de clase, esto se logra cuando la acumulacin de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa.
Intervalo 1.570 1.615 1.615 1.660 1.660 1.705 1.705 1-750 1.750 1.795 1.795 1.840
fi 8 10 8 3 5 4
fa 8 18 26 29 34 38
fr (100%) 21 % 26 % 21 % 8% 13 % 11 %
Diagrama de pastel: o Es una forma efectiva de desplegar los porcentajes en que se subdividen los datos. o Este tipo de diagrama es particularmente til si se quiere hacer hincapi en los tamaos relativos de los componentes de los datos.
Cul es su marca favorita?
9% 10%
No 40%
23%
58%
S 60%
Marca 1
Marca 3
Marca 2
Marca 4
Diagramas de barras:
o Es otro mtodo habitual de presentar datos en forma grfica
datos con escala nominal u ordinal. Cada barra representa la frecuencia de una categora. La altura de la barra es proporcional al nmero de elementos de esa categora.
100% Por qu razones compra estas marcas?
50%
Diagrama de Pareto:
o Es un diagrama de barras que se utiliza con frecuencia para
identificar y jerarquizar problemas. Se usa con frecuencia en control de calidad. Su propsito es identificar las causas esenciales de la calidad inaceptable. La altura de cada barra representa el nmero de ocurrencias de cada problema.
200 100% 90% 80% 70% 60% 50%
80
60 40 20 0 D C E F Causas A H B G I
40%
30% 20% 10% 0%
Histograma:
o Un histograma se parece a un diagrama de barras, slo que no
hay espacio entre las barras. Se utiliza generalmente para datos con escalas de intervalo o de razn.
30 25 Frecuencia 20 15 10 5 0 20 30 40 50 Ingreso 60 70 80
Es una forma alternativa de mostrar datos. Es similar al histograma aunque se muestran los datos reales en lugar de barras.
Polgono de frecuencia
Es otro mtodo usual para presentar grficamente datos con escalas de intervalos o de razn. Se marcan las frecuencias sobre el eje vertical y los valores de la variable que se est midiendo sobre el eje horizontal.
30 25 Frecuencia 20 15
10
5 0
20
30
40
50 60 Ingreso
70
80
100.0
90.0 80.0
TAN CARO
Porcentaje de personas %
70.0 60.0 50.0 40.0 30.0 20.0 10.0 0.0 $10 $15 $20 $25 $30 $35
PRECIO PTIMO $19.20 PRECIO DE INDIFERENCIA $19.65
TAN BAJO
Precio $
$40
Ojiva
La grfica de una distribucin de frecuencias acumulada se llama Ojiva y se usa para determinar cuantas observaciones hay mayores o menores que un valor determinado en una distribucin.
100 90 80 70 60 50 40 30 20 10 0 20 30 40 50 60 Ingreso 70 80
Frecuencia
Como ltimo punto respecto a la creacin e interpretacin de distintos tipos de grficas, debe tenerse cuidado para evitar distorsiones. Es fcil distorsionar deliberadamente una grfica para dar una imagen incorrecta de los hechos.
500 130 110 90 250 Nissan 70 50 30 0 1 2 3 4 5 6 7 8 9 10 Toyota Otros Chevrolet Susuki 35% 5% 25% 15% 20%