Вы находитесь на странице: 1из 26

Curso: Estadstica I

Estadstica Descriptiva
Cobn, A.V. Julio 2017

Ing. Ftal. Hensy Froilan Cal Chamm


Universidad Rural de Guatemala
Introduccin a la estadstica

Walker (1929) atribuye el primer uso del trmino estadstica al


profesor alemn, Gottfried Achenwall (1719 1772), quien utiliz la
palabra alemana Statistik, que extrajo del trmino italiano statista
(estadista). La raz de la palabra se halla, por otra parte, en el trmino
latino status, que significa estado o situacin. Indicando la importancia
histrica de la recoleccin de datos por parte del gobierno de un pas,
relacionados principalmente a informacin demogrfica (censos por
ejemplo).
a) Ciencia derivada de la matemtica que se ocupa de la extraccin de
la informacin contenida en datos provenientes de muestras y de su
uso para hacer inferencias acerca de la poblacin de donde fueron
extrados estos datos.

b) La Estadstica estudia los mtodos cientficos para recolectar,


organizar, resumir y analizar datos, as como para extraer conclusiones
vlidas y tomar decisiones razonables basadas con tal anlisis.
Clasificacin de la estadstica
La Estadstica para su mejor estudio se ha dividido en tres grandes
ramas: Estadstica Descriptiva, Probabilidades y la Estadstica
Inferencial.
1.3.1 La Estadstica Descriptiva consiste en la presentacin de datos en
forma numrica, tablas y grficas. Esta comprende cualquier actividad
relacionada con los datos y est diseada para resumir o describir los
mismos, sin factores pertinentes adicionales; esto es, sin intentar inferir
nada que vaya ms all de los datos, como tales. Es en general utilizada
en la etapa inicial de los anlisis, cuando se tiene contacto con los
datos por primera vez.
1.3.2 La Probabilidad puede ser pensada como la teora matemtica
utilizada para estudiar la incertidumbre oriunda de fenmenos de
carcter aleatorio, o sea, producto del azar.
1.3.3 La Estadstica Inferencial se deriva de muestras, de observaciones
hechas slo acerca de una parte de un conjunto numeroso de
elementos y esto implica que su anlisis requiere de generalizaciones
que van ms all de los datos. Como consecuencia, la caracterstica
ms importante del reciente crecimiento de la estadstica ha sido un
cambio en el nfasis de los mtodos que describen a mtodos que
sirven para hacer generalizaciones. La Estadstica Inferencial investiga o
analiza una poblacin partiendo de una muestra tomada.

La Estadstica descriptiva y la inferencial comprenden la estadstica


aplicada. Hay tambin una disciplina llamada estadstica matemtica, la
cual se refiere a las bases tericas de la materia, e incluye el estudio de
las probabilidades.
Otras divisiones de la estadstica:
1.3.4 Estadstica Paramtrica: en este tipo de estadstica el inters es
hacer estimaciones y pruebas acerca de uno o ms parmetros de la
poblacin. Adems, en todas estas estimaciones y pruebas de hiptesis
se establece como suposicin general que la poblacin o poblaciones
de donde provienen las muestras deben estar distribuidas
normalmente, aunque sea en forma aproximada.
1.3.5 Estadstica No Paramtrica (o de distribucin libre): estudia las
pruebas y modelos estadsticos cuya distribucin subyacente no se
ajusta a los llamados criterios paramtricos. Su distribucin no puede
ser definida a priori, pues son los datos observados los que la
determinan. La utilizacin de estos mtodos se hace recomendable
cuando no se puede asumir que los datos se ajusten a una distribucin
normal o cuando el nivel de medida empleado no sea, como mnimo,
de intervalo.
INDIVIDUO O UNIDAD ESTADSTICA
Todo estudio estadstico se hace sobre un individuo, que es el objeto
de observacin. Una unidad estadstica es la entidad sobre la que se
quiere obtener los datos para ser analizados. Por ejemplo, una unidad
estadstica puede ser una persona adulta, un saco con 45 kg de caf, un
escritorio, un rbol de cedro, una parcela de 50 m2 con tomate, un ro,
una vaca, un tallo o una macolla de caa de azcar, una colonia de
hongos, un tractor, etc.
POBLACIN
La poblacin es el conjunto de todas las unidades estadsticas. Tambin
se puede definir como el conjunto de individuos que tienen por lo
menos una caracterstica en comn observable. El estudio completo de
una poblacin se denomina: Censo. En noviembre de 2002 se realiz
en Guatemala el XI Censo Nacional de Poblacin y el VI Censo Nacional
de Habitacin cuyos resultados fueron presentados en febrero del
2003. En mayo del 2003 se realiz el IV Censo Nacional Agropecuario.
Para su estudio, en general se clasifican en poblaciones finitas (constan
de un nmero determinado de elementos, susceptible a ser contado) y
poblaciones infinitas (tienen un nmero indeterminado de elementos,
los cuales no pueden ser contados).
MUESTRA
Es el subconjunto de una poblacin, que manifiesta las mismas
caractersticas de la poblacin original de donde fue extrada. Los
requisitos deseables de una buena muestra son: representatividad y
confiabilidad. Lo primero se consigue a travs de la seleccin del tipo
de muestreo adecuado, en tanto que la confiabilidad est referida al
tamao de la muestra.
Los estudios que involucran la toma de muestras se denominan:
Encuestas.
PARMETRO
Es un valor que resume la informacin de una poblacin, se denota con
letras del alfabeto griego. Por ejemplo: = media, = desviacin
estndar, 2 = varianza, = coeficiente de correlacin poblacional. Los
parmetros son obtenidos a partir de mediciones realizadas en los
censos.

ESTIMADOR O ESTADSTICO
Es un valor representativo de una muestra, se denota con letras del
alfabeto arbigo. Por ejemplo: x = media, s = desviacin estndar, s 2 =
varianza, r = coeficiente de correlacin de la muestra.
Tipos de variable

Una variable en estadstica es lo que se observa o mide sobre las


unidades estadsticas. Son caractersticas que varan de un individuo a
otro. Las variables son representadas con letras maysculas, por
ejemplo: X, Y, Z, etc. Y los valores que asumen, son representados con
letras minsculas, ejemplo: x, y, z.
Dependiendo de su naturaleza, se distinguen dos tipos principales de
variables:
a) CUANTITATIVAS
Son aquellas que expresan cantidades y los resultados son de tipo numrico.
Se clasifican en:
a.1 CUANTITATIVAS DISCRETAS
Tambin llamadas de conteo, son las que no aceptan valores decimales.
Ejemplo: nmero de hijos por familia, nmero de camas de un hospital,
cantidad de plantas de caf por metro cuadrado, nmero de fidos por
planta, nmero de brotes por planta, nmero de racimos de banano por
hectrea, nmero de ausencias de un trabajador por mes. Matemticamente
se pueden representar de la siguiente manera:
Sea X el nmero de rboles con cncer en una muestra de 10 rboles: X {0,
1, 2, 3, . . . , 9, 10}
Sea Y el nmero de plntulas en un rea de 10 m2 de suelo en una floresta
nativa: Y {0, 1, 2, , . . . .}
a.2 CUANTITATIVAS CONTINUAS

Este tipo de variables pueden tomar como valores cualquier nmero


real, es decir, un valor con decimales, y que resultan de un proceso de
medicin. Ejemplo: altura de una planta, peso de semillas, temperatura
de un cuarto fro, dimetro de un rbol, caudal de un ro, precipitacin
pluvial, etc.
Sea D el dimetro de rboles de Pinus maximinoii en una plantacin:
D E [10, 50]
Sea W la biomasa(tm.ha-1) en un ecosistema forestal: W E [500,
5000]
b) Variables CUALITATIVAS
Son las variables que presentan como posibles resultados una cualidad
o atributo del individuo investigado. Las posibles cualidades que tiene
una variable cualitativa se llaman: modalidades de la variable. Algunos
autores tambin las llaman: Categoras o Atributos. Segn el nmero
de categoras, algunos autores las clasifican como: dicotmicas, solo
hay dos modalidades, en general los fenmenos de respuesta binaria,
como: padecer una enfermedad (s, no), sexo (femenino, masculino),
resultado de un prueba de evaluacin (aprobado, reprobado); o bien
politmicas, cuando hay ms de dos categoras, por ejemplo: estado
civil, color de los ojos de una persona, lugar de origen, profesin, forma
de la hoja de una planta, susceptibilidad de una planta a una
enfermedad, nivel de satisfaccin de un cliente, etc.
Niveles de medicin
INFORMACIN CUALITATIVA
a) Escala Nominal
Es la escala ms dbil en cuanto a la informacin que proporciona. Como su
nombre lo indica, esta escala consiste en nombrar a las observaciones. Para
distinguir los agrupamientos de unidades se emplean smbolos, letras o
nmeros. En el caso de que se empleen nmeros, estos solo tienen un
carcter simblico y no numrico. Ejemplo:
Especies arbreas presentes en la microcuenca del ro Cachil, Baja Verapaz.
Estado civil de los habitantes del casero Tuipic, San Martn
Sacatepquez, Quetzaltenango (soltero, casado, divorciado, unido).
Tipos de uso del suelo (agrcola, forestal, pecuario, etc.) en el municipio de
San Miguel Tucur.
Municipio de procedencia de los estudiantes de la carrera de Ingeniera
Civil de la URG.
b) Escala Ordinal
En este nivel, las unidades de los grupos guardan cierta relacin entre s, que
se pone de manifiesto cuando se est en posibilidad de establecer una
relacin de tipo mayor o menor que. Ejemplos:
Nivel de estudios, ya que sus modalidades estn ordenadas segn la
duracin de los estudios: Educacin primaria, secundaria, diversificado,
universitaria.
Grado de aceptacin de algn producto: buena, regular, mala.
Nivel socioeconmico de una familia (alto, medio, bajo)

Nivel de satisfaccin del servicio que presta la Oficina de Atencin al


Estudiante:
1. Totalmente en desacuerdo 4. De acuerdo
2. En desacuerdo 5. Totalmente de acuerdo.
3. Ni de acuerdo ni en desacuerdo
INFORMACIN CUANTITATIVA
a) Escala de Intervalo
Este tipo de escala provee informacin mucho ms precisa, a la vez que
permite llevar a cabo mediciones mucho ms sofisticadas que las
escalas nominal u ordinal. La escala de intervalo no slo informa acerca
del orden de unos objetos, sino que tambin acerca de las distancias o
diferencias numricas entre dichos objetos. De hecho, esta escala
permite medir y comparar esas distancias o diferencias con precisin.
En otras palabras (y de aqu el nombre de escalas de intervalo), las
distancias o intervalos de igual tamao en la escala son de hecho
iguales no importando dnde en la escala se realice la medicin. Por
ejemplo, los resultados numricos de los exmenes acadmicos (rango
de 0 a 100) pueden ser medidos usando escalas de intervalo.
b) Escala de Razn
Los atributos son cuantitativos organizados en una escala donde tanto
el intervalo entre dos valores, como el punto cero, tienen significado
real (indica ausencia de valor). Dadas dos medidas en esta escala,
podemos decir si son iguales, o si una es diferente, mayor, que tan
mayor y cuantas veces la otra. La altura de un individuo es un ejemplo
de la medida en esta escala. Si ella fuera medida en centmetros (cm), 0
cm es el origen y 1 cm es la unidad de medida. Un individuo con 190
cm es dos veces ms alto que un individuo con 95 cm, y esta relacin
continua valiendo si usamos 1 cm como unidad. Otras variables que
son medidas en esta escala son: peso, longitud, dimetro, volumen,
estatura, densidad.
Frecuencias y distribucin de frecuencias
Las frecuencias asociadas a valores o rango de valores de una variable
indican la cantidad de veces que el valor fue observado en el conjunto
de unidades en anlisis. Las frecuencias sirven para conocer cmo se
distribuyen los datos o valores de la variable, permitiendo aproximar la
distribucin de frecuencias a alguna funcin o modelo terico para
posteriores anlisis y clculos probabilsticos. Analizando las
frecuencias es factible identificar datos extremos (es decir poco
frecuentes por ser muy pequeos o muy grandes), y valores, o
conjuntos de valores, que aparecen con mayor frecuencia. Las
frecuencias en que se presentan los valores de una variable se pueden
tabular o graficar.
Tablas de distribuciones de frecuencia
Una tabla de frecuencias organiza los datos de manera tal que en una
columna de la tabla aparecen los valores de la variable, segn el tipo de
variable, y en sucesivas columnas se muestran diferentes tipos de
frecuencias asociadas a esos valores (frecuencias absolutas, frecuencias
relativas, frecuencias absolutas acumuladas y frecuencias relativas
acumuladas). Veamos algunos ejemplos de distribuciones de
frecuencias y su presentacin a travs de tablas.
Grficos de distribucin de frecuencias
Las frecuencias de variables discretas se grafican utilizando grficos de
barras. En el eje X se representan los valores de la variable y en el eje Y,
la frecuencia. Cada barra se levanta sobre un punto del eje X que
representa un valor de la misma y la altura de la barra seala la
frecuencia para dicho valor.
Grfico de barras
Una aplicacin muy
usada de estos
grficos es la
representacin de
frecuencias
absolutas o
relativas de
distintas categoras
en las que se
pueden clasificar las
unidades de
observacin.
Grfico de sectores
Una alternativa para la representacin de frecuencias relativas de un
conjunto de categoras es la utilizacin de grficos de sectores. En este
caso a cada categora se le asigna un sector representa su frecuencia.

Grfico de caja
Grfico de densidad de puntos
Histogramas y Polgonos

Вам также может понравиться