Вы находитесь на странице: 1из 65

Unidad 1

Resea Histrica -Aspectos


metodolgicos.

Tabla Contenido
1.1 a. Resea Histrica.
b. Formas del saber

Breve historia de la estadstica

La historia de la estadstica aclara en gran


medida la naturaleza de la misma en el siglo
XX. La perspectiva histrica tambin es
importante para ver las necesidades y las
presiones que la crearon.

El trmino estadstica no es nuevo. La estadstica debi comenzar como


una aritmtica estatal para asistir al gobernante que necesitaba
conocer la riqueza y el nmero de sus sbditos con el objeto de
recaudar impuestos o presupuestar la guerra.
Es de presumir que todas las culturas que intencionalmente registraron
su historia tambin registraron sus estadsticas. Sabemos que Csar
Augusto decret que todos los sbditos tenan que tributar y por lo
tanto exigi a todas las personas que se presentaran al estadstico ms
cercano, que entonces era el recaudador de impuestos. Debido a lo
anterior, Jess naci en Beln, no en Nazareth.

Guillermo el Conquistador orden un censo de las tierras de Inglaterra


para fines de tributacin y de servicio militar. Este se llam Domesday
Book. Tales estadsticas son historia.

Varios siglos despus del Domesday Book,


encontramos una aplicacin de la probabilidad
emprica al seguro de embarque, del cual parece haber
dispuesto la navegacin flamenca del siglo XIV. Esto
pudo haber sido poco ms que pura especulacin o
juego de azar, pero lleg a ser la forma muy respetable
de la estadstica llamada seguros.

El juego, en forma de juegos al azar, origino la teora


de las probabilidades, desarrolladas por Pascal y
Fermat, a mediados del siglo XVII, debido a su inters
en las experiencias de juego del Caballero de Mer.
Para el estadstico y el cientfico experimental, tal
teora tiene mucho uso prctico en la informtica.

La curva normal o la curva normal de errores ha sido


muy importante en el desarrollo de la estadstica.

La ecuacin de esta curva fue originalmente publicada


en 1733 por de Movre, quien no supo cmo aplicar sus
resultados a observaciones experimentales y su escrito
permaneci desconocido hasta que Karl Pearson lo
encontr en una biblioteca en 1924.

Sin embargo, al mismo resultado llegaron luego dos


astrnomos matemticos, Laplace, 1749-1827,y Gauss,
1777-1855, independientemente el uno del otro.

Un razonamiento esencialmente estadstico fue aplicado en


el siglo XIX por Charles Lyell a un problema geolgico.
En el perodo comprendido entre 1830 y 1833 aparecieron
tres volmenes de Principies of Geology de Lyell, quien
estableci el orden de las rocas terciarias asignndoles los
nombres.
Con M. Deshayes, un conquililogo francs, identific y
enumero las especies fsiles que se presentaban en uno o
ms estratos, y tambin lograron dar las proporciones de
las que an vivan en ciertas partes de los mares.
Basados en estas proporciones asignaron los nombres de:
Pleistoceno (novsimo), Plioceno (ms reciente), Mioceno
(menos reciente) y Eoceno (reciente).

El razonamiento de Lyell fue esencialmente estadstico.

Una vez establecidos y aceptados los nombres, el


mtodo fue casi inmediatamente olvidado. No haba
gelogos evolucionistas que se preguntaran si se
trataba de etapas discretas, como lo implican los
nombres, o bien si era un proceso continuo y se poda
utilizar para hacer predicciones.

Otros descubrimientos cientficos del siglo XX tambin


se hicieron sobre una base estadstica sin que se
advirtiera apenas la naturaleza estadstica de la
tcnica, y desafortunadamente el mtodo cay
pronto en el olvido.

Esta afirmacin es vlida para las ciencias biolgicas y


las fsicas.

Charles Darwin,
( 12 de febrero de 1809 19 de abril de 1882 )
Naturalista ingls a traves del proceso de seleccin natural el cual postula que
todas las especies de seres vivos han evolucionado con el tiempo, en 1930 la
teora de la evolucin mediante la seleccin natural no fue considerada.

Bilogo, recibi en el Beagle el segundo volumen del libro de Lyell.


Posteriormente Darwin formul sus teoras y bien pudo haber
influido en l la lectura de ese libro. La obra de Darwin fue, en
gran parte, la naturaleza biomtrica o estadstica, y ciertamente
renov el entusiasmo por la Biologa.
Mendel, con sus estudios sobre hbridos vegetales publicados en
1866, tambin tuvo un problema biomtrico o estadstico.

En el siglo XIX, la necesidad de una base ms slida


para la estadstica se hizo manifiesta.
Karl Pearson, 1857-1936, inicialmente fsico
matemtico aplic sus matemticas a la evolucin,
como resultado del entusiasmo que gener Darwin
en la Biologa.

Pearson dedic casi medio siglo a la investigacin


estadstica rigurosa.
Adems, fund la revista Biometrika y una escuela de
estadstica; con ello tom impulso el estudio de la
estadstica.

Si bien Pearson se ocupaba de muestras grandes, la


teora correspondiente resultaba inadecuada para los
experimentadores que trabajan con muestras
necesariamente pequeas.

Entre estos estaba W. 5. Gosset, 1876-1937, quien


estudiaba con Karl Pearson y era tcnico de la firma
de cerveceros Guinness

Parece que la matemtica de Gosset era


insuficiente para encontrar distribuciones
exactas de la desviacin estndar de la
muestra, la relacin entre la media de la
muestra y la desviacin estndar de la
muestra, del coeficiente de correlacin,
estadgrafo al que dedic especial inters.

Por lo tanto, recurri a sacar cartas calculando


y compilando distribuciones de frecuencia
emprica.
Sus escritos sobre los resultados aparecieron
en Biometrika en 1908 bajo el nombre de
Student, seudnimo de Gosset mientras
trabajaba con Guinness.

Hoy la t de Student es instrumento fundamental para estadsticos y experimentadores,


y estudentizar es expresin corriente en
estadstica.
Ahora que el uso de la distribucin t de Student
est tan generalizado, es interesante anotar
que el astrnomo alemn, Helmert, ya la
haba obtenido matemticamente en 1875.

R. A. Fisher, 1890-1962, recibi influencias de Karl


Pearson y de Student, e hizo numerosas e importantes
contribuciones a la estadstica.

Fischer y sus estudiantes dieron considerable impulso al


uso de los procedimientos estadsticos en muchos
campos, particularmente en agricultura, biologa y
gentica.

J. Neyman, 1894, y E. 5. Pearson, 1895,


presentaron una teora sobre la verificacin o
prueba de hiptesis estadsticas en 1936 y
1938.
La teora foment en forma considerable la
investigacin y muchos de los resultados son
de uso prctico.

En esta breve historia, mencionaremos slo


otro estadstico.
Abraham Wald, 1902-1950. Sus dos libros,
Sequential Analysis y Statistical Decision
Functions, se ocupan de grandes conquistas.

En la estadstica moderna proporciona el conocimiento


a los investigadores. La estadstica comenz en 1925
cuando apareci el libro de Fisher STATISTICAL
METHODS OF RESEARCH WORKERS (MTODOS
ESTADSTICOS DE OBREROS de la INVESTIGACIN ).
La estadstica es un tema de rpido crecimiento con
mucho material, que an no se encuentra en textos ,
crece a medida que los estadsticos encuentran
respuestas a ms y ms problemas.

La estadstica moderna proporciona conocimientos a


los investigadores. Es un tema nuevo y estimulante,
producto del siglo XX.

Para el cientfico, particularmente para el cientfico


en Biologa, la estadstica comenz
aproximadamente en 1925 cuando apareci el libro
de Fisher, Statistical Methods for Research Workers.

La estadstica es un tema de rpido crecimiento con


mucho material original que todava no se encuentra
en textos; crece a medida que los estadsticos
encuentran respuestas a ms y ms problemas
propuestos por los investigadores.

Algunos de los primeros investigadores que


contribuyeron al desarrollo inicial de la estadstica
todava laboran activamente, y los nuevos encuentran
diversas oportunidades para sus talentos
investigativos.

En la aplicacin de la estadstica, los principios


son generales aun cuando las tcnicas puedan
diferir, y la necesidad de formacin estadstica
crece a medida que se incrementa la aplicacin
a las ciencias biolgicas y sociales, la ingeniera
y la industria.
Este tema nuevo y vigoroso afecta a todos los
aspectos de la vida moderna.

Por ejemplo, el planeamiento estadstico y la evaluacin de


la investigacin contribuyen a los avances tecnolgicos en
el cultivo y procesamiento de alimentos; el control
estadstico de calidad de los productos manufacturados
hace confiables los equipos automotores y elctricos.

La estadstica ayuda a los encuestadores a recolectar datos


para determinar las preferencias de esparcimiento del
pblico; proporciona informacin para los estudios de
impacto ambiental y ayuda en la evaluacin de las
exigencias gubernamentales para que la industria
farmacutica demuestre que un producto es benfico y no
slo inofensivo. Cada vez son ms los grupos de
investigacin en los cuales se encuentra un estadstico.

La extensin de la estadstica hace difcil su definicin.


Su desarrollo obedeci a la necesidad de tratar
problemas en los cuales, para observaciones
individuales, las leyes de causa y efecto no aparecen
claramente al observador y donde es necesario un
enfoque objetivo.
En tales problemas siempre existe un cierto grado de
incertidumbre en toda inferencia basada en un nmero
limitado de observaciones.
Por lo tanto, para nuestro propsito, una definicin
razonable y satisfactoria sera: La estadstica es la
ciencia, pura y aplicada, que crea, desarrolla y aplica
tcnicas de modo que pueda evaluarse la incertidumbre de inferencias inductivas.

Para la mayora de los cientficos, la estadstica es lgica o


sentido comn con un fuerte ingrediente de procedimientos
aritmticos.
La lgica proporciona el mtodo mediante el cual se deben
recolectar los datos y determinar cunto deben abarcar; la
aritmtica, junto con ciertas tablas numricas, produce el
material sobre el cual se basa la inferencia y se mide la
incertidumbre.
La parte aritmtica es a menudo rutinaria, y el estudiante
necesita de formacin matemtica especial. No vamos a
ocupamos directamente con las matemticas, ya que es
difcil encontrar un campo de esta materia que no haya
dado al estadstico alguna teora til.

Tres Ncleos o corrientes diferentes:


-La escuela administrativa
La escuela probabilstica
La escuela demogrfica
A finales del siglo XX, escuela inglesa

Alexander Mood define la estadstica como:

La tecnologa del mtodo cientfico ya que le


proporciona instrumentos para la toma de
decisiones cuando prevalecen las condiciones
de incertidumbre
As mismo Harald Crmer, Dugu de
Bernonville.

La Estadstica es una ciencia que estudia cmo


obtener conclusiones de la investigacin emprica y de
la informacin real mediante el uso de modelos
matemticos.
Actualmente se le considera como el resultado de la
unin de dos disciplinas que han evolucionado
independientemente: el Clculo de probabilidades y
la Estadstica Descriptiva.
Es decir, constituye un puente entre los modelos
matemticos y los fenmenos reales.

La Estadstica permite evaluar y juzgar las


discrepancias y la incertidumbre que genera la teora
expuesta a travs del modelo cuando se aplica a la
realidad.

Se observa, en general, que cada aspecto de la


actividad humana es medido e interpretado en
trminos estadsticos y que las grandes decisiones de
la humanidad se basan en hechos histricos
interpretados a travs de la Estadstica.

Las razones anteriores inducen la importancia del


estudio bsico de la Estadstica por parte de
quienes trabajan las ciencias aplicadas y que
requieren el anlisis de informacin a partir de la
observacin de los fenmenos y el diseo de
experimentos que motiven la toma de decisiones.

El objetivo de esta gua de trabajo es proporcionar


al Lector algunas herramientas bsicas en el
campo especfico de la estadstica.

Se destaca la importancia de establecer una


base estadstica adecuada para reconocer,
interpretar y analizar los problemas aplicados
a la Ingeniera y la administracin de
empresas, con el propsito de brindar al
futuro profesional en estas reas la
orientacin suficiente para proponer y
establecer aplicaciones en su campo
profesional generando motivacin y
creatividad en su desempeo profesional.

Formas del saber


Saber cotidiano
Saber Cientfico
(Racional, Cierto o probable ( Probabilidad
inductiva, metdica, Confrontacin de la
realidad y sistematizacin orgnica, Objetos
de la misma naturaleza, Transmisibles)

METODO

a.
b.
c.
d.
e.

Caractersticas del mtodo cientfico:


Factico
Transciende de los hechos
Reglas metodolgicas
Verificacin emprica
Auto correctivo y progresivo

Etapas de la investigacin y el procedimiento del Mtodo


Cientfico:
Formulacin correcta del problema a investigar
Definicin concreta de los objetivos que se persiguen.
Eleccin de los procedimientos metodolgicos para
realizar la investigacin
Obtencin de la informacin necesaria para el estudio

Tratamiento de la informacin
Anlisis e interpretacin de la informacin
Conclusiones del proceso investigativo

Caractersticas del mtodo estadstico :


Lgico
Para alcanzar los objetivos es inductivo y para
el desarrollo propio es deductivo.

El mtodo estadstico es numrico


Referido a fenmenos colectivos
El mtodo estadstico es objetivo

Clasificacin de los mtodos estadsticos:

Mtodos descriptivos
Mtodos inductivos o inferencia estadstica
Mtodos tericos o teora estadstica

Sistema conceptual bsico


El colectivo, agregado, poblacin, Universo.
Se puede entender como colectivo agregado, no
solo los colectivos humanos, si no cualquier
conjunto de hechos numerosos de la misma
naturaleza, cualquiera que ella sea.

Presentando ciertas caractersticas o modalidades


distintas cuyo comportamiento generalizado y/o
posible relacin son objeto de estudio.

Poblacin:

Conjunto de medidas obtenidas al observar


alguna caracterstica de inters en los
elementos del colectivo , indicando que con
un mismo colectivo, pueden en general estar
asociadas varias poblaciones.

Clasificacin de las variables.


Variables

Cualitativas
(Variable no numrica)

Cuantitativa
(Numrica)

Discreta
(conteo)

categoras
(Modalidades)

Continua
(medicin)

Dominio
(Rango)

Una variable es cuantitativa cuando es susceptible de ser


expresada en trminos numricos.

Es discreta cuando toma nicamente valores enteros;


esta variable surge del conteo.
Ejemplos:
- Nmero de veces que usted frecuenta la biblioteca en
la semana
- Nmero de salones de la Universidad Nacional Sede
Bogot.
- Nmero de automviles que pasan por la entrada a la
Universidad Nacional de la calle 30, entre las
7:00 am - 7:20 am en un da especifico.

La variable cuantitativa es continua si toma valores


dentro de un intervalo y es el resultado de realizar
mediciones; por tanto puede asumir implcita o
explcitamente valores fraccionados.
Ejemplo:

La altura de los estudiantes del grupo de estadstica G2


[ 1.72,, 1.60 ]
Los datos de altura los podemos ordenar de menor a
mayor !
X mximo X mnimo

Las variables se asumen como cualitativas o


atributos o categricas o factores cuando no
son susceptibles de cuantificacin, por tanto
describen cualidades.

Ejemplo:
Causas que provocan accidentes de tipo
laboral.

Escala nominal o clasificatoria

Esta medicin supone la clasificacin de objetos, personas o caractersticas. Las


observaciones solamente se pueden clasificar o contar. No existe algn orden
especifico entre as clases.
Permite por tanto distinguir entre s los grupos a los cuales pertenecen y no hay un
orden natural.

Ejemplo:
De los datos de clase del semestre II- Grupo G2.
Asistieron 60 estudiantes, el primer da de clase.
Gnero
Masculino ( M )
Femenino ( F )
Total

Nmero de estudiantes
28
32
60

No hay un orden natural, para masculino o femenino, entre categoras.


Las categoras pueden ser :

Mutuamente excluyentes: Propiedad de un conjunto de categoras, implica


que una persona, objeto o medicin se ha de incluir en slo una categora
Exhaustivo : Propiedad de un conjunto de categoras que implica que cada
individuo, objeto o medicin debe aparecer en solo una categora.
Las categoras de la variable se excluyen mutuamente.
La codificacin puede cambiarse arbitrariamente sin alterar la esencia del
dato representado. Es posible agregar nuevas categoras.

Los datos a nivel nominal tienen las siguientes propiedades:

Las categoras para los datos son mutuamente excluyentes y exhaustivas.


Las categoras para los datos no tienen un orden lgico.

Escala ordinal o escala de rango


En esta escala se posibilita la relacin entre diferentes clases y por tanto entre sus
objetos.
Pueden compararse: altura, preferencia por un producto, dificultad para realizar
una tarea, perturbacin producida por un factor de riesgo, madurez psicolgica de
una persona.
Ejemplo:

Nivel de desempeo de un trabajador:


1-Ineficiente
Desempeo
Eficiente
Regular
Ineficiente
Total

2- Regular
Frecuencia
23
15
7
45

3- Eficiente

Datos del nivel de intervalo.


Se presenta una escala de intervalo cuando se
tienen las caractersticas enunciadas en la escala
ordinal y adems la distancia entre dos nmeros
cualesquiera, es decir, la asignacin de valores a
cada clase de elementos estn precisa que se
conocen las distancias entre todos los elementos.
Es fundamental, en esta escala, que la
proporcin de elementos de una clase es
independiente de la unidad de medida y del punto
cero de la medicin ya que stos se eligen
arbitrariamente.

Se trata de determinar el tiempo de permanencia


de los empleados de una fbrica. Puede darse
este tiempo arbitrariamente en semanas o en meses
as :

Tiempo (semanas) 40
Tiempo (meses)
10

60
15

96
24

144
36

160
40

La escala de intervalo es verdaderamente cuantitativa.


Las propiedades de la escala del intervalo son:

Las categoras para los datos son mutuamente


excluyentes y exhaustivas.

Las categoras en cuestin estn ordenadas de acuerdo


con la cantidad de la caracterstica que poseen.
Diferencias iguales en la caracterstica se representan
por diferencias iguales en la medicin.

Datos de nivel de razn


Son todos los datos cuantitativos son el nivel
de la razn de la medicin.

El nivel de la razn es el nivel de la medicin


mas alto. Esta medida tiene todas las
caractersticas de nivel de intervalo, pero
adems el punto 0 si tiene significado, y la
razn (o cociente) entre dos nmeros tambin
es significativa

Ejemplos de escala de razn , son los salarios,


las unidades de produccin, el peso, los
cambios en los precios de los medicamentos
para la depresin.
El peso de una persona, si la bascula est en
cero, hay una total ausencia de peso.

Las propiedades del nivel de la razn:


Las categoras de los datos son mutuamente
excluyentes y exhaustivas.
Dichas categoras tienen un intervalo u orden de
acuerdo con la cantidad de la caracterstica que
poseen.
Diferencias iguales en la caracterstica estn
representadas por diferencias iguales en los
nmeros que han asignado a las categoras
mencionadas.
El punto (o valor) 0 representa la ausencia de la
caracterstica.

Estadstico, Es el resultado de hacer operaciones u


observaciones sobre todos o parte de los datos de
una muestra, con el objetivo de obtener una
medida descriptiva de ella.

Entre tanto, cuando un investigador obtiene un


indicador o medida descriptiva de una poblacin
con base en todos los datos de la misma, su
resultado se llama parmetro.

Parmetro :
Es el resultado de hacer operaciones u
observaciones sobre todos los datos de una
poblacin, con el objetivo de obtener una medida
descriptiva de ella.
El estadstico es a la muestra lo que el parmetro es
a la poblacin.
Los parmetros son estimados o aproximados a
partir de los estadsticos, por limitaciones de
tiempo y costo para realizar censos y o inspecciones
al 100%.

Cuando tomamos muestras al azar de una


poblacin y estimamos sus parmetros, es
importante definir el concepto de error muestral,
el cual se define como la diferencia entre el
estadstico de la muestra y el parmetro
desconocido.

Otro concepto importante es el sesgo muestral, el


cual se define como la tendencia a favorecer la
eleccin de determinados elementos que tienen
una caracterstica.

Metodologa de la estadstica
Objetivos:

Colectivo o Poblacin
Determinacin de la cobertura
( Censo o parcial muestreo )

Determinacin del marco de muestreo


Marco de muestreo o marco muestral:

Todos los artificios o conjunto de artificios que


permita la ubicacin de todos y cada uno de
los elementos de la poblacin, de todas y
cada una de las unidades muestrales, ya que
es la base del proceso de seleccin de la
muestra.

Problemas del marco muestral :


Unidades vacas (Datos faltantes )
Conglomerados de unidades muestrales

Unidades duplicadas

Definicin de unidades
Unidad Poblacional
Unidad Muestral
Unidades de observacin

Muestreo No probabilstico
Diseo se realiza en forma subjetiva, arbitraria a
criterio del investigador.
No existe una oportunidad de que un elemento
en particular de la poblacin, sea
seleccionado.
No es posible calcular el error de muestreo, ni la
confiabilidad en las inferencias.

Muestreo Probabilstico
El muestreo se realiza mediante reglas
estadsticas que no permiten ningn
elemento de juicio al investigador,
generando muestras mas objetivas.

El nivel del intervalo de medicin es el


siguiente nivel en orden ascendente.

Incluye todas las caractersticas del nivel


ordinal pero adems , la diferencia entre los
valores tiene un tamao constante.

Pasos del Mtodo Estadstico


_________________________________________________________________________
Planteamiento del problema:

Definicin de la poblacin
Tipificacin de variables - medicin

Propuesta de objetivos generales y especficos


Eleccin de proceso metodolgico:

Poblacin y Muestra
Tipo de estudio
Pasos del proceso

Planteamiento de hiptesis
Recoleccin de la informacin:

Depuracin de la informacin :

Procesamiento y anlisis
Conclusiones y recomendaciones

Muestreo
Diseo de Experimentos
Cuestionario
Planilla de campo
Revisin de cuestionarios
Identificacin de valores atpicos

Вам также может понравиться