Вы находитесь на странице: 1из 13

Estadística:

La estadística es una técnica especial apta para el estudio cuantitativo de los


fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de
otros fenómenos más simples llamados individuales o particulares.

Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar
decisiones razonables basadas en tal análisis.

Estadística Descriptiva:

Es una parte de la estadística que se dedica a analizar y representar los datos. Este
análisis es muy básico, pero fundamental en todo estudio. Aunque hay tendencia a
generalizar a toda la población las primeras conclusiones obtenidas tras un análisis
descriptivo, su poder inferencial es mínimo y debería evitarse tal proceder. Otras ramas de
la estadística se centran en el contraste de hipótesis y su generalización a la población.

Estadística Inductiva:

Técnica mediante la cual se sacan conclusiones o generalizaciones acerca de


parámetros de una población basándose en el estadígrafo o estadígrafos de una muestra
de población. Trata de la generalización hacia las poblaciones de los resultados
obtenidos en las muestras y de las condiciones bajo las cuales estas conclusiones son
válidas. Se enfrenta básicamente con dos tipos de problemas:

Estimación, que puede ser puntual o por intervalos, Contraste de hipótesis.

Variable de la Estadística:

Es toda característica que se puede cuantificar .

Es una característica (magnitud, vector o número) que puede ser medida, adoptando
diferentes valores en cada uno de los casos de un estudio.

Es una propiedad o característica de la población que está sujeto a estudio.

Ejemplos de variables estadísticas: - La estatura

- El Peso

- El Salario

- La Edad
- No. De Hijos

Tipos de Variables de Estadística:

Los tipos de variables estadísticos:

Variable Continua. y Variable Discreta

Una variable continua tiene la propiedad de que entre 2 cualesquiera valores


observables (potencialmente), hay otro valor observable (potencialmente). Una variable
continua toma valores a lo largo de un continuo, esto es, en todo un intervalo de valores.
Longitudes y pesos son ejemplos de variables continuas. La estatura de una persona, pude
ser 1,70 mts. ó 1,75 mts., pero en potencia al menos podría tomar cualquier valor
intermedio como 1,73 mts. por ejemplo.

Un atributo esencial de una variable continua es que, a diferencia de lo que ocurre con
una variable discreta, nunca se la puede medir exactamente. Con una variable continua
debe haber inevitablemente un error de medida.

Una variable discreta es sencillamente la que toma valores enteros...una variable para
la que se dan de modo inherente separaciones entre valores observables sucesivos. Dicho
con mas rigor, se define una variable discreta como la variable tal que entre 2
cualesquiera valores observables (potencialmente), hay por lo menos un valor no
observable (potencialmente). Por ejemplo, un recuento del número de colonias de un
cultivo en agar es una variable discreta. Mientras que cuentas de 3 y 4 son potencialmente
observables, no lo es una de 3,5.

Por ejemplo... La edad, No, de hijos,

Población de Estadística:

Es el total de elementos que se van a estudiar los cuales pueden ser personas, animales,
cosas o fenómenos. La población debe ser homogénea y entre sus características puede
ser infinita o finita.

En Estadística la población, también llamada universo o colectivo es el conjunto de


elementos de referencia sobre el que se realizan las observaciones.

Existen distintos tipos de poblaciones que son:

Población base: es el grupo de personas designadas por características personales,


geográficas o temporales, que son elegibles para participar en el estudio.
Población muestreada: es la población base con criterios de viabilidad o posibilidad de
realizarse el muestreo.

Muestra estudiada: es el grupo de sujetos en el que se recogen los datos y se realizan las
observaciones, siendo realmente un subgrupo de la población muestreada y accesible. El
número de muestras que se puede obtener de una población es una o mayor de una.

Muestra:

Es un subconjunto de la población (una parte). La cual debe ser lo más representativo


posible y sirve para establecer inferencias de toda la población en estudio. Una muestra
estadística es un subconjunto de casos o individuos de una población estadística. Las
muestras se obtienen con la intención de inferir propiedades de la totalidad de la
población, para lo cual deben ser representativas de la misma.

Atributos:

IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas


características que pueden presentarse en individuos que constituyen un conjunto.

La forma de expresar los atributos es mediante palabras, por ejemplo; profesión,


estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la
misma forma en todos los elementos. Estas distintas formas en que se presentan los
atributos reciben el nombre de "modalidades".

Ejemplo;

El estado civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta
en la misma modalidad.

Muestreo:

Esto no es más que el procedimiento empleado para obtener una o más muestras de
una población; el muestreo es una técnica que sirve para obtener una o más muestras de
población.

Este se realiza una vez que se ha establecido un marco muestral representativo de la


población, se procede a la selección de los elementos de la muestra aunque hay muchos
diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada
muestra no necesariamente serían iguales, y lo más probable es que variaran de una
muestra a otra.
Ejemplo;

Consideremos como una población a los estudiantes de educación del Núcleo San
Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en dicha
población: Religión de los estudiantes

Sexo

Tipos de Muestreo:

Muestreo aleatorio simple

Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible
del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para
obtener una muestra aleatoria simple, cada elemento en la población tenga la misma
probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra
aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de
números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar
cada elemento de la población es infinita, es obvio que la tarea de numerar cada
elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo
aleatorio simple son necesarias

Muestreo con reemplazo:

Es aquel en que un elemento puede ser seleccionado más de una vez en la muestra para
ello se extrae un elemento de la población se observa y se devuelve a la población, por lo
que de esta forma se pueden hacer infinitas extracciones de la población aun siendo esta
finita.

Muestreo sin reemplazo:

No se devuelve los elementos extraídos a la población hasta que no se hallan extraídos


todos los elementos de la población que conforman la muestra. Cuando se hace una
muestra probabilística debemos tener en cuenta principalmente dos aspectos:

El método de selección.

El tamaño de la muestra

Muestreo Opinatico:

Cuando la selección de los elementos y la determinación del tamaño de la muestra


no se hacen de forma objetiva siguiendo criterios técnicos, sino según el arbitrio, la
intuición o la experiencia del encuestador, el muestreo se denomina discrecional,
intencional, estimativo u opinático, para diferenciarlo del muestreo aleatorio o muestreo
estadístico propiamente dicho. Esta forma de proceder en el muestreo es ampliamente
utilizada, sin embargo, en las ciencias sociales

Escala:

Una escala puede concebirse como un continuo de valores ordenados


correlativamente que admite un punto inicial y otro final. Si evaluamos el rendimiento
académico de estudiantes podemos asignar el valor cero al mínimo rendimiento
imaginable al respecto; al mayor rendimiento posible podemos atribuirle un valor de 100,
20, 10 o 7 puntos, según resulte más práctico. Con estos dos valores tendríamos ya
marcados los límites de nuestra escala; para concluir de confeccionarla será necesario
asignar a los posibles rendimientos intermedios puntajes también intermedios. Con ello
obtendremos una escala capaz de medir la variable rendimiento académico a través de los
indicadores concretos de los trabajos presentados por los estudiantes, de sus exámenes,
pruebas y otras formas de evaluación posibles.

Para que una escala pueda considerarse como capaz de aportar información objetiva
debe reunir los dos siguiente requisitos básicos:

Confiabilidad: se refiere a la consistencia interior de la misma, a su capacidad para


discriminar en forma constante entre un valor y otro."Cabe confiar en una escala – anotan
Goode y Hatt- cuando produzca constantemente los mismos resultados al aplicarla a una
misma muestra", es decir, cuando siempre los mismos objetos aparezcan valorados en la
misma forma.

Validez: indica la capacidad de la escala para medir las cualidades para las cuales ha
sido construida y no otras parecidas. Una escala confusa no puede tener validez, lo mismo
que en una escala que esté midiendo, a la vez e indiscriminadamente, distintas variables
superpuestas. "Una escala tiene validez cuando verdaderamente mide lo que afirma
medir".

Tipos de Escala:

Existen diferentes tipos de escalas que se distinguen de acuerdo a la rigurosidad con


que han sido construidas y al propio comportamiento de las variables que miden. Se
acostumbra a clasificarlas en cuatro tipos generales que son los siguientes: escalas
nominales, ordinales, de intervalos iguales y de cocientes o razones.

Escalas Nominales
Son aquellas en que sólo se manifiesta una equivalencia de categorías entre los
diferentes puntos que asume la variable. Es como una simple lista de las diferentes
posiciones que pueda adoptar la variable, pero sin que en ella se defina ningún tipo de
orden o de relación. Si es una investigación sobre producción agrícola queremos
determinar los cereales que se cultivan en una cierta región, tendremos una variable que
se designará como "cereal cultivado".

Los distintos valores que esa variable reconoce serán, concretamente: trigo, maíz,
centeno, etc. Entre estos valores no cabe obviamente ninguna jerarquía, no se puede
trazar ningún ordenamiento. Sin embargo, a la enunciación explícita de todas estas
posibilidades la consideramos como una escala, pues de algún modo es útil para medir el
comportamiento de la variable, indicándonos en que posición se halla en cada caso.

Las Escalas Ordinales

Distinguen los diferentes valores de la variable jerarquizándolos simplemente de


acuerdo a un rango. Establecen que existe una gradación entre uno y otro valor de la
escala, de tal modo que cualquiera de ellos es mayor que el precedente y menor que el
que le sigue a continuación. Sin embargo la distancia entre un valor y otro no queda
definida sino que es indeterminada. En otras palabras, tales escalas nos esclarecen
solamente el rango que las distintas posiciones guardan entre sí.

Un ejemplo de escala ordinal es el que suele usarse para medir la variable "grado de
escolaridad": podemos decir que una persona que ha tenido 2 años de instrucción escolar
ha recibido más instrucción que quien solo tiene un año y menos que quien posee tres. Sin
embargo no puede afirmarse válidamente que la diferencia entre quien posee 2 años de
instrucción y quien ha recibido un año es igual a la diferencia entre quienes han recibido
16 y 17años de educación formal. Por tanto, como no podemos determinar la equivalencia
entre las distancias que separan un valor de otro, debemos concluir que la escala
pertenece a la categoría ordinal.

Las Escalas de Intervalos Iguales,

Además de poseer la equivalencia de categorías y el ordenamiento interno entre ellas,


como en el caso de las ordinales, tienen las características de que la distancia entre sus
intervalos está claramente determinada y que estos son iguales entre sí. Un ejemplo típico
de las escalas de intervalos iguales esta dado por las escalas termométricas. Entre 23 y 24
grados centígrados, por ejemplo, existe la misma diferencia que hay entre 45 y 46 grados.
Muchas otras escalas, como las que se utilizan en los test psicológicos y de rendimiento,
pertenecen a este tipo. La limitación que poseen es que no definen un cero absoluto, un
valor límite que exprese realmente la ausencia completa de la cualidad medida. Por ello
no se pueden establecer equivalencias matemáticas como las de la proporcionalidad: no
puede afirmarse que 24° C es el doble de temperatura que 12° C, porque el cero de la
escala es un valor arbitrario y no se corresponde con la ausencia absoluta de la variable
que se mide.

Razón:

Es el cociente entre dos números, en el que ninguno o sólo algunos elementos del
numerador están incluidos en el denominador. El rango es de 0 a infinito.

Tasa de Interés.

Es un porcentaje del saldo insoluto que paga un deudor al acreedor. La tasa de Interés
puede ser expresada en distintos plazos, como por ejemplo: diaria, mensual o anual, entre
otras.

Tasa de interés anual.

Es la tasa de interés que se cobra anualmente por el otorgamiento de un crédito. La


tasa de interés anual está expresada como un porcentaje y aplica al saldo insoluto del
crédito. La tasa de Interés no siempre expresa el costo total que se pagará por el crédito.
Consultar CAT (Costo Anual Total)

Coeficiente de Natalidad:

Tasa de natalidad, medida del número de nacimientos en una determinada población


durante un periodo de tiempo. La tasa o coeficiente de natalidad se expresa como el
número de nacidos vivos por cada 1.000 habitantes en un año. La natalidad es la
capacidad que tiene una población de aumentar el número de individuos. Esto depende
en gran parte de las condiciones del medio.

Coeficiente de Mortalidad:

Tasa de mortalidad, número de fallecimientos en una determinada población a lo largo


de un periodo establecido. La tasa o coeficiente de mortalidad calcula el número de
fallecimientos por cada 1.000 personas en un año. La mortalidad es un término
demográfico que designa un número proporcional de muertes en una población en un
tiempo determinado.

Tasa de crecimiento Vegetativo:

Es la diferencia entre los nacimientos y las defunciones de una determinada población.


La tasa anual del crecimiento vegetativo o natural (referida a mil habitantes) resulta de la
resta: tasa de natalidad menos tasa de mortalidad. El crecimiento natural (o vegetativo)
es la diferencia entre el número de nacidos y el número de fallecidos de una población. Si
el número de nacidos es superior al número de muertos se dice que la tasa de natalidad es
mayor a la de mortalidad, es decir la población aumenta; cuando las defunciones superan
a los nacimientos la población disminuye. El crecimiento natural se calcula restándole a los
nacidos los muertos. La tasa de crecimiento vegetativo se considera alta si supera el 2%,
moderada si se encuentra entre el 1% y el 2%, y baja si es inferior al 1%.

Índice:

El índice de una base de datos es una estructura de datos que mejora la velocidad de las
operaciones, permitiendo un rápido acceso a los registros de una tabla. Al aumentar
drásticamente la velocidad de acceso, se suelen usar sobre aquellos campos sobre los
cuales se hagan frecuentes búsquedas.

Índice de Población Atendida:

La población atendida está compuesta principalmente por campesinos e indígenas que


viven en las zonas rurales marginas, pero también contempla a personas de escasos
recursos en zonas urbanas. Al menos el 85% está en condiciones de alta y muy alta
marginación de acuerdo al "Índice de Marginación" (1995) del Consejo Nacional de
Población (CONAPO).

Algunas características de la población atendida son:

Rezagos en salud reproductiva

Dispersión Geográfica

Marginación y Extrema Pobreza

Inequidad de Género

Desnutrición Infantil

Índice de Repitencia:

La repitencia es un fenómeno que se da en todos los grados de la educación, pero en


mayor medida y con efecto más negativos en los dos primeros grados del primer ciclo del
Nivel Básico. Algunos docentes consideran la repetición como una solución a los
problemas de aprendizaje de los alumnos, pensando que el año siguiente éste pueda
alcanzar un rendimiento académico mejor.
Índice de Deserción:

La deserción escolar se define como el abandono de los alumnos a la escuela sin haber
terminado sus estudios. La deserción escolar obedece a diferentes causas: económicas,
sociales, familiares, de contexto geográfico, entre otras.

Fuente:

Son datos estadísticos necesarios para la comprensión de los hechos pueden obtenerse
a través de fuentes primarias y fuentes secundarias.

Tipos de Fuentes Estadísticos:

Fuentes de datos primarias:

Son aquellas en las que la información se encuentra en su origen, y por lo tanto debe
ser elaborada por primera vez y de forma específica.

Fuentes secundarias:

Son las publicaciones y trabajos hechos por personas o entidades que no han
recolectado directamente la información. Son aquellas que presentan información ya
elaborada, o existente, que fue generada anteriormente con otra finalidad que no tiene
porqué coincidir con la nuestra.

Gráficos Estadísticos:

Las representaciones gráficas permiten captar de inmediato las características más


relevantes de una distribución de datos. Los gráficos son medios popularizados y a
menudo los más convenientes para presentar datos, se emplean para tener una
representación visual de la totalidad de la información. Los gráficos estadísticos
presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los
hechos esenciales y compararlos con otros.

Barras, Líneas, Circulares, Áreas, Cartogramas, Mixtos, Histogramas, Otros,


Dispersograma, Pictogramas, otros.

Histogramas:

Es un tipo de representación que se utiliza para variables cualitativas, y que consiste en


dibujar, para cada valor de la variable, una figura de área proporcional a la frecuencia. Un
histograma es un gráfico de barras de una distribución de frecuencia. En el eje X tenemos
normalmente el intervalo de clases y en la Y el número de observaciones. Es de
aplicación a todos aquellos estudios en que es necesario analizar la pauta de
comportamiento de un determinado fenómeno en función de su frecuencia de aparición.
Su utilización será beneficiosa para el desarrollo de los proyectos abordados por los
Equipos y Grupos de mejora y por todos aquellos individuos u organismos que estén
implicados en la mejora de la calidad.

Polígono de Frecuencia:

Este gráfico se utiliza para el caso de variables cuantitativas, tanto discretas como
continuas, partiendo del diagrama de columnas, barras o histograma, según el tipo de
tabla de frecuencia manejada. Es la línea quebrada que une los puntos medios de los
lados superiores (marcas de clase) de un histograma. Los puntos o vértices del polígono
de frecuencias están situados, por tanto, en las marcas de clase, ya que estos
corresponden a los puntos medios de los intervalos.

Ojiva:

Figura formada por dos arcos de círculos iguales que se cortan en uno de los extremos,
con la concavidad encarada del uno hacia el otro: los arcos con forma de ojiva son
frecuentes en la arquitectura gótica. Figura compuesta de dos arcos de círculo iguales que
tienen sus centros en una misma recta y se cortan en uno de sus extremos formando un
ángulo curvilíneo. La ojiva es una gráfica asociada a la distribución de frecuencias, es
decir que en ella se permite ver cuántas observaciones se encuentran por encima o
debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo.

Medidas de Tendencia Central:

La estadística descriptiva en su función básica de reducir datos, propone una serie de


indicadores que permiten tener una percepción rápida de lo que ocurre en un fenómeno.
La primera gama de indicadores corresponde a las “Medidas de Tendencia Central”.
Existen varios procedimientos para expresar matemáticamente las medidas de tendencia
central, de los cuales, los más conocidos son: la media aritmética, la moda y la mediana.

Se llama medidas de posición, tendencia central o centralización a unos valores


numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores de una
variable estadística. Estas medidas se conocen también como promedios.

Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado
entre el menor y el mayor de la serie y que su cálculo y utilización resulten sencillos en
términos matemáticos.

Se distinguen dos clases principales de valores promedio:


Las medidas de posición centrales: medias (aritmética, geométrica, cuadrática,
ponderada), mediana y moda.

Las medidas de posición no centrales: entre las que destacan especialmente los
cuantiles.

Media Aritmética:

Es la suma de todos los valores de la variable dividida entre el número total de


elementos. Es aquel valor que ocurre con más frecuencia, como por ejemplo:
1,2,2,2,3,3,4,4,4,4,4,6,7,8,8,9, la moda sería el "4" porque es el que más se repite.

Mediana:

Es el valor de la variable que deja el mismo número de datos antes y después que él,
una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o
iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la
mediana representarán el otro 50% del total de datos de la muestra.

Es un valor único de un conjunto de datos que mide al elemento central en los datos.
Este único elemento es el más cercano a la mitad o el más central en el conjunto de
números.

Moda:

Es una medida de tendencia central que es diferente a la media pero parecida a la


mediana ya que no se calcula por métodos ordinarios de aritmética. Es aquel valor que se
repite más frecuentemente en un conjunto de datos. La moda se define como aquel
valor de la variable al que corresponde máxima frecuencia (absoluta o relativa). Para
calcularla, también será necesario distinguir si los datos están o no agrupados.

Medidas de Dispersión:

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda
sólo nos revelan una parte de la información que necesitamos acerca de las características
de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos
medir también su dispersión, extensión o variabilidad.

La dispersión es importante porque:

Proporciona información adicional que permite juzgar la confiabilidad de la medida


de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición
central es menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos
problemas.

Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea


tener una amplia dispersión de valores con respecto al centro de distribución o esto
presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar
escoger distribuciones que tengan las dispersiones más grandes.

Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de


describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es
importante, ¿cómo medimos la variabilidad de una distribución empírica?. Vamos a
considerar sólo algunas medidas de dispersión absolutas: el rango, la varianza, la
desviación estándar y el coeficiente de variación.

Varianza:

Es la media aritmética del cuadrado de las desviaciones respecto a la media de una


distribución estadística. El análisis de varianza sirve para comparar si los valores de un
conjunto de datos numéricos son significativamente distintos a los valores de otro o más
conjuntos de datos. El procedimiento para comparar estos valores está basado en la
varianza global observada en los grupos de datos numéricos a comparar. Típicamente, el
análisis de varianza se utiliza para asociar una probabilidad a la conclusión de que la media
de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones.

Desviación Típica:

La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la


media de los cuadrados de las puntuaciones de desviación.

Medidas de Posición:

Son indicadores usados para señalar que porcentaje de datos dentro de una
distribución de frecuencias superan estas expresiones, cuyo valor representa el valor del
dato que se encuentra en el centro de la distribución de frecuencia, por lo que también se
les llama " Medidas de Tendencia Central ". Pero estas medidas de posición de una
distribución de frecuencias han de cumplir determinadas condiciones para que lean
verdaderamente representativas de la variable a la que resumen.

Percentiles:
Los percentiles representan los valores de la variable que están por debajo de un
porcentaje, el cual puede ser una valor de 1% a 100% (en otras palabras, el total de los
datos es divido en 100 partes iguales). Los percentiles, que dividen a la distribución en
cien partes.

Decíles:

Son los nueve valores que dividen la serie de datos en diez partes iguales. Son ciertos
números que dividen la sucesión de datos ordenados en diez partes porcentualmente
iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes
iguales, son también un caso particular de los percentiles.

Cuartiles:

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes porcentualmente iguales. Los cuartiles son los tres valores de la variable que
dividen a un conjunto de datos ordenados en cuatro partes iguales.

Distribuidores de Frecuencia:

Es la agrupación de datos en categorías mutuamente excluyentes que indican el


número de observaciones en cada categoría. La distribución de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el número existente en cada clase.

Elementos fundamentales para elaborar una distribución de frecuencia:

1) RANGO.

Es una medida de dispersión que se obtiene como la diferencia entre el número mayor y
el número menor de los datos

2) AMPLITUD TOTAL.

Simplemente se obtiene sumándole 1 al rango.

3) LAS CLASES.

Están formadas por dos extremos. el menor se llama límite inferior el mayor se llama
límite superior. hay distintos tipos de clases.

4)EL NUMERO DE CLASES.

Se determina a través de la formula de stuger, la cual es valida cuando el No de


observaciones sea menor o igual a 500.

Вам также может понравиться