Вы находитесь на странице: 1из 100

UNIVERSIDAD RURAL DE GUATEMALA

Carrera: Administración

Sede y Código: Sayaxché Petén, 058

Estudiante: Robelio Estuardo Soberanis Godoy

Carné: 160580089

Semestre Académico: Cuarto Semestre 2017

Docente: Ing. Mynor Daniel Gonzales Asig

Texto Paralelo, Estadística I

Sayaxché Petén, 28 de enero de 2018


INTRODUCCCION

La estadística es una rama de la matemática la cual nos va a ayudar en la recolección y tabulación


de datos, es decir, que a través de sus diversos métodos obtenemos la información de forma
cualitativa y cuantitativa. En este entorno encontramos múltiples formulas las cuales nos van a
ayudar a sacar diversos promedios indispensables como lo es: la moda (dato que más se repito),
la mediana (dato intermedio) y media aritmética, cuartil, decil, etc. así como múltiples tablas las
cuales harán que nuestro informe sea presentado completamente, al mismo tiempo también nos
ofrece múltiples graficas las cuales nos servirán para un informe o en el proceso de alguna tesis e
inclusive para un seminario.
La estadística puede aplicarse de forma clara y concreta ya que en ella vemos nuestras pérdidas y
ganancias dentro de una empresa inclusive más en los establecimientos para saber los promedios
de los estudiantes. A continuación se le presentaran temas con su definición y fórmulas que
forman parte de la estadística.

1
OBJETIVOS

Fortalecer la capacidad para analizar e interpretar la información que se obtiene por medio de la
aplicación de herramientas estadísticas.

Conocer y trabajar conceptos básicos de la estadística ya que obtiene diferentes ramas.

Analizar situaciones representadas en los gráficos.

Adquirir habilidades para conseguir una tabla de frecuencias, un diagrama de barras, media
aritmética cuartiles y otras cosas más.

Relacionar la información contenida en la tabla con el tipo de variable que se está tabulando

Cuestionar la validez y generalidad de las afirmaciones en relación a los conocimientos del


método estadístico.

El principal objetivo de la estadística es hacer inferencias acerca de una población, con base en la
información contenida en una muestra.

2
INTRODUCCION A LA ESTADÍSTICA

¿Qué es la estadística?
Es un conjunto de técnicas que, partiendo de la observación de fenómenos, permiten al
investigador obtener conclusiones útiles sobre ellos. También es la ciencia de recolectar describir
e interpretar datos. Ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de
ellos diferencias basadas en el cálculo de probabilidades.

¿Cuál es el objetivo de la Estadística?


Reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y
deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones
para el futuro.

CONCEPTOS BÁSICOS DE ESTADISTICA:

La estadística es la ciencia que se ocupa de la recogida y obtención de datos y de su posterior


tratamiento para poder expresarlos numéricamente y así poder extraer conclusiones.

Los primeros estudios estadísticos eran demográficos así que se ha conservado gran parte del
vocabulario.

Población: Es el conjunto sobre el que se realizará el estudio estadístico.

Individuo o Unidad Estadística: Cada uno de los elementos que componen la población.

Muestra: Conjunto representativo de la población pero más pequeño que esta.

Muestreo: Es la reunión de los datos sobre una muestra que serán el objeto de nuestro estudio
estadístico.

Valor: Son todos los resultados que podemos obtener. En el caso de una moneda serían cara y
cruz.

3
Dato: Los distintos valores que obtenemos para cada individuo. Si lanzamos la moneda al aire
tres veces obtendríamos 3 datos; por ejemplo: cruz, cara, cruz.

Los primeros estudios estadísticos eran demográficos así que se ha


conservado gran parte del vocabulario.

 Población: Es el conjunto sobre el que se realizará el estudio


estadístico.
 Individuo o Unidad Estadística: Cada uno de los elementos que
componen la población.
 Muestra: Conjunto representativo de la población pero más pequeño
que esta.
 Muestreo: Es la reunión de los datos sobre una muestra que serán el
objeto de nuestro estudio estadístico.
 Valor: Son todos los resultados que podemos obtener. En el caso de
una moneda serían cara y cruz.
 Dato: Los distintos valores que obtenemos para cada individuo. Si
lanzamos la moneda al aire tres veces obtendríamos 3 datos; por
ejemplo: cruz, cara, cruz.

4
TIPOS DE VARIABLES

Existen dos tipos las cuales son:


 Variable Cualitativa o de Atributos
 Variable Cuantitativa o Numérica

¿Qué es una variable cualitativa o de atributos?


Son aquellas variables que permiten la expresión de una característica una categoría un atributo o
una cualidad.

¿Qué es una variable cuantitativa o numérica?


Son aquellas variables que adoptan valores numéricos es decir cifras de este modo se diferencian
de las variables cualitativas.

¿Qué son los métodos estadísticos?


Es el conjunto de los métodos que se utilizan para medir las características de la información,
para resumir los valores individuales, y para analizar los datos a fin de extraerles el máximo de
información.

¿Qué es un dato?
Es el valor observado de una variable en un individuo en una medición. Se suele decir también
que un dato es la realización de una variable.
Los datos se pueden dividir en dos ramas las cuales son:
 Datos individuales.
 Datos estadísticos.

¿Qué son los datos individuales?


Es el dato de un solo individuo, ejemplo: la edad de Juan es un dato individual.

5
¿Qué son los datos estadísticos?
Es el dato de una muestra o de una población en su conjunto, ejemplo: el promedio de edades de
una muestra o población de personas es un dato estadístico.

Entre los datos estadísticos podemos encontrar:

Datos Cualitativos:

Cuando los datos son cualitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su estado civil,
observamos que pueden existir solteros, casados, divorciados, viudos.

Datos cuantitativos.

Cuando los valores de los datos representan diferentes magnitudes, decimos que son datos
cuantitativos. Ejemplo: se clasifican las estudiantes de Turismo de acuerdo a sus notas,
observamos que los valores (nota) representan diferentes magnitudes.

Datos cronológicos.
Cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los datos son
reconocidos como cronológicos. Ejemplo: al registrar los promedios de notas de los Alumnos de
turismo o de forestal en los diferentes semestres.

Datos geográficos.
Cuando los datos están referidos a una localidad geográfica se dicen que son datos geográficos.
Ejemplo: el número de estudiantes de educación superior en las distintas regiones del país.

6
INTRODUCCION A LA ESTADISTICA
La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una
gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos.
Por ejemplo, la estadística interviene cuando se quiere conocer el estado de la educación de un
país, a través de ciertos parámetros como la tasa de mortalidad de la población.
En este caso la estadística describe la muestra en términos de datos organizados y resumidos, y
luego infiere conclusiones respecto de la población.
Aplicada a la investigación científica, también infiere cuando provee los medios matemáticos
para establecer si una hipótesis debe o no ser rechazada.
La estadística puede aplicarse a cualquier ámbito de la realidad, y por ello es
utilizada en física, química, biología, medicina, astronomía, psicología, sociología, etc.

POBLACIÓN Y MUESTRA

Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de
cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio
estadístico se llama población.

No debe confundirse la población en sentido demográfico y la población en sentido estadístico.


La población en sentido demográfico es un conjunto de individuos (todos los habitantes de un
país, todas los gatos de una ciudad), mientras que una población en sentido estadístico es un
conjunto de datos referidos a determinada característica o atributo de los individuos (las edades
de todos los individuos de un país, el color de todas los gatos de una ciudad).

Incluso una población en sentido estadístico no tiene porqué referirse a muchos individuos. Una
población estadística puede ser también el conjunto de calificaciones obtenidas por
un individuo a lo largo de sus estudios universitarios.

7
Se llama muestra a un subconjunto de la población, preferiblemente representativo de la misma.
Por ejemplo, si la población es el conjunto de todas las edades de los estudiantes de la provincia
de Buenos Aires, una muestra será conjunto de edades de 2000 estudiantes de la provincia de
nueva york tomados al azar.

DATOS INDIVIDUALES Y DATOS ESTADISTICOS:

Un dato individual es un dato de un solo individuo, mientras que un dato estadístico es un dato de
una muestra o de una población en su conjunto. Por ejemplo, la edad de Pedro es un dato
individual, mientras que el promedio de edades de una muestra o población de personas es un
dato estadístico.
Desde ya, puede ocurrir que ambos no coincidan: la edad de Pedro puede ser 39 años, y el
promedio de edades de la muestra donde está incluido Juan es 23 años.
Por esta razón un dato estadístico nada dice respecto de los individuos, porque solamente
describe la muestra o población.
Los datos estadísticos que describen una muestra suelen llamarse estadístico (por ejemplo, el
promedio de ingresos mensuales de las personas de una muestra.

ESTRUCTURA DEL DATO

Los datos son la materia prima con que trabaja la estadística, del mismo modo que la madera es la
materia prima con que trabaja el carpintero. Así como este procesa o transforma la madera para
obtener un producto útil, así también el estadístico procesa o transforma los datos para
obtener información útil. Tanto los datos como la madera no se inventan: se extraen de la
realidad; en todo caso el secreto está en recoger la madera o los datos más adecuados a
los objetivos del trabajo a realizar.

8
La unidad de análisis es el elemento del cual se predica una propiedad y característica. Puede ser
una persona, una familia, un animal, una sustancia química, o un objeto como una dentadura o
una mesa.
La variable es la característica, propiedad o atributo que se predica de la unidad de análisis.
Por ejemplo puede ser la edad para una persona, el grado de cohesión para una familia, el nivel
de aprendizaje alcanzado para un animal, el peso específico para una sustancia química, el nivel
de ‘salud’ para una dentadura, y el tamaño para una mesa.
Pueden entonces también definirse población estadística (o simplemente población) como el
conjunto de datos acerca de unidades de análisis (individuos, objetos) en relación a una misma
característica, propiedad o atributo (variable).
Sobre una misma población demográfica pueden definirse varias poblaciones de datos, una para
cada variable. Por ejemplo, en el conjunto de habitantes de un país (población demográfica),
puede definirse una población referida a la variable edad (el conjunto de edades de los
habitantes), a la variable ocupación (el conjunto de ocupaciones de los habitantes), a la
variable sexo (el conjunto de condiciones de sexo de los habitantes).
La categoría es cada una de las posibles variaciones de una variable. Categorías de la variable
sexo son masculino y femenino, de la variable ocupación pueden ser arquitecto, médico, etc, y de
la variable edad pueden ser 10 años, 11 años, etc.
Cuando la variable se mide cuantitativamente, es decir cuando se expresa numéricamente, a la
categoría suele llamársela valor. En estos casos, el dato incluye también una unidad de medida,
como por ejemplo años, cantidad de hijos, grados de temperatura, cantidad de piezas dentarias,
centímetros, etc. El valor es, entonces, cada una de las posibles variaciones de una variable
cuantitativa.

La medición

9
Los datos se obtienen a través un proceso llamado medición. Desde este punto de vista, puede
definirse medición como el proceso por el cual asignamos una categoría (o un valor) a una
variable, para determinada unidad de análisis.
Ejemplo: cuando decimos que Martín es varón, estamos haciendo una medición, porque estamos
asignando una categoría (varón) a una variable (sexo) para una unidad de análisis (Martín).
Se pueden hacer mediciones con mayor o menor grado de precisión.
Cuanto más precisa sea la medición, más información nos suministra sobre la variable y, por
tanto, sobre la unidad de análisis. No es lo mismo decir que una persona es alta, a decir que mide
1,83 metros.
Los diferentes grados de precisión o de contenido informativo de una medición se suelen
caracterizar como niveles de medición. Típicamente se definen cuatro niveles de medición, y en
cada uno de ellos la obtención del dato o resultado de la medición será diferente:
Ejemplos de datos en diferentes niveles de medición.

Nivel de Nivel nominal Nivel ordinal Nivel Nivel cuantitativo


medición cuantitativo continuo
discreto

DATO Martín es Elena terminó la Juan tiene 32 María tiene 70


electricista secundaria dientes pulsaciones por
minuto

Unidad de Martín Elena Juan María


análisis

Variable Oficio Nivel de Cantidad de Frecuencia


instrucción piezas dentarias cardíaca

Categoría o valor Electricista Secundaria 32 70


completa

Unidad de ------------- ------------ Diente Pulsaciones por


medida minuto

10
CONCEPTOS BÁSICOS

1. 2. ¿Qué estudia la Estadística? La Estadística es la rama de la Matemática que se ocupa de


recopilar datos (en censos, encuestas, etc.), de organizarlos para una mejor comprensión
del fenómeno que se desea estudiar y de analizarlos con un determinado objetivo. La
estadística se aplica a todas las ciencias, pues facilita el estudio de hechos del mundo o de
la sociedad.
2. 3. Ejemplo: Se hizo una encuesta a 8976 personas, de las cuales 8707 respondieron que
calman su dolor de cabeza tomando una aspirina. Si la encuesta está bien hecha, este dato
puede ser utilizado por los médicos, quienes podrían afirmar que si un paciente sufre de
dolor de cabeza, tiene un 97 % de probabilidad de calmarla tomando una aspirina.
3. 4. Algunos conceptos de Estadística Población: Llamamos población al conjunto de
individuos (personas, animales, cosas) sobre la cual se estudia una determinada
característica. Ejemplos: El tamaño de la población es el número de individuos que la
componen. Habitantes del barrio Se hace una encuesta en las viviendas de un barrio para
determinar cuántas personas viven en cada una de ellas Alumnos del curso Se registra el
peso de los alumnos de un curso Población Datos que se recopilan
4. 5. Cuando el tamaño de una población es muy grande, se trabaja con una parte de ella
llamada muestra. Ejemplo: A una consultora le encargan hacer un estudio acerca de cuál
es la intención del voto de los ciudadanos de una ciudad en las próximas elecciones.
Como no es posible encuestar a todos los ciudadanos, la consultora toma un grupo de 500
y sobre él analiza la variable. Con los datos recopilados sobre esta muestra, se puede
hacer una proyección de los votos que obtendrá cada candidato. Importante!!! Para que el
estudio estadístico sea confiable, es muy importante que la selección de los individuos de
una muestra resulte representativa de la población que se analiza, o sea, se deben obtener
de ella resultados aproximadamente iguales a los que se hubieran obtenido considerando
el total de la población.
5. 6. Variables: son los caracteres o cualidades de la población que es objeto
de estudio o análisis. Pueden ser: VARIABLES ESTADÍSTICAS CUANTITATIVAS
Son medibles y se expresan por medio de un número CUALITATIVAS No se pueden

11
medir y se expresan con palabras. Tiene distintas modalidades, que son las diferentes
situaciones que se pueden presentar. Ejemplos: Sexo: Femenino –
Masculino Color de ojos Color del
cabello DISCRETAS Cuando solo pueden tomar algunos valores determinados.
Ejemplos: Nº de padres vivos Nº de hermanos CONTINUAS Cuando pueden tomar
infinitos valores comprendidos entre dos valores determinados. Ejemplos : Altura, peso,
etc.
6. 7. Frecuencia absoluta: es el número de veces que se repite una
observación o valor de la variable (f). Frecuencia relativa de una observación: es el
cociente entre su frecuencia absoluta y el número total de observaciones realizadas (f r).
7. 8. Observaciones La tabla que muestra la frecuencia relativa, absoluta y acumulada se
llama distribución de frecuencias. La suma de las frecuencias absolutas es el total de
observaciones. La suma de las frecuencias relativas es siempre 1. Si multiplicamos por
100 cada frecuencia relativa, obtenemos el porcentaje de cada valor de la variable
(%).Porcentaje = frecuencia relativa . 100
8. 9. Ejemplo 1: A los alumnos de 1 A se les tomó una evaluación escrita. En la tabla se
detallan las notas que obtuvieron. Esta tabla recibe el nombre de
distribución de frecuencias ¿Cuántos alumnos hay en el curso? Cuántos aprobaron?
Cuántos resultaron aplazados? Utiliza papel y lápiz para resolver) Total 2 10 2 9 3 8 5 7 8
6 6 5 5 4 3 3 4 2 2 1 % f r f Notas
9. 10. Laura, una adolescente de 15 años, está obsesionada con su peso. Su mamá, que cada
día la ve más delgada, decide llevarla al médico. El especialista que la examina le indica
que no debe seguir bajando de peso. Como no logra convencerla, teme que Laura padezca
de anorexia. Decide entonces recurrir a los números. Le da turno para verla en una
semana y analizar juntos los resultados obtenidos en una encuesta que él va a llevar a
cabo. Para realizarla, va a distintas escuelas de la zona y consulta sobre los pesos de
adolescentes (mujeres) cuya altura no difiere en más de 2cm con la de Laura. Arma la
siguiente tabla con los pesos que obtiene, incluyendo el de Laura. Laura pesa el
porcentaje de adolescentes de la tabla que pesan más que Laura es del porcentaje de las
que pesan menos y las que pesan igual que Laura (incluyendo a ella).

12
10. 11. Datos Agrupados en Intervalos Cuando trabajamos con una variable continua,
podemos agrupar los valores en intervalos. Para eso es necesario conocer el rango de la
variable (diferencia entre el mayor y el menor valor que toma la variable) y luego
dividirlo en partes iguales llamadas intervalos. En los intervalos se incluye el primer
valor, pero no el último, salvo en el último intervalo en el que se incluyen los dos.
11. 12. Ejemplo: Siguiendo con el ejemplo anterior, reagrupamos los datos reunidos por el
médico y anotamos las frecuencias correspondientes: Observa: Los pesos se distribuyen
en intervalos de igual amplitud. En este caso la amplitud es En cada intervalo se incluye el
primer valor, pero no el último, excepto en el último intervalo en el que se incluyen los
dos. Valor central de un intervalo El valor central del intervalo, se obtiene como promedio
de los valores extremos de dicho intervalo y se llama marca de clase (punto medio de
cada intervalo). Intervalos Pesos ( Marca de clase 6 de 57 a 60 9 de 54 a 57 12 de 51 a 54
10 de 48 a 51 8 de 45 a 48 Frecuencia Absoluta
12. 13. Gráficos Estadísticos Los gráficos estadísticos se utilizan muchísimo, y con ellos la
información obtenida puede ser leída con claridad y rapidez. Los gráficos más usados son:
diagramas de barras, gráficos circulares, pictogramas, histogramas, polígono de
frecuencia. Para variables discretas: Para variables continuas: diagramas de barras -
histogramas pictogramas polígono de frecuencia gráfico de torta - gráfico de torta.
13. 14. Ejemplos 1 2 3 4 5 6 7 8 9 10 En el eje x se representan y en el eje y, Diagramas de
barra: Se construyen con rectángulos. Para el ejemplo de las notas obtenidas por los
alumnos de 1° A, se tiene:
14. 15. Gráfico de torta: Para armar el gráfico circular correspondiente,
dividimos el círculo en sectores, según los porcentajes obtenidos Al círculo, que
representa el 100 %, le corresponde un ángulo central de 360°. Por lo tanto, para hallar la
amplitud del ángulo correspondiente a un sector que representa un 30%, por ejemplo,
hacemos:
15. Pictogramas : En ellos se recurre a dibujos relacionados con el tema tratado
16. 17. Histogramas y polígono de frecuencia Para el ejemplo de los pesos de las adolescentes
tenemos: 0 2 4 6 8 10 12 45 - 48 48 - 51 51 - 54 54 - 57 57 - 61 54 - 57 57 - 61

13
CLASIFICACIÓN ESTADÍSTICA

El estudio de la estadística se divide clásicamente en dos, la estadística descriptiva y la estadística


inferencial.

La estadística inferencial o inductiva sirve extrapolar los resultados obtenidos en el análisis de


los datos y a partir de ello predecir acerca de la población, con un margen de confianza
conocido.

14
La estadística descriptiva o deductiva se construye a partir de los datos y la inferencia sobre la
población no se puede realizar, al menos con una confianza determinada, la representación de la
información obtenida de los datos se representa mediante el uso de unos cuantos parámetros y
algunas graficas planteadas de tal forma que den importancia los mismos datos.

15
VARIABLE ESTADÍSTICA

Una variable estadística es una característica que puede fluctuar y cuya variación es susceptible
de adoptar diferentes valores, los cuales pueden medirse u observarse. Lasvariables adquieren
valor cuando se relacionan con otras variables, es decir, si forman parte de una hipótesis o de
una teoría. En este caso se las denomina constructos oconstrucciones hipotéticas.

Escala de Medición.
Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en
observación. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón. Las
variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las
variables de escala de intervalo o de razón se denominan variables numéricas. Con los valores de
las variables categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las
variables numéricas sí. La escala nominal sólo permite asignar un nombre al elemento medido.
Esto la convierte en la menos informativa de las escalas de medición

16
17
Recopilación de datos

El recopilador de datos es un componente de SQL Server 2017 que recopila diferentes conjuntos
de datos. La recopilación de datos se ejecuta de forma constante o según una programación
definida por el usuario. El recopilador de datos almacena los datos recopilados en una base de
datos relacional conocida como almacén de administración de datos.

¿Qué es el recopilador de datos?

El recopilador de datos es un componente básico de la plataforma de recopilación de datos


paraSQL Server 2017 y las herramientas que se proporcionan a través de SQL Server. El
recopilador de datos proporciona un punto central para la recopilación de datos de los servidores
de bases de datos y aplicaciones. Este punto de recopilación puede obtener datos de una variedad
de orígenes y no se limita a los datos de rendimiento, a diferencia de Seguimiento de SQL.

El recopilador de datos permite ajustar el ámbito de recopilación de datos de acuerdo con cada
entorno de producción y pruebas. El recopilador de datos también usa almacenamiento de datos,
que es una base de datos relacional que permite administrar los datos recopilados estableciendo
diferentes períodos de retención para los mismos.

El recopilador de datos admite la optimización dinámica para la recopilación de datos y es


extensible a través de su API. Para más información, consulte Data Collector Programming.

La ilustración siguiente muestra cómo encaja el recopilador de datos en la estrategia global para
la recopilación y la administración de datos de SQL Server 2017.

18
Conceptos

El recopilador de datos se integra en el Agente SQL Server e Integration Services, y usa ambos
exhaustivamente. Antes de trabajar con el recopilador de datos, debe conocer ciertos conceptos
relacionados con cada uno de estos componentes de SQL Server. Se usa para programar y
ejecutar trabajos de recopilación. Debe conocer los conceptos siguientes:

 Trabajo
 Paso de trabajo
 Programación de trabajo
 Subsistema
 Cuentas de proxy
 Paquete de SSIS
 configuración de paquete de SSIS

Destino
Instancia de Motor de base de datos en una edición de SQL Server que admite la recopilación de
datos. Para obtener más información sobre las ediciones compatibles, vea la sección "Facilidad
de uso" de Características compatibles con las ediciones de SQL Server 2016.

19
Tipo de destino
El tipo de destino, que tiene ciertas características y comportamiento. Por ejemplo, un destino de
instancia de SQL Server tiene características diferentes de un destino de base de datos de SQL
Server.

Proveedor de datos
Origen de datos conocido, específico de un tipo de destino, que proporciona datos a un tipo de
recopilador.

Tipo de recopilador
Un contenedor lógico alrededor de paquetes de SSIS que proporciona el mecanismo real para
recopilar los datos y cargarlos en el almacén de administración de datos.

Elemento de recopilación
Una instancia de un tipo de recopilador. Un elemento de recopilación se crea con un conjunto
específico de propiedades de entrada y una frecuencia de recopilación.

Conjunto de recopilación
Grupo de elementos de recopilación. Un conjunto de recopilación es una unidad de recopilación
de datos con la que un usuario puede interactuar a través de la interfaz de usuario.

Modo de recopilación
La manera en la que se recopilan y se almacenan los datos. El modo de recopilación puede
almacenarse en memoria caché o no. El modo con almacenamiento en memoria caché admite la
recopilación continua, mientras que el modo sin almacenamiento en memoria caché se ha
diseñado para la recopilación a petición o para instantáneas de recopilación.

Almacén de administración de datos


Base de datos relacional que se usa para almacenar los datos que se recopilan.

La ilustración siguiente muestra las dependencias y relaciones entre los componentes de


recopilador de datos.

20
21
PRESENTACION DE DATOS DE UNA SOLA VARIABLE
A las frecuencias acumuladas expresadas en porcentajes se les llama RANGOS PERCENTILES.
Una tabla de Clasificación o Distribución de frecuencias permite mostrar cómo se clasifican los
sujetos pertenecientes a una muestra o población de acuerdo a las modalidades, categorías o
valores de una sola variable.}

22
DISTRIBUCIÓN DE FRECUENCIAS

En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías


mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto
proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta
las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.

FRECUENCIA ABSOLUTA

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio


estadístico. Se representa por fila. La suma de las frecuencias absolutas es igual al número total
de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra
griega Σ (sigma mayúscula) que se lee suma o sumatoria.

FRECUENCIA RELATIVA

Se dice que la frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado


valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por hi. La
suma de las frecuencias relativas es igual a 1.

FRECUENCIA ACUMULADA

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.

23
La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de un variable
aleatoria (X) es menor que o igual a un valor de referencia (Xr).

FRECUENCIA RELATIVA ACUMULADA

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado


valor y el número total de datos. Se puede expresar en tantos por ciento. Ejemplo:

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27

DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua. Se agrupan los valores en
intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su
frecuencia correspondiente. Límites de la clase. Cada clase está delimitada por el límite inferior
de la clase y el límite superior de la clase.

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca de


clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el
cálculo de algunos parámetros

PRESENTACIÓN GRAFICA DE DATOS


Un gráfico o representación gráfica es un tipo de representación de datos,
generalmente numéricos, mediante recursos
gráficos (líneas, vectores, superficies o símbolos), para que se manifieste visualmente la relación
matemática o correlación estadística que guardan entre sí. También es el nombre de un conjunto
de puntos que se plasman en coordenadas cartesianas y sirven para analizar el comportamiento de
un proceso o un conjunto de elementos o signos que permiten la interpretación de un fenómeno.
La representación gráfica permite establecer valores que no se han obtenido experimentalmente
sino mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del
intervalo experimental).

24
GRÁFICA DE BARRAS
Una gráfica de barras tiene barras rectangulares con longitudes proporcionales a los valores que
representan. Las gráficas de barras se utilizan para comparar dos o más valores. Las barras
pueden ser horizontales o verticales.}

EJEMPLO

Tabla 1. Ejemplos de una gráfica de barras horizontales y verticales

GRÁFICA DE PASTEL
Un diagrama de pastel es un círculo dividido en partes, donde el área de cada parte es
proporcional al número de datos de cada categoría.

La gráfica de pastel se usa para representar variables cualitativas o categóricas, de


preferencia nominales.

Se utiliza para mostrar la proporción le corresponde a cada categoría. Las gráficas de pastel no
deben usarse para mostrar relaciones entre las categorías. Es más fácil realizar comparaciones
con gráficas de barras. Tampoco deben usarse para mostrar más de cinco categorías.

25
HISTOGRAMA

En estadística, un histograma es una representación gráfica de una variable en forma de barras,


donde la superficie de cada barra es proporcional a la frecuencia de los valores representados.
Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o
de la muestra, respecto a una característica, cuantitativa y continua (como la longitud o el peso).
De esta manera ofrece una visión de grupo permitiendo observar una preferencia, o tendencia,
por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro
del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así
pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o
concisión entre los valores de todas las partes que componen la población o la muestra, o, en
contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los
valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que
cada miembro de la población toma por su lado y adquiere un valor de la característica
aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

26
En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra,
según sea el caso, que se ubica en un determinado valor o sub-rango de valores de la
característica que toma la característica de interés, evidentemente, cuando este espectro de
valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o
comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el
alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés.

Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas discretas
las barras se dibujan separadas y el gráfico se llama diagrama de frecuencias, porque la variable
representada en el eje horizontal ya no representa un espectro continuo de valores, sino valores
cuantitativos específicos, igual que ocurre en un diagrama de barras, usado para representar una
característica cualitativa o categórica. Su utilidad se hace más evidente cuando se cuenta con un
gran número de datos cuantitativos y que se han agrupado en intervalos de clase.

27
POLIGONO DE FRECUENCIA

El polígono de frecuencias se utiliza para representar variables cuantitativas. Se construye


uniendo los extremos de un diagrama de barras o puntos medios de los rectángulos de un
histograma.

28
Representa el histograma y el polígono de frecuencias.

GRAFICAS LINEALES
Los gráficos de líneas muestran una serie como un conjunto de puntos conectados mediante una
sola línea. Los gráficos de líneas se usan para representar grandes cantidades de datos que tienen
lugar durante un período continuado de tiempo.

29
GRAFICA DE PUNTOS

¿Qué son las gráficas de puntos? Son una representación gráfica de los datos donde se señala
cada uno de ellos Gráfica de Puntos mediante puntos localizados a lo largo de una recta
numérica. Tendencia, la variabilidad o dispersión y la forma de la distribución numérica. Se usan
principalmente para comparar grupos de datos o distribuciones. ¿Qué muestran la gráficas de
acumulan puntos? Una gráfica de puntos al igual que un histograma muestra. ¿Para qué tipo de
datos se usa? Una gráfica de puntos es adecuada para representar datos cuantitativos o La
principal ventaja de una gráfica de puntos es que muestra la distribución de los datos,
conservando el valor individual de g cada uno de ellos.

30
MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la


información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de
la distribución de datos se denomina medida o parámetro de tendencia central o de
centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro
de la distribución, independientemente de que esté más o menos centrada, se habla de estas
medidas como medidas de posición.En este caso se incluyen también los cuartiles entre estas
medidas.

Entre las medidas de tendencia central tenemos:

 Media aritmética
 Media ponderada
 Media geométrica
 Media armónica
 Mediana
 Moda

Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que
las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se
está observando, en este caso se observan variables cuantitativas.

31
MEDIA ARITMETICA
Construcción geométrica para hallar la media aritmética (A), cuadrática (Q), geométrica (G) y
armónica (H) de dos números a y b.

En matemáticas y estadística, la media aritmética (también llamada promedio o media) de un


conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de
estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de
la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una
muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos
muestrales.

32
MEDIA PONDERADA
La media ponderada es una medida de tendencia central, que es apropiada cuando en un conjunto
de datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los demás datos. Se
obtiene multiplicando cada uno de los datos por su ponderación (peso) para luego sumarlos,
obteniendo así una suma ponderada; después se divide esta entre la suma de los pesos, dando
como resultado la media ponderada.

33
MEDIA GEOMETRICA

Sea una distribución de frecuencias (x , n ). La media geométrica, que denotaremos por G. se


define como la raíz N-ésima del producto de los N valores de la distribución.

G=

Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la misma, pero
utilizando la marca de clase (Xi).

34
El empleo más frecuente de la media geométrica es el de promediar variables tales como
porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone que la
variable presenta variaciones acumulativas.

Ventajas e inconvenientes:

- En su cálculo intervienen todos los valores de la distribución.

- Los valores extremos tienen menor influencia que en la media aritmética.

- Es única.

- Su cálculo es más complicado que el de la media aritmética.

Además, cuando la variable toma al menos un x = 0 entonces G se anula, y si la variable toma


valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda
determinada debido al problema de las raíces de índice par de números negativos.

35
MEDIANA

Visualización geométrica de la moda, la mediana y de la media de una función arbitraria de


densidad de probabilidad.

En el ámbito de la estadística, la mediana (del latín mediānus 'del medio'1) representa el valor de
la variable de posición central en un conjunto de datos ordenados.

Cálculo de la mediana
36
1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un número impar de medidas la mediana es la puntuación central.

2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5

3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.

7, 8, 9, 10, 11, 12Me = 9.5

Existen dos métodos para el cálculo de la mediana:

1. Considerando los datos en forma individual, sin agruparlos.


2. Utilizando los datos agrupados en intervalos de clase.

Al tratar con datos agrupados, si coincide con el valor de una frecuencia acumulada, el valor de la
mediana coincidirá con la abscisa correspondiente. Si no coincide con el valor de ninguna
abscisa, se calcula a través de semejanza de triángulos en el histograma o polígono de frecuencias
acumuladas, utilizando la siguiente equivalencia:

Donde y son las frecuencias absolutas acumuladas tales que , y son los extremos, interior y
exterior, del intervalo donde se alcanza la mediana y es la abscisa a calcular, la mediana. Se

observa que es la amplitud de los intervalos seleccionados para el diagrama.

37
MODA

En estadística, la moda es el valor con mayor frecuencia en una distribución de datos.

Se hablará de una distribución bimodal de los datos adquiridos en una columna cuando
encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Una distribución trimodal de los datos es en la que encontramos tres modas. En el caso de
la distribución uniforme discreta, cuando todos los datos tienen la misma frecuencia, se puede
definir las modas como indicadas, pero estos valores no tienen utilidad. Por eso algunos
matemáticos califican esta distribución como «sin moda».

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados
antes de definir la moda, se ha de definir el intervalo modal.

La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos
partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.

38
CLASIFICACIÓN DE LA ESTADISTICA

El estudio de la estadística se divide clásicamente en dos, la estadística descriptiva y la estadística


inferencial.

La estadística inferencial o inductiva sirve extrapolar los resultados obtenidos en el análisis de


los datos y a partir de ello predecir acerca de la población, con un margen de confianza
conocido.

La estadística descriptiva o deductiva se construye a partir de los datos y la inferencia sobre la


población no se puede realizar, al menos con una confianza determinada, la representación de la
información obtenida de los datos se representa mediante el uso de unos cuantos parámetros y
algunas graficas planteadas de tal forma que den importancia los mismos datos.

39
40
10 EJERCICIOS DE MEDIA ARITMETICA

1. Calcular la media aritmética, la mediana y la moda de la siguiente serie de números: 5, 3, 6, 5,


4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.

SOLUCIÓN:
Ordenamos la serie de números: 2, 2, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 8, 8, 8
Moda: Mo = 5
Mediana: Me= 5+5/2 = 10/2 Me = 5
Media aritmética X= 2+2+3+3+4+4+4+4+4+5+5+5+5+5+5+6+6+8+8/20 = 99/20 = 4.95

2. Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 13, 16, 15, 19, 18, 15,
14, 18. Calcular la moda, la mediana y la media aritmética.

SOLUCIÓN:
Ordenamos la serie de números: 13, 14, 15, 15, 15, 16, 18, 18, 19
Moda: Mo = 15
Mediana: Me= 15
Media aritmética X= 13+14+15+15+15+16+18+18+19/9 = 143/9 = 15.88

3. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3,
4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3. Hallar la moda, la mediana y la media
aritmética.

SOLUCIÓN:

Ordenamos la serie de números: 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4.


Moda: Mo = 3
Mediana: Me= 3+3/2 = 6/2 = 3
Media aritmética X= 1+1+2+2+2+2+3+3+3+3+3+3+3+3+3+3+3+3+3+3+3+4+4+4/24 =
67/24 = 2.79

4. Las calificaciones de 36 alumnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6,


5, 7, 7, 5, 5, 8, 2, 10, 5, 6, 10, 4, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Calcular la moda, la
mediana y la media aritmética.

SOLUCIÓN:

41
Ordenamos la serie de números: 1, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6,
7, 7, 7, 7, 7, 7, 8, 9, 9, 10, 10.
Moda: Mo = 5
Mediana: Me= 5+6/2 = 11/2 = 5.5
Media aritmética
X=
1+2+2+3+3+4+4+4+4+5+5+5+5+5+5+5+5+5+6+6+6+6+6+6+6+7+7+7+7+7+7+8+9+9+10+10/
36 = 205/36 = 5.69

5. En un estudio que se realizó en un asilo de ancianos, se tomó las edades de los envejecientes
que pueden caminar sin dificultades. Buscar la media, la mediana y la moda de las siguientes
edades. 69 73 65 70 71 74 65 69 60 62

SOLUCIÓN:
Ordenamos las edades de menor a mayor 60 62 65 65 69 69 70 71 73 74
Media: Me= 69 + 73 + 65 + 70 + 71 + 74 + 65 + 69 + 60 + 62/10 = 678/10 = 67.8

Quiere decir que la edad promedio de los envejecientes del asilo que pueden caminar sin
dificultad es de 67.8

Mediana: Elementos intermedios: 69, 69

69 + 69 = 138/2 = 69 Por lo tanto, la mediana es de 69.

Moda: Tiene 2 modas, 65 y 69.

6. Se tiene las notas de 11 alumnos en un examen de matemática:10 ; 12 ; 09 ; 12 ; 08 ; 14 ; 12 ;


10 ; 11 ; 12 ; 08.

A) ¿Cuál es la moda?

a) 8 b) 10 c) 11 d) 12 e) 9

La respuesta correcta es la d, ya que la nota que más se repite es el 12.

B. ¿Cuál es la mediana?

a) 9 b) 10,5 c) 10 d) 11 e) 12

42
La respuesta correcta es la d.

Ordenamos los datos: 08, 08, 09, 10, 10, 11, 12, 12, 12, 12, 14 y por ser 11 datos se escoge la
nota del centro que en este caso es el 11.

C. Se elimina la mayor nota. ¿Cuál es la mediana de las notas restantes?

a) 10,5 b) 10 c) 11 d) 12 e) 11,5

Al eliminar la mayor de las notas quedan 10, y por ser un número par escogemos las dos notas
que quedan en el centro, las sumamos y dividimos por dos:

Me = (10 + 11) / 2 = 21/2 = 10,5 La respuesta correcta es la a.

D. Calcular la media aritmética.

Sumamos las notas y el resultado lo dividimos por 11.

x= (08+ 08 + 09 + 10 + 10 + 11 + 12 + 12 + 12 +12 + 14) / 11 = 118/11 = 10,72

7. Se tiene a continuación las edades de 20 alumnos de la I.E ROGERIO VELASQUEZ 16 18 20


21 19 19 20 18 17 18 21 16 21 19 16 16 17 18 16 18 se puede decir entonces que la moda es:

A) Unimodal B) Bimodal C) Amodal D) Trimodal E) Multimodal

8. José cosechó del árbol 4 peras, Catalina – 2 peras, y María – 6. Los niñosjuntaron sus frutas y
se las repartieron en forma igualitaria. ¿Cuántas peras obtuvo cada uno?
Solución. Calculemos la media aritmética:
4+2+6 12
= =4
3 3

Resultado: Cada uno obtuvo 4 peras.

43
9. A los cursillos del inglés asistieron 15 personal el lunes, el martes — 10, el miércoles — 12, el
jueves — 11, el viernes — 7, el sábado — 14, el domingo — 8. Calcular asistencia media de los
cursillos por la semana.
Solución. Calculemos la media aritmética:
15 + 10 + 12 + 11 + 7 + 14 + 8 77
= = 11
7 7

Resultado: en promedio a los cursillos del inglés asistieron 11 personas al día.

10. El piloto estuvo yendo dos horas a la velocidad de 120 km a la hora y horas a la velocidad
de 90 km a la hora. Calcule la velocidad media del coche durante la carrera.
Solución. Calculemos la media aritmética de las velocidades del coche por cada hora del
camino:

120 + 120 + 90 330


= = 110
3 3

Resultado: la velocidad media del coche durante la carrera fue de 110 km a la hora.

EJERCICIOS DE LA MEDIANA

Hallar la mediana de las siguientes series de números:

3, 5, 2, 6, 5, 9, 5, 2, 8.

2, 2, 3, 5, 5, 5, 6, 8, 9.

Me = 5

44
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.

2, 2, 3, 5, 5, 5, 6, 6, 8, 9.

10/2 = 5

10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16,
14, 8, 18

3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16,
17, 18, 18, 20

2. Tabular y calcular mediana de la siguiente serie de números: 5, 3, 6, 5,


4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.

xi fi Fi

2 2 2

3 2 4

4 5 9

45
5 6 15

6 2 17

8 3 20

20

20/2 = 10 Me = 5

3. Hallar la mediana de la distribución estadística que viene dada por la


siguiente tabla:

fi

[10, 15) 3

[15, 20) 5

46
[20, 25) 7

[25, 30) 4

[30, 35) 2

fi Fi

[10, 15) 3 3

[15, 20) 5 8

[20, 25) 7 15

[25, 30) 4 19

[30, 35) 2 21

21

47
4. Calcular la mediana de las alturas de los jugadores de un equipo de
baloncesto, que vienen dadas por la tabla:

Altura Nº de jugadores

[1.70, 1.75) 1

[1.75, 1.80) 3

[1.80, 1.85) 4

[1.85, 1.90) 8

[1.90, 1.95) 5

[1.95, 2.00) 2

fi Fi

48
[1.70, 1.75) 1 1

[1.75, 1.80) 3 4

[1.80, 1.85) 4 8

[1.85, 1.90) 8 16

[1.90, 1.95) 5 21

[1.95, 2.00) 2 23

23

MEDIDAS DE TENDENCIA NO CENTRAL


Estas medidas descriptivas permiten ubicar la posición que ocupa un valor dentro de un conjunto
de datos, se calcula para variables de tipo cualitativo ordinal y de tipo cuantitativo (discreta y
continua), cabe agregar que los resultados se expresan en las mismas unidades de los datos en
estudio.

Percentiles: son aquellos valores que dividen los datos ordenados en cien partes iguales. Existen
noventa y nueve percentiles, dicha medida hace referencia a un porcentaje de casos por debajo
del percentil y otros porcentajes por encima. Entre dos percentiles consecutivos cualesquiera se
encuentra un 1% o 1/100 partes de los datos.

49
Deciles: son valores que dividen los datos ordenados en diez partes iguales. Existen nueve
deciles, dicha medida deja un porcentaje de datos por debajo del decil y otro porcentaje por
encima. Entre dos deciles consecutivos cualesquiera se encuentra un 10% o 1/10 partes de los
elementos.

Cuartiles: son valores que dividen los datos ordenados en cuatro partes iguales. Existen tres
cuartiles, por lo tanto dicha medida hace referencia a un porcentaje de casos por debajo del cuartil
y otro porcentaje por encima Entre dos percentiles consecutivos cualesquiera se encuentra un
25% o 1/4 partes de los datos.

Cálculo con datos no agrupados

No hay uniformidad sobre su cálculo. En la bibliografía se encuentran hasta cinco métodos que
dan resultados diferentes.2 Uno de los métodos es el siguiente: dados n datos ordenados,

Para el primer cuartil:

Para el tercer cuartil:

CÓMO SE CALCULAN LOS CUARTILES

Esta calculadora utiliza el siguiente método para calcular los cuartiles:

n es el número total de valores. x1, x2 ... xn son los valores ordenados de menor a mayor.

FÓRMULAS PARA CALCULAR EL PRIMER CUARTIL

Si es un número entero, el primer cuartil es

50
Si no es un entero, el primer cuartil se interpola usando la

fórmula:

PERCENTILES

El percentil es una medida de posición usada en estadística que indica, una vez ordenados los
datos de menor a mayor, el valor de la variable por debajo del cual se encuentra
un porcentaje dado de observaciones en un grupo de observaciones. Por ejemplo, el percentil 20º
es el valor bajo el cual se encuentran el 20 por ciento de las observaciones.

Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del 1 al 99. El i %
de la muestra son valores menores que él y el 100-i % restante son mayores.

Aparecen citados en la literatura científica por primera vez por Francis Galton en 18851

 P25 = Q1.
 P50 = Q2 = mediana.
 P75 = Q3.
Cálculo con datos no agrupados

Un método para establecer un percentil sería el siguiente: Calculamos...


Donde n es el número de elementos de la muestra e i, el percentil. El resultado de realizar esta
operación es un número real con parte entera E y parte decimal D. Teniendo en cuenta estos dos
valores, aplicamos la siguiente función:

51
MEDIDAS DE DISPERSION

Las medidas de dispersión muestran la variabilidad de una distribución, indicándolo por medio
de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a
la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media
de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las
desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este
problema. Una es tomando las desviaciones en valor absoluto (desviación media) y otra es
tomando las desviaciones al cuadrado (varianza).

MEDIDAS DE DISTANCIA

La longitud es un concepto métrico definible para entidades geométricas sobre la que se ha


definido una distancia. Más concretamente dado un segmento, curva o línea fina, se puede definir
su longitud a partir de la noción de distancia. Sin embargo, no debe confundirse longitud con
distancia, ya que para una curva general (no para un segmento recto) la distancia entre dos puntos
cualesquiera de la misma es siempre inferior a la longitud de la curva comprendida entre esos dos
puntos. Igualmente la noción matemática de longitud se puede identificar con la unamagnitud
física que determinada por la distancia física.

La longitud es una de las magnitudes físicas fundamentales, en tanto que no puede ser definida en
términos de otras magnitudes que se pueden medir. En muchos sistemas de medida, la longitud es
una magnitud fundamental, de la cual derivan otras.

La longitud es una medida de una dimensión (lineal; por ejemplo la distancia en m), mientras que
el área es una medida de dos dimensiones (al cuadrado; por ejemplo m²), y el volumen es una
medida de tres dimensiones (cúbica; por ejemplo m³).

Sin embargo, según la teoría especial de la relatividad (Albert Einstein, 1905), la longitud no es
una propiedad intrínseca de ningún objeto dado que dos observadores podrían medir el mismo
objeto y obtener resultados diferentes.

52
El largo o longitud dimensional de un objeto es la medida de su eje tridimensional y. Esta es la
manera tradicional en que se nombraba a la parte más larga de un objeto (en cuanto a su base
horizontal y no su alto vertical). En coordenadas cartesianas bidimensionales, donde solo existen
los ejes xy no se denomina «largo». Los valores x indican el ancho (eje horizontal), y los y el alto
(eje vertical).

La noción de longitud se definió en primer lugar para segmentos rectos. La noción elemental
de distancia euclídea sirvió para definir la longitud de un segmento recto, como la distancia entre
sus extremos. El siguiente paso fue definir la longitud de una curva (círculo, elipse, etc), para
estas nociones existía un procedimiento físico que consistía en enrollar un cordel inextensible
alrededor de una figura curva, marcar cierto punto sobre el cordel y estirarlo de nuevo para medir
la distancia recta a lo largo del mismo.

MEDIDAS DE DESVIACION PROMEDIO

La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la


procedencia del conjunto de datos) es una medida de dispersiónpara variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de
la varianza de la variable.

Para conocer con detalle un conjunto de datos, no solo basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en
su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una
visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para
la toma de decisiones.

La desviación típica es una medida del grado de dispersión de los datos con respecto al valor
promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o
variación esperada con respecto a la media aritmética.

53
MEDIDAS DE DISPERSIÓN

En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo,
estas medidas no son suficientes para caracterizar la distribución, puesto que otro aspecto que
debe se tomar en cuenta es la variabilidad de las observaciones.

Con el propósito de medir la dispersión o variabilidad, se discutirán en este apartado las medidas
de: Amplitud (llamada también rango o recorrido), Desviación media, Varianza, Desviación
Estándar (también llamada desviación típica) y Coeficiente de Variación.

Amplitud o recorrido

La medida de dispersión más simple recibe el nombre de Amplitud o recorrido y es muy poco
usada puesto que su única ventaja es la sencillez con que se calcula. Es común que se use también
el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia
entre las observaciones que tienen el mayor y el menor valor numérico en el mismo.

Por ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide tres veces al día y
que cierto día los registros de dos pacientes muestran:

Paciente 1: 73 77 74
Paciente 2: 64 90 73
¿Cuál es la Amplitud en pulsaciones para cada paciente?
Para calcular la amplitud de los datos necesario identificar el valor más grande y el valor más
pequeño del conjunto de datos de cada uno de los pacientes.
Para el Paciente 1:
A = 77 73 = 4

Para el Paciente 2:
A = 90 64 = 26

La amplitud es una medida de dispersión cuya ventaja es la facilidad con que se calcula. Tiene
en cambio las siguientes desventajas:
54
 En su cálculo sólo intervienen dos elementos del conjunto.
 Al aumentar el número de observaciones, puede esperarse que aumente la variabilidad.
Puesto que la amplitud no tiene en cuenta el tamaño del conjunto, no es una medida
adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que
éstos sean del mismo tamaño.

Desviación media, desviación estándar y varianza

Para presentar la desviación estándar, que es por mucho la medida generalmente más útil de la
dispersión, obsérvese que la dispersión de un conjunto de datos es pequeña si los valores se
agrupan en forma cerrada en torno a su media y es grande si los valores se dispersan ampliamente
en torno a su media. Por tanto, parecería razonable medir la dispersión de un conjunto de datos en
términos de las cantidades en las cuales difieren los valores individuales de su media. Si se tiene
un conjunto de números:

Que constituyen una población con una media , las diferencias entre:

Se denominan las desviaciones de la media y esto sugiere que se podría usar el promedio de
estas desviaciones como medida de dispersión en la población. A menos que lasX sean todas
iguales, algunas de las desviaciones serán positivas y otras negativas, la suma de todas las
desviaciones de la media

Y en consecuencia también su promedio es siempre cero.

55
Como realmente se está interesado en la magnitud de las desviaciones, y no si son positivas o
negativas, se pueden ignorar simplemente los signos y definir una medida de variación en
términos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las
desviaciones de la media como si fueran todas positivas o cero y las dividiéramos entre N, se
obtendría la media estadística que se denomina desviación media y se representa por:

Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar
dificultades teóricas en problemas de inferencia y rara vez se usa.

Un método alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya
que también esto eliminará el efecto de los signos. Los cuadrados de números reales no pueden
ser negativos y pueden tomar el valor de cero.

Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raíz


cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se
obtiene la Desviación estándar de la población.

Ésta medida de variación se representa por medio de sigma minúscula ( ) y al expresar


literalmente lo que se ha hecho aquí de manera matemática, también se conoce como la raíz de
la desviación cuadrada media. A su cuadrado de se le llama Varianza de la población.

Quizá parezca lógico utilizar la misma fórmula con n y sustituidas por N y , para la
desviación estándar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir
la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviación estándar
de la muestra, que se denota con s como

56
Su cuadrado s2, se llama la Varianza de la muestra.

Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razón. Si se dividiera entre n y se

utilizara s2 como estimación de es decir, se utilizaría la varianza de una muestra para


determinar la varianza de la población de la cual provino, el resultado sería demasiado pequeño y
esto se corrige al dividir entre n-1 en lugar de hacerlo entre n. Si el valor de n es muy grande no
importa hacerlo entre n-1 sino que es práctico para definir s como se hizo.

Coeficiente de variación

Las medidas de dispersión anteriores son todas medidas de variación absolutas. Una medida de
dispersión relativa de los datos, que toma en cuenta su magnitud, está dada por el coeficiente de
variación.

El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos,


que se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se

expresa como para una muestra y para la población.

Ejemplo: En seis sábados consecutivos un operador de taxis recibió 9, 7, 11, 10, 13 y 7 llamadas
a su sitio para su servicio. Calcule:

a. Amplitud.
b. Media.
c. Desviación media.
d. Desviación estándar.
e. Varianza.
f. Coeficiente de variación.
57
a) Para calcular la amplitud.

Valor máximo 13

Valor mínimo 7

A = 13 7=6

b) Para calcular la media.

c) Para calcular la desviación media

d) Para calcular la desviación estándar

58
Se puede utilizar la siguiente tabla:

9 -0.5 0.25

7 -2.5 6.25

11 1.5 2.25

10 0.5 0.25

13 3.5 12.25

7 -2.5 6.25

0.0 27.50

Al sustituir los valores se obtiene:

e) Para calcular la varianza:

f) Para calcular el coeficiente de variación:

Cálculo de la varianza en una tabla de frecuencias

59
Para calcular la varianza de una tabla de frecuencias se utiliza la siguiente fórmula:

Dónde:

k es el número de intervalos de clase


Xi es el valor medio de cada clase
fi es el valor de la frecuencia absoluta

MEDIDADS DE FORMAS

Es la apariencia externa de la distribución de frecuencias o de una colección de datos


cuantitativos y viene dada representada por el aspecto gráfico. Dentro de la forma se incluye
simetría o asimetría de la curva y el grado de apuntamiento o achatamiento de la curva. Son
medidas relativas, es decir son cocientes o razones y no vienen expresadas en ninguna unidad de
medida.

SESGO

En estadística se llama sesgo de un estimador a la diferencia entre su esperanza matemática y


el valor numérico del parámetro que estima. Un estimador cuyo sesgo es nulo se
llama insesgado o centrado.

60
El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con
esta es la de la consistencia: un estimador puede tener un sesgo pero el tamaño de este converge a
cero conforme crece el tamaño muestral.

Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores naturales se


utilizan otros corregidos para eliminar el sesgo. Así ocurre, por ejemplo, con la varianza maestral.

CURTOSIS

También conocida como apuntamiento o sesgo, la curtosis es en teoría de la


probabilidad y estadística una medida que sirve para analizar el grado de concentración que
presentan los valores de una variable analizada alrededor de la zona central de la distribución de
frecuencias, sin necesidad de generar el gráfico.

La medida de curtosis trata de estudiar la proporción de la varianza que se explica por la


combinación de datos extremos respecto a la media en contraposición con datos poco alejados de
la misma.

MODELO MATEMÁTICO

En ciencias aplicadas, un modelo matemático es uno de los tipos de modelos científicos que
emplea algún tipo de formulismo matemático para expresar relaciones, proposiciones sustantivas
de hechos, variables, parámetros, entidades y relaciones entre variables de las operaciones, para
estudiar comportamientos de sistemas complejos ante situaciones difíciles de observar en la
realidad. El término modelización matemática es utilizado también en diseño gráfico cuando se
habla de modelos geométricos de los objetos en dos (2D) o tres dimensiones (3D).

El significado de modelo matemático en filosofía de la matemática y fundamentos de la


matemática es, sin embargo, algo diferente. En concreto en esas áreas se trabajan con "modelos
formales". Un modelo formal para una cierta teoría matemática es un conjunto sobre el que se
han definido un conjunto de relaciones unarias, binarias y trinarias, que satisface las
61
proposiciones derivadas del conjunto de axiomas de la teoría. La rama de la matemática que se
encarga de estudiar sistemáticamente las propiedades de los modelos es la teoría de modelos.

EXPERIMENTO ALEATORIO

Experimento aleatorio es aquel que bajo el mismo conjunto aparente de condiciones iniciales,
puede presentar resultados diferentes, es decir, no se puede predecir o reproducir el resultado
exacto de cada experiencia particular. (Ej.: Lanzamiento de un dado).

Este tipo de fenómeno es opuesto al suceso determinista, en el que conocer todos los factores de
un experimento permite predecir exactamente el resultado del mismo. Por ejemplo, conociendo la
altura desde la que se arroja un móvil es posible saber exactamente el tiempo que tardará en
llegar al suelo en condiciones de vacío.

Es toda aquella situación que debe llevarse a cabo para saber cuál es el resultado. Un experimento
se dice aleatorio si verifica las siguientes condiciones:

ESPACIOS MUESTRALES Y EVENTOS


Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se repita
siempre de la misma manera. 2. El conjunto de los posibles resultados de un experimento
aleatorio recibe el nombre de espacio muestral del experimento. Denotaremos el espacio muestral
con la letra S. 3. Un evento es un subconjunto del espacio muestral de un experimento aleatorio

FRECUENCIA RELATIVA Y PROBABILIDAD


La definición moderna de probabilidad basada en la axiomática de Kolmogorov
(presentada anteriormente) es relativamente reciente. Históricamente hubo otros intentos previos
de definir el escurridizo concepto de probabilidad, descartados por diferentes razones. Sin embargo
conviene destacar aquí algunas ideas que aparecen en la antigua definición basada en la frecuencia
relativa, ya que permiten intuir algunas profundas propiedades de la probabilidad.

MUTUAMENTE EXCLUYENTES

En el ámbito de la lógica y de la teoría de la probabilidad, dos proposiciones (o eventos)

62
son mutuamente excluyentes o disjuntos si ambos no pueden ser verdaderos (o suceder
simultáneamente). Un ejemplo de ello es el resultado de revolear una vez una moneda, el cual solo
puede ser "cara" o "cruz", pero no ambos.

METODOS DE ENUMERACION

De cuántas maneras distintas puedo "juntar" (hacer conjuntos de) 10 bolillas si puedo elegirlas de
colores amarillo, azul y rojo. Esta pregunta viene disfrazada de varias formas, por ejemplo: ¿de
cuántas maneras puedo distribuir 10 bolillas en 3 cajas pintadas de amarillo, azul y rojo?, o más
para uso matemático: ¿cuántos monomios (mónicos) de 3 variables y grado 10 hay? La respuesta,
el número combinatorio ( 1 2 2) = :i~ 1 = 66, es bien conocida, y a veces se la ilustra alineando una
serie de 1 O puntos y 2( =3 - 1) rayas (para la segunda pregunta, las rayas representan la división
entre las cajas, los puntos son las bolillas ). La relación entre el número de bolillas de 3 colores y
los monomios de 3 variables se puede expresar mediante las funciones generatrices. Así, la
expansión del polinomio ( x 1 + x 2 + x3 ) 10 tiene precisamente 66 términos y, por ejemplo, el
coeficiente de xix~x3 en esta expansión, 21 51 = 2520, es el número de formas distintas en que
puedo alinear (de izquierda a derecha) 2 bolillas amarillas, 3 azules y 5 rojas

DIAGRAMA DE ARBOL

Un diagrama de árbol es una herramienta que se utiliza para determinar todos los posibles
resultados de un experimento aleatorio. En el cálculo de muchas probabilidades se requiere
conocer el número de objetos que forman parte del espacio muestral, estos se pueden determinar
con la construcción de un diagrama de árbol.

El diagrama de árbol es una representación gráfica de los posibles resultados del experimento, el
cual consta de una serie de pasos, donde cada uno de estos tiene un número finito de maneras de
ser llevado a cabo. Se utiliza en los problemas de conteo y probabilidad.

Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada una de las
posibilidades, acompañada de su probabilidad. Cada una de estas ramas se conoce como rama de
primera generación.

63
En el final de cada rama de primera generación se constituye a su vez, un nudo del cual parten
nuevas ramas conocidas como ramas de segunda generación, según las posibilidades del siguiente
paso, salvo si el nudo representa un posible final del experimentó (nudo final).

Hay que tener en cuenta que la construcción de un árbol no depende de tener el mismo número de
ramas de segunda generación que salen de cada rama de primera generación y que la suma de
probabilidades de las ramas de cada nudo ha de dar 1.

Existe un principio sencillo de los diagramas de árbol que hace que éstos sean mucho más útiles
para los cálculos rápidos de probabilidad: multiplicamos las probabilidades si se trata de ramas
adyacentes (contiguas), el ejemplo de alumna de la primera facultad, o bien las sumamos si se trata
de ramas separadas que emergen de un mismo punto, el ejemplo de encontrar un alumno.

Ejemplos

Una universidad está formada por tres facultades:

 La 1ª con el 50% de estudiantes.


 La 2ª con el 25% de estudiantes.
 La 3ª con el 25% de estudiantes.

TECNICAS DE CONTEO
Qué son las técnicas de conteo? Las técnicas de conteo son aquellas que son usadas paraenumerar
eventos difíciles de cuantificar. Las más usadas son: - El diagrama de árbol -Análisis
combinatorio.

DIAGRAMA DE ÁRBOL: Los diagramas de árbol son ordenaciones empleadas para


enumerartodas las posibilidades lógicas de una secuencia de eventos, donde cada evento puede
ocurriren un número finito. Proporcionan un método sistemático de enumeración objetiva de
losresultados.

64
DECILES

Los deciles son los nueve valores que dividen la serie de datos en diez
partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de


los datos.

D 5 coincide con la mediana.

Cálculo de los deciles

Los deciles 2º y 7º.

3, 5, 2, 7, 6, 4, 9.

8 · (2/10) = 1.6 D 2 = 2

8 · (7/10) = 5.6 D 7 = 6

3, 5, 2, 7, 6, 4, 9, 1.

8 · (2/10) = 1.6 D 2 = 2

8 · (7/10) = 5.6 D 7 = 6

2.Calcular los deciles de la distribución de la tabla:

fi Fi

65
[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

CALCULO DEL PRIMER DEC IL

66
CUARTILES

En primer lugar buscamos la clase donde se encuentra, en la tabla de las


frecuencias acumuladas.

Cálculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra, en la tabla de las


frecuencias acumuladas .

Ejercicio de cuartiles

Calcular los cuartiles de la distribución de la tabla:

fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

67
[100, 110) 5 63

[110, 120) 2 65

65

CALCULO DEL PRIMER CUATIL

CALCULO DEL SEGUDO CUARTIL

PERCENTILES

Los percentiles son los 99 valores que dividen la serie de datos en 100
partes iguales.

68
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de
los datos.

P 5 0 coincide con la mediana.

CÁLCULO DE LOS PERCE NTILES

En primer lugar buscamos la clase donde se encuentra, en la tabla de las


frecuencias acumuladas. Calcular el percentil 35 y 60 de la distribución de
la tabla:

fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

69
[110, 120) 2 65

65

PERCENTIL 35

PERCENTIL 60

70
INVESTIGACION SOBRE PROBABILIDAD

La probabilidad es una medida de la certidumbre asociada a un suceso o evento futuro y suele


expresarse como un número entre 0 y 1 (o entre 0 % y 100 %).

Una forma tradicional de estimar algunas probabilidades sería obtener la frecuencia de un


acontecimiento determinado mediante la realización de experimentos aleatorios, de los que se
conocen todos los resultados posibles, bajo condiciones suficientemente estables. Un suceso
puede ser improbable (con probabilidad cercana a cero), probable (probabilidad intermedia) o
seguro (con probabilidad uno).

La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física,


la matemática, las ciencias, la administración, contaduría, economía y lafilosofía para sacar
conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente
discreta de sistemas complejos, por lo tanto es la rama de las matemáticas que estudia, mide o
determina los experimentos o fenómenos aleatorios.

La definición de probabilidad se produjo debido al deseo del ser humano por conocer con certeza
los eventos que sucederán en el futuro, por eso a través de lahistoria se han desarrollado
diferentes enfoques para tener un concepto de la probabilidad y determinar sus valores.

NOCIONES BÁSICAS DE PROBABILIDAD


Dos enfoques objetivos para responder a cómo se obtiene la probabilidad de un suceso que
presuponen que la probabilidad de un suceso es un dato objetivo que la persona conoce o no:
Probabilidad de un suceso aleatorio (S): cociente entre el número de resultados favorables del
suceso aleatorio y el número total de resultados posibles • Probabilidad de un suceso: frecuencia
relativa del mismo después de haberlo repetido un número razonablemente grande de veces
Procedimientos que sirven para juegos de azar pero no tanto en la vida diaria; por eso se utilizan
las probabilidades subjetivas: derivadas de la información a disposición o las creencias u
opiniones del individuo. Según la teoría de la probabilidad, la probabilidad debe seguir los
siguientes axiomas: • la probabilidad de un suceso es igual o mayor que 0. No existen
probabilidades negativas. • la probabilidad de un suceso seguro es 1

71
ESPACIOS MUESTREALES FINITO

En la teoría de probabilidades, el espacio muestral o espacio de muestreo (denotado E, S, Ω


o U) consiste en el conjunto de todos los posibles resultados de un experimento aleatorio, junto
con una estructura sobre el mismo (ver más adelante).

Para algunos tipos de experimento puede haber dos o más espacios de muestreo posibles. Por
ejemplo, cuando se toma una carta de un mazo normal de 52 cartas, una posibilidad del espacio
de muestreo podría ser el número (del as al rey), mientras que otra posibilidad sería el palo
(diamantes, tréboles, corazones y picas). Una descripción completa de los resultados, sin
embargo, especificaría ambos valores, número y palo, y se podría construir un espacio de
muestreo que describiese cada carta individual como el producto cartesiano de los dos espacios
de muestreo descritos.

Los espacios de muestreo aparecen de forma natural en una aproximación elemental a


la probabilidad, pero son también importantes en espacios de probabilidad. Un espacio de
probabilidad (Ω, F, P) incorpora un espacio de muestreo de resultados, Ω, pero define un
conjunto de sucesos de interés, la σ-álgebra F, por la cual se define la medida de probabilidad P.

LEYES DE PROBABILIDAD

Adición
• Ley general de la adición
• Ley especial de la adición

Multiplicación
• Probabilidad no condicional
• Probabilidad condicional
• Probabilidad conjunta
• Ley general de multiplicación

72
• Eventos dependientes contra

Eventos independientes
• Ley especial de multiplicación

Reglas de Adición
Regla Especial de adición.
Para aplicar esta regla, los eventos deben de ser mutuamente excluyentes.
• Significa que cuando ocurre un evento, ninguno de los otros eventos puede suceder almismo tiempo.

Si dos eventos A y B son mutuamente excluyentes, la regla especial de la adición indicaque la probabilidad de que
ocurra uno u otro de los eventos, es igual a la suma de susprobabilidades.
• P(A o B)=P(A)+P(B)

Para 3 eventos mutuamente excluyentes la regla se expresa como


• P(A o B o C)=P(A)+P(B)+P(C)
Regla General de Adición

Los resultados de un experimento que no ser mutuamente excluyentes.


Cuando dos eventos ocurren simultáneamente, a la probabilidad respectiva se ledenomina probabilidad conjunta.
Es la medida de probabilidad que evalúa la posibilidad de que dos o más eventosocurran en forma simultánea.

La teoría de la probabilidad es una rama de las matemáticas que estudia los fenómenos
aleatorios y estocásticos. Los fenómenos aleatorios se contraponen a los fenómenos
deterministas, los cuales son resultados únicos y/o previsibles de experimentos realizados bajo las
mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 ºC a nivel del mar se
obtendrá vapor. Los fenómenos aleatorios, por el contrario, son aquellos que se obtienen de
experimentos realizados, otra vez, bajo las mismas condiciones determinadas pero como

73
resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento de un dado o de
una moneda.

La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que
pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si
un suceso es más probable que otro.

PROBABILIDAD CONDICIONAL

Probabilidad condicional es la probabilidad de que ocurra un evento A, sabiendo que también


sucede otro evento B. La probabilidad condicional se escribeP(A|B), y se lee «la probabilidad
de A dado B».

No tiene por qué haber una relación causal o temporal entre A y B. A puede preceder en el
tiempo a B, sucederlo o pueden ocurrir simultáneamente. A puede causar B, viceversa o pueden
no tener relación causal. Las relaciones causales o temporales son nociones que no pertenecen al
ámbito de la probabilidad. Pueden desempeñar un papel o no dependiendo de la interpretación
que se le dé a los eventos.

Un ejemplo clásico es el lanzamiento de una moneda para luego lanzar un dado. ¿Cuál es la
probabilidad que en el dado salga un 6 dado que ya haya salido una cara en la moneda? Esta
probabilidad se denota de esta manera: P(6|C).

El condicionamiento de probabilidades puede lograrse aplicando el teorema de Bayes

INDEPENDENCIA Y REGLA DE LA MULTIPLICACION

Regla de multiplicación de probabilidades 1 Regla de multiplicación de probabilidades Si se


tienen varios eventos sucesivos e independientes entre sí, la probabilidad de que ocurran todos
ellos a la vez corresponde a la multiplicación de las probabilidades de cada uno de los eventos.
Ejemplos: 1. Si se responden al azar cuatro preguntas con cinco opciones cada una, ¿cuál es la
probabilidad de acertar a todas? La probabilidad de acierto en cada una de las preguntas es 1/5.
Por lo tanto, la probabilidad de acertar en las cuatro es: 2. Suponiendo que la probabilidad de

74
tener un hijo o una hija es ½, ¿cuál es la probabilidad de que al tener tres hijos, 2 solamente sean
varones? Si H representa el nacimiento de un hombre y M el de una mujer, tenemos los
siguientes casos favorables: HHM – HMH – MHH La probabilidad de cada uno de estos eventos
es: Por lo tanto, la probabilidad pedida es

TEOREMA DE BAYES

El teorema de Bayes, en la teoría de la probabilidad, es una proposición planteada por el filósofo


inglés Thomas Bayes(1702-1761)1 en 1763,2 que expresa la probabilidad condicional de
un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del
evento B dado A y la distribución de probabilidad marginal de sólo A.

En términos más generales y menos matemáticos, el teorema de Bayes es de enorme relevancia


puesto que vincula la probabilidad de A dado B con la probabilidad de B dado A. Es decir, por
ejemplo, que sabiendo la probabilidad de tener un dolor de cabeza dado que se tiene gripe, se
podría saber (si se tiene algún dato más), la probabilidad de tener gripe si se tiene un dolor de
cabeza. Muestra este sencillo ejemplo la alta relevancia del teorema en cuestión para la ciencia en
todas sus ramas, puesto que tiene vinculación íntima con la comprensión de la probabilidad de
aspectos causales dados los efectos observados.

El teorema de Bayes es válido en todas las aplicaciones de la teoría de la probabilidad. Sin


embargo, hay una controversia sobre el tipo de probabilidades que emplea. En esencia, los
seguidores de la estadística tradicional sólo admiten probabilidades basadas en experimentos
repetibles y que tengan una confirmación empírica mientras que los llamados estadísticos
bayesianos permiten probabilidades subjetivas. El teorema puede servir entonces para indicar
cómo debemos modificar nuestras probabilidades subjetivas cuando recibimos información
adicional de un experimento. La estadística bayesiana está demostrando su utilidad en ciertas
estimaciones basadas en el conocimiento subjetivo a priori y el hecho de permitir revisar esas
estimaciones en función de la evidencia empírica es lo que está abriendo nuevas formas de hacer
conocimiento. Una aplicación de esto son los clasificadores bayesianos que son frecuentemente
usados en implementaciones de filtros de correo basura o spam, que se adaptan con el uso. Otra
75
aplicación se encuentra en la fusión de datos, combinando información expresada en términos de
densidad de probabilidad proveniente de distintos sensores.

Como observación, se tiene y su demostración resulta trivial.

Como aplicaciones puntuales:

1. El diagnóstico de cáncer.
2. Evaluación de probabilidades durante el desarrollo de un juego de bridge por Dan F.
Waugh y Frederick V. Waugh.
3. Probabilidades a priori y a posteriori.
4. Un uso controvertido en la Ley de sucesión de Laplace.4
5. En el testeo de hipótesis en Ciencia Política cuando se usa metodología process tracing.

DISTRIBUCION DE PROBABILIDAD

En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable


aleatoria es una función que asigna a cada suceso definido sobre la variable aleatoria
la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el
conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable
aleatoria. También se dice que tiene una relación estrecha con las distribuciones de frecuencia.
De hecho, se puede entender que una distribución de probabilidades sería una frecuencia teórica,
ya que ésta última es aquella que describe cómo se espera que varíen los resultados.

La distribución de probabilidad está completamente especificada por la función de distribución,


cuyo valor en cada x real es la probabilidad de que la variable aleatoria sea menor o igual que x.

ESPERANZA Y VARIANZA

En teoría de probabilidad, la varianza o variancia (que suele representarse como ) de


una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la

76
desviación de dicha variable respecto a su media. O en pocas palabras, es la media de los residuos
al cuadrado.

Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por ejemplo,


si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La
varianza tiene como valor mínimo 0. La desviación estándar (raíz cuadrada de la varianza) es una
medida de dispersión alternativa, expresada en las mismas unidades que los datos de la variable
objeto de estudio.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se
aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales
casos se recomienda el uso de otras medidas de dispersión más robustas.

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES


Es un modelo teórico que describe la forma en que varían los resultados de un experimento
aleatorio, es decir, nos da todas las probabilidades de todos los posibles resultados que podrían
obtenerse cuando se realiza un experimento aleatorio. Se clasifican como discretas o continuas.
En la distribución de probabilidad discreta está permitido tomar sólo un número limitado de
valores. En la continua, llamada función de Variable aleatoria y función de distribución 27
densidades, la variable que se está considerando puede tomar cualquier valor dentro de un
intervalo dado. 4.1.- Distribución de probabilidad discreta Sea un espacio probabilístico y sea X
una variable aleatoria discreta que toma como posibles valores x1,x2,.....xn, se define la
distribución de probabilidad de X como el conjunto de pares (xi, pi) que a cada valor de la
variable le asocia una probabilidad, donde pi= P(X=xi), tal que la suma de todas las
probabilidades es igual a la unidad.

DISTRIBUCION BINOMIAL
En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta
el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una
probabilidad fija pide ocurrencia del éxito entre los ensayos. Un experimento de Bernoulli se
77
caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se
denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una
probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de
forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos.
Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.

Existen muchas situaciones en las que se presenta una experiencia binomial. Cada uno de los
experimentos es independiente de los restantes (la probabilidad del resultado de un experimento
no depende del resultado del resto). El resultado de cada experimento ha de admitir sólo dos
categorías (a las que se denomina éxito y fracaso). Las probabilidades de ambas posibilidades han
de ser constantes en todos los experimentos (se denotan como p y q o p y 1-p).

Se designa por X a la variable que mide el número de éxitos que se han producido en
los n experimentos.

Cuando se dan estas circunstancias, se dice que la variable X sigue una distribución de
probabilidad binomial, y se denota B(n,p).

DISTRIBUCION GEOMETRICA

Teoría de probabilidad y estadística, la distribución geométrica es cualquiera de las


dos distribuciones de probabilidad discretas siguientes:

 la distribución de probabilidad del número X del ensayo de Bernoulli necesaria para obtener
un éxito, contenido en el conjunto { 1, 2, 3,...} o
 la distribución de probabilidad del número Y = X − 1 de fallos antes del primer éxito,
contenido en el conjunto { 0, 1, 2, 3,... }.

 La distribución geométrica no tiene memoria, es decir,


 Si la probabilidad de éxito en cada ensayo es p, entonces la de

78
DISTRIBUCION DE POISSON

En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de


probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad
de que ocurra un determinado número de eventos durante cierto período de tiempo.
Concretamente, se especializa en la probabilidad de ocurrencia de sucesos con probabilidades
muy pequeñas, o sucesos "raros".

79
CONCLUSION

Los conceptos antes mencionados han sido investigados de tal manera de hacer más fácil su
comprensión y entendimientos ya que la estadística es la ciencia que trata de entender, organizar
y tomar decisiones que estén de acuerdo con los análisis efectuados. La estadística juega un papel
muy importante en nuestras vidas, ya que actualmente ésta se ha convertido en un método muy
efectivo para describir con mucha precisión los valoresde datos económicos, políticos, sociales,
psicológicos, biológicos y físicos, además, sirve como herramienta para relacionar y analizar
dichos datos. No consiste sólo en reunir y tabular los datos, sino sobre todo en el proceso de
interpretación de esa información, ahora tiene un papel mucho más importante.

Es de vital importancia para nuestra vida profesional venidera, que manejemos estos conceptos
con facilidad, así mismo el que los usemos de la manera apropiada, siempre en pro de
buscar soluciones a los problemas que se nos puedan presentar.

80
RECOMENDACIÓN

Es recomendable tomar en cuenta que la estadística es muy importante en la vida social


y laboral del hombre ya que generaliza información.

Gracias a ello el análisis de cualquier dato puede ser más razonable y exacto.

Es una herramienta indispensable para la toma de decisiones.

También es ampliamente empleada para mostrar los aspectos cuantitativos de una situación

81
BIBLIOGRAFIA
https://es.wikipedia.org/wiki/Estadística
https://es.wikipedia.org/wiki/Variable_estadística
https://es.wikipedia.org/wiki/Gráfica

https://www.vitutor.com/estadistica/descriptiva/a_3.html
https://es.wikipedia.org/wiki/Medidas_de_tendencia_central

https://prezi.com/jf9_elcavav8/media-mediana-moda-varianza-desviacion-estandar/
www.universoformulas.com/estadistica/descriptiva/tabla-frecuencias

https://es.wikipedia.org/wiki/Medidas_de_dispersión
https://es.khanacademy.org/math/.../a/calculating-standard-deviation-step-by-step

82
ANEXOS

83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98