Академический Документы
Профессиональный Документы
Культура Документы
Ciencias Sociales I
Aspectos generales
Video de bienvenida
https://www.youtube.com/watch?v=y_rEdgJlGpc
Datos de identificación
Objetivos
Objetivo general
Al término de la materia el alumno será capaz de:
• Entender los conceptos matemáticos y estadísticos elementales para la descripción de grupos y procesos sociales.
Objetivos específicos
• Distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de grupos y categorías sociales.
• Entender el concepto de variable, correlación y causación desde la perspectiva matemática, aplicados a problemas sociales
relevantes (pobreza, clase, identidad, producción, opinión).
• Seleccionar y valorar resultados y datos sociodemográficos.
• Representar datos sociodemográficos.
• Comprender la lógica de la estadística y los modelos elementales.
• Dominar la estadística descriptiva y realizar operaciones estadísticas básicas con la finalidad de hacer inferencias generales
sobre poblaciones delimitadas.
2
Temariorio
Tema 1. LENGUAJE MATEMÁTICO Y TEORÍA DE CONJUNTOS
Tema 2. ESTADÍSTICA
3
Bibliografía
Básica
Tema 1.
Elorza, H. (2008). Estadísticas para las ciencias sociales, del comportamiento y de la salud (3.ª ed.). México: Cengage Learning
Editores.
Rioboo, J. y Del Oro, C. (2000). Representaciones gráficas de datos estadísticos. Madrid: AC.
Tema 2.
Bibliografía complementaria
Bibliografía complementaria
Ai-Camp, R. (1996). Encuestas y democracia: opinión pública y apertura política en México. México: Siglo XXI, 1996.
Jauset, J. (2000). La investigación de audiencias en televisión: Fundamentos estadísticos. Buenos Aires: Paidós.
Malhotra, N. (1996). Investigación de mercados: un enfoque práctico. México: Prentice Hall Hispanoamericana.
Sitios de interés
Sitios de interés
Es un sitio académico reconocido internacionalmente por el éxito de su método para aprender matemáticas. Disponible en
https://es.khanacademy.org/
ibliografía complementaria
4
Lenguaje matemático y teoría de
conjuntos
Introducción
En este tema estudiaremos los conceptos fundamentales del lenguaje matemático y la teoría de conjuntos, para que al
finalizar el tema seas capaz de distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de
grupos y categorías sociales.
La teoría de conjuntos es un marco para el análisis de hechos sociales. Diversos autores consideran el manejo de esta
teoría como un instrumento fundamental para el científico social. Elorza (2008), por ejemplo, comenta que la teoría
de conjuntos “es un instrumento adecuado para la sistematización de la información relevante que permite enfocar un
problema en su totalidad, deslindando en él lo que es fundamental” (p. 83).
Por su parte, Kleiman (2009) señala que la teoría de conjuntos es una “estructura lógica que unifica los conceptos más
fundamentales mediante un lenguaje intuitivo y simple” (p. 5). Él mismo destaca que buena parte del conocimiento
matemático moderno ocupa en menor o mayor medida la teoría de conjuntos.
El estudio de la teoría de conjuntos es importante porque te permitirá enfocar el análisis de problemas sociales desde una
perspectiva lógico-matemática, sin que ello signifique pasar por alto la complejidad y multidimensionalidad de los hechos
sociales. Por el contrario, el análisis a través de lenguaje matemático debe mejorar la comprensión y sistematización de
un problema, y fomentar la creatividad para generar hipótesis de trabajo.
Para el estudio de este tema hemos desarrollado el contenido puntual, en un lenguaje sencillo y abundando en
explicaciones, con la intención de que el lenguaje matemático por sí sólo no sea un impedimento para tu comprensión y
uso de los conceptos elementales de la teoría de conjuntos.
Además, en el desarrollo de contenido encontrarás varios ejemplos que se refieren a una realidad concreta: el estudio de
los grupos y hechos sociales que tenemos a la mano. Lo hicimos así para que puedas utilizar los conceptos matemáticos
en las situaciones de análisis que corresponden a las ciencias sociales. De esta manera, te proporcionamos un
complemento a los textos clásicos sobre la teoría de conjuntos, en los cuales predominan los ejemplos abstractos y en
lenguaje matemático.
Los conceptos abordados en esta unidad te permitirán identificar elementos, conjuntos (grupos) y relaciones, en la
descripción de problemas sociales. Podrás enunciar las características que determinan la pertenencia de un elemento a
un conjunto. Ésta es una tarea de clasificación que pone en práctica el estudio de categorías sociales.
Además, podrás identificar las operaciones que pueden darse entre conjuntos, por ejemplo, la inclusión, la unión,
intersección, complementación y diferencia; si pensamos que dichos conjuntos representan unidades de estudio, es
posible anticipar la utilidad que tiene identificar la factibilidad de las operaciones mencionadas. El estudio de las relaciones
y funciones entre conjuntos fomenta la habilidad para detectar posibles relaciones entre variables de estudio.
5
Objetivos particulares
• Distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de grupos y categorías sociales.
• Entender el concepto de variable, correlación y causación desde la perspectiva matemática, aplicados a problemas sociales
relevantes (pobreza, clase, identidad, producción, opinión).
Temario
6
Exposición de los temas
Estos elementos pueden ser objetos, personas, instituciones, animales, conceptos, ideas, periodos temporales, características,
hechos, etcétera.
1. La pertenencia de un elemento a un conjunto debe estar definida sin ambigüedad. Es decir, se sabe si un elemento pertenece
a un conjunto o no. Por ejemplo, si pensamos en el conjunto de científicas reconocidas con un Nobel, es indispensable determinar
si Marie Curie está entre ellas o no.
Conjunto de científicas con Nobel = {Marie Curie, Gerty Cori, Maria Goeppert, Doroty Crowfoot, Irène Joliot, Rosalyn Sussman}
2. Los elementos no se repiten en un mismo conjunto. Si pensamos en el conjunto de número de mascotas por persona, aunque
varias personas tienen la misma cantidad de mascotas, sólo mencionaremos cada cantidad una vez.
7
3. Los elementos pueden aparecer en cualquier orden y sigue siendo el mismo conjunto. Ejemplo:
Notación
Quizá notaste que cada vez que menciono un conjunto escribo los elementos entre llaves y separados por comas, se debe a que
es la notación matemática de un conjunto. Entonces, la notación son los símbolos que se usan para definir conjuntos de manera
escrita. Los conjuntos generalmente se representan con letras mayúsculas, por ejemplo:
Se lee “los elementos del conjunto C son soltero, casado, divorciado y viudo”.
Se lee “los elementos del conjunto E son alcoholismo, ansiedad, depresión y fobia”.
En los ejemplos anteriores hemos escrito todos los elementos de un conjunto dentro de las llaves, a eso se le llama notación por
extensión. Pero cuando los elementos de un conjunto son decenas o miles es impráctico mencionarlos todos, por lo que en esos
casos usamos la notación por comprensión:
Y = {Municipios de México}
Z = {Derechohabientes del IMSS}
La notación por comprensión también utiliza otros símbolos matemáticos, como la barra “|”, se lee “tal que”, y literales para
representar a los elementos. Se suele utilizar a la letra “x” para representar a los elementos, pero bien podría ser cualquier otra
letra. Veamos un ejemplo:
A = {x | x es un río nacional}
Se lee así: “El conjunto A está formado por los elementos x tal que x es un río nacional”
Luego la notación puede expresarse con rangos si nos referimos a medidas. Por ejemplo:
T = {x | 140 x 90}
Se lee “el conjunto T está formado por los elementos x tal que x es menor que 140 y mayor o igual que 90”.
El conjunto anterior puede referirse a la talla (estatura) de los estudiantes de una primaria expresada en centímetros.
Para denotar que un elemento es parte de un conjunto se usa el símbolo , que se lee “pertenece a”. Por el contrario, si un
elemento no pertenece a un conjunto se cruza el símbolo y se lee “no pertenece a”. Por ejemplo:
8
Entonces:
Reforma D
Se lee “Reforma pertenece al conjunto P”.
El País D
Se lee “El País no pertenece al conjunto P”.
Así:
180 F
Se lee “180 pertenece al conjunto F”.
90 F
Se lee “90 no pertenece al conjunto F”.
El conjunto F podría representar los pesos de mujeres de estatura media que padecen obesidad.
Cardinalidad
Para el conjunto de siglos de la era cristiana tenemos una cardinalidad de 21, porque actualmente vivimos en el siglo XXI.
Revísalo a continuación.
H = {I, II, III, IV, V, VI, VII, VIII, IX, X, XI, XII, XII, XIV, XV, XVI, XVII, XVIII, XIX, XX, XXI}
n(H) = 21
Los conjuntos cuya cardinalidad podemos calcular se llaman conjuntos finitos. Pero también hay conjuntos infinitos, que su
cardinalidad es imposible determinar, por ejemplo, el conjunto de números reales que se extiende y extiende y extiende.
Conjunto universal
El conjunto universal o universo es aquel que contiene todos los elementos en un caso de estudio en particular. Por ejemplo, si
estuviéramos estudiando las características de los pintores, escultores y actores, nuestro conjunto universal puede ser llamado
“Artistas” y los contiene a todos.
Otro ejemplo, si hablamos de “el sector turismo”, “el sector agropecuario”, “el sector industrial” y “otros sectores”, entonces
podemos definir nuestro conjunto universal como “los sectores productivos del país”.
Si estudiamos primarias, secundarias y preparatorias, el universo puede ser las instituciones educativas.
9
El conjunto universal se denota con el símbolo o con el símbolo U.
El complemento de un conjunto se trata del conjunto integrado por todos los elementos que están en el conjunto universal pero
no están en un conjunto determinado. Entonces para el conjunto F, su complemento se integra por todos los elementos que
pertenecen al universo y no pertenecen a F. Un complemento se denota con apóstrofo ‘, o con un superíndice
10
1.1.3. INTERSECCIÓN DE CONJUNTOS
La intersección es el conjunto formado por todos los elementos que pertenecen simultáneamente a dos o más conjuntos.
Se representa con el símbolo . En el siguiente diagrama Venn-Euler se presenta sombreada el área que representa la
intersección de tres conjuntos, se expresa de la siguiente forma:
A B C = {Jalisco}
Observa en el diagrama anterior cómo la intersección es una operación que nos permite detectar los elementos que están
presentes es varios conjuntos a la vez, por ejemplo, el Estado “Jalisco” es productor de maíz, de caña de azúcar y de sorgo.
La unión de conjuntos se forma por todos los elementos que pertenezcan a dos o más conjuntos. Se representa con el
símbolo . En el siguiente diagrama Venn-Euler está sombreada el área que representa la unión de los conjuntos A, B y C:
11
Se expresa de la siguiente forma:
Se lee “A unión B unión C incluye a Sinaloa, Jalisco, Veracruz, Michoacán”. Nota que aunque un elemento pertenezca a dos o más
conjuntos, en la unión de los conjuntos se menciona una sola vez.
La inclusión se da cuando un conjunto contiene a otro. Esto también se expresa como que un conjunto es subconjunto de otro. Para
anotar una relación de inclusión se utiliza el símbolo .
Si por el contrario se quiere anotar que un conjunto no está incluido en otro, se usa el símbolo
Por ejemplo:
Podemos definir lo anterior porque los trabajadores que perciben el salario mínimo necesariamente son trabajadores asalariados,
aunque en el conjunto “V” también pueden existir otros trabajadores que perciben más de un salario mínimo.
Otro ejemplo:
12
Al reflexionar sobre los conjuntos anteriores notamos que no necesariamente todos los trabajadores asalariados también están
sindicalizados, por ello podemos establecer que V Y , es decir, V no está incluido en Y o, bien, V no es subconjunto de Y.
● Si los conjuntos A y B son iguales, entonces podemos decir que A es subconjunto de B y también que B es subconjunto de A.
● Todo conjunto es subconjunto de sí mismo, a esta relación se le denomina inclusión impropia y se simboliza con ,A A
● Existe un conjunto vacío simbolizado con que está incluido en cualquier otro conjunto.
A=B
A B
13
Veamos un ejemplo:
Se lee “R contiene los elementos x tal que x representa a las ramas del derecho público”.
En el conjunto R se menciona, por comprensión, las ramas del derecho público que son el derecho administrativo, constitucional,
penal, procesal, laboral y tributario; justamente los elementos del conjunto D. Por ello estos conjuntos son iguales, entonces se puede
anotar que:
R=D
Otro ejemplo:
I = {x| x= Médicos}
N = {x| x= Pediatras}
Aunque todos los pediatras son médicos, no todos los médicos son pediatras. Por ello este par de conjuntos no son iguales, y se
anota de la siguiente forma:
N I
El conjunto universal o universo está constituido por todos los elementos de estudio en una situación particular. Esto quiere decir que
cada investigador define el conjunto universal de estudio para un problema determinado. Incluso, para un mismo problema se pueden
plantear varias posibilidades de conjunto universal.
Aunque para la definición del conjunto universal el investigador tiene amplia libertad, sí tendrá que establecer un conjunto preciso, y
que se mantendrá fijo mientras realiza un análisis basado en teoría de conjuntos.
1.2.1. Notación
El conjunto universal se denota con el símbolo o con el símbolo U; en los diagramas Venn-Euler se representa como un rectángulo
que contiene todos los elementos. Observa que en la siguiente imagen se ha sombreado todo el conjunto universal.
14
1.2.2. Operaciones (pertenencia, unión, intersección)
Una vez que se define un conjunto universal se asumen las siguientes propiedades:
● Unión: La unión de un conjunto con el conjunto universal da por resultado el conjunto universal. Por ello se dice que el conjunto
universal es un elemento absorbente de la unión.
● Intersección: La intersección de un conjunto con el conjunto universal da por resultado el conjunto inicial. Por ello se dice que el
conjunto universal el un elemento neutro en la intersección.
1.2.3. Relaciones
Una relación vincula los elementos de un conjunto con los elementos de otro conjunto. Veámoslo gráficamente:
Se expresa como un conjunto de parejas ordenadas, donde el primer elemento pertenece al primer conjunto y el segundo elemento
al segundo conjunto. De la siguiente forma:
15
Otros ejemplos de relaciones pueden ser:
16
De un elemento del primer conjunto a más de un
elemento del segundo conjunto.
Dominio y rango
El dominio es el conjunto formado por los primeros elementos de los pares ordenados, y se escribe así:
El rango es el conjunto formado por los segundos elementos en los pares ordenado y se escribe así:
Veámoslo gráficamente:
En ciencias sociales estudiamos las relaciones entre conjuntos para proponer vínculos que nos ayuden a explicar y predecir
características de nuestros objetos de estudio.
17
1.2.4. FUNCIONES
Una función es una relación con las siguientes tres características:
2. Un elemento del dominio no puede tener más que un sólo elemento asociado en el rango.
18
Imagina que una función es una especie de “caja” que recibe un valor
La letra se representa a cualquiera de los elementos del dominio de la función, es decir, su valor irá cambiando, por ello se dice
que es una variable.
También el valor de tomará valores distintos, de entre los valores posibles para el rango, por ello también es una variable.
Además, sabemos que el valor de depende del valor que se le asigne a, por eso decimos que es una variable dependiente. En
cambio el valor de no depende de otra variable, por eso decimos que es una variable independiente.
Hasta ahora hemos representado las funciones con diagramas o con parejas ordenadas de elementos, pero ¿qué pasaría si
tuviéramos una relación cuyo dominio está integrado por una cantidad infinita de elementos? ¡Exacto! Hacer un diagrama o anotar
todas las parejas posibles es impráctico. Por ello, los dominios de las funciones suelen representarse con ecuaciones, además se
indica qué tipo de elementos pueden pertenecer. Por ejemplo:
19
Lo anterior se lee “ igual a cuadrada. Siempre que pertenece a los números naturales, es mayor o igual a 2 y es menor
o igual que 6”.
Otro ejemplo:
Que se lee “ es igual a 2 , pertenece a los números reales. En este caso no se aclara con cuál número inicia o finaliza x,
lo que significa que sus valores van de menos infinito a infinito, se escribiría así:
Las funciones pueden representarse mediante gráficas. Para elaborar la gráfica de una función, determina cuáles son los puntos que
debes situar en un eje cartesiano, es decir, las coordenadas y . Dichas coordenadas se acomodan en una tabla de doble
entrada o tabulación. Veamos un ejemplo:
En la tabulación anterior los valores de se obtuvieron del dominio de la función: , se lee “ pertenece a
los números naturales, es mayor o igual a 2, es menor o igual a 6”. Entendiendo el dominio sabemos que los únicos valores
posibles para x son: 2, 3, 4, 5 y 6.
20
Una vez terminada la tabulación podemos elaborar la gráfica acomodando los puntos , . Se muestra a continuación:
Finalmente, podemos especificar los conjuntos que forman el dominio y el rango de la función:
a) Dominio {2, 3, 4, 5, 6}
En las funciones inyectivas para valores diferentes en el dominio hay valores diferentes en el rango. Observa esta característica en
la siguiente imagen:
En las suprayectivas cada elemento del rango debe tener asociado un elemento en el dominio.
21
Finalmente, las funciones biyectivas son tanto inyectivas como suprayectivas:
Suma
22
Se lee “f de x más g de x igual a f más g, de x”.
Un propiedad importante de la suma de funciones es que el dominio de una suma de funciones es igual a la intersección de los
dominios de cada función. Se expresa de la siguiente forma:
Se lee “dominio de f más g, igual a la intersección del dominio de f con el dominio de g”.
Veamos un ejemplo:
Resta
23
Se lee “f de x menos g de x igual a f menos g, de x”.
También el dominio de una suma de funciones es igual a la intersección de los dominios de cada función. Se expresa de la siguiente
forma:
Se lee “dominio de f menos g, igual a la intersección del dominio de f con el dominio de g”.
Veamos un ejemplo:
Producto o multiplicación
Dadas dos funciones f y g, la resta de estas funciones se expresa así: Se lee “f de x por g de x igual a f por g, de x”.
24
Se lee “f de x por g de x igual a f por g, de x”.
También el dominio de un producto de funciones es igual a la intersección de los dominios de cada función. Se expresa de la siguiente
forma:>
Se lee “dominio de f por g, igual a la intersección del dominio de f con el dominio de g”.
Veamos un ejemplo:
Cociente o división
25
Se lee “f de x entre g de x igual a f entre g, de x”.
También el dominio de un cociente de funciones es igual a la intersección de los dominios de cada función, excluyendo los valores
de x para los cuales g(x) = 0. Se expresa de la siguiente forma:
Se lee “dominio de f por g, igual a la intersección del dominio de f con el dominio de g, siempre que g de x sea diferente de 0”.
Veamos un ejemplo:
Composición
Consiste en evaluar una función en otra. Dadas dos funciones f y g, la composición de éstas se expresa así: Se lee “f de x compuesta
g de x igual a f compuesta g, de x”.
26
Siempre que el dominio de x pertenezca al dominio de g(x), y el dominio de g(x) pertenezca al dominio de f(x). Se expresa de la
siguiente forma:
Se lee “dominio de f compuesta g de x, igual a x, tal que x pertenece al dominio de g ,y g de x pertenece al dominio de f de x”.
Veamos un ejemplo:
Si aún tienes dudas sobre las operaciones con funciones revisa el siguiente video:
27
Estadística
Introducción
En la actualidad, la estadística se ha convertido en un método efectivo para describir con precisión los valores de datos políticos,
sociales, económicos, psicológicos, etc., pues es una herramienta para relacionar y analizar dichos datos.
• La estadística descriptiva o deductiva requiere del uso de modelos numéricos y gráficos para resumir y presentar datos, es
la que incluye las técnicas que se relacionan con el resumen y la descripción de datos numéricos.
• Estadística inferencial o inductiva: Consiste en inferir propiedades de una población sobre la base de una muestra con
resultados conocidos, se basada directamente en la teoría de la probabilidad. Es una disciplina puramente deductiva que
proporciona una base racional para el razonamiento inductivo.
Objetivos particulares
Temario
28
2.2 Frecuencias.
2.2.1 Distribución de frecuencias.
2.2.2 Distribuciones – Tablas y Gráficas (relaciones x, y).
2.2.2.1 Presentación de tablas, intervalos.
2.2.2.1 Presentación de tablas, intervalos.
2.2.3 Tendencia Central Total.
2.2.4 Promedio, Media, Moda.
2.2.4.1 Teorema de tendencia central y Skweness y Kurtosis.
2.3 Variabilidad.
2.3.1 Rango y rango intercuartil.
2.3.2 Desviación estándar.
2.4 Diseño de hipótesis en las Ciencias Sociales.
2.4.1 Causalidad y correlación Pearson.
2.4.2 Hipótesis nula.
2.4.3 Pruebas de hipótesis.
2.4.3.1 Error estándar.
2.4.3.2 Estimación.
2.4.3.3 Índice de confianza.
2.5 Modelos probabilísticos.
2.5.1 Normal.
2.5.2 Binomial.
2.5.3 Poisson.
La estadística es una rama de las matemáticas que, mediante las técnicas que proporciona, permite recolectar, organizar, presentar,
analizar e interpretar datos, ya sea de una muestra o inferir sobre una población, lo cual permite tomar decisiones acertadas.
Ciencia
Es una disciplina que utiliza el método científico con la finalidad de hallar estructuras generales.
Observación o dato
La inferencia estadística es un proceso que señala los aspectos contenidos en una población, utilizando únicamente la información
de una muestra. El uso de la inferencia estadística tiene grandes ventajas, ya que se ahorra tiempo y dinero al recolectar información
de una manera más sencilla.
29
Las estadísticas vitales son “el resultado del recuento de los hechos ocurridos en la vida de la población, como son: nacimientos,
matrimonios, divorcios, defunciones y muertes fetales. Las estadísticas vitales son elementos básicos para el análisis demográfico
de la situación de un país, así como uno de los requisitos para poder llevar a cabo la planificación del desarrollo económico y social.
Ya que proporcionan información sobre la tendencia del crecimiento natural de la población basándose en las tasas de natalidad
y mortalidad; sobre la conducta de sus componentes, su distribución geográfica y mediante su agregación a lo largo del tiempo,
sobre el tamaño de la población y su estructura. Por otro lado, permite identificar a los grupos demandantes de servicios médicos,
educación, vivienda, etc.” (INEGI, 2003, p. 1).
La estadística es una rama de las matemáticas que estudia la recolección, organización y análisis de los datos, los resume y
simplifica para su análisis y estudio.
La estadística cuenta con una serie de técnicas que tienen aplicación en las más diversas disciplinas, el uso de ellas depende del
conocimiento de las personas que las apliquen. Asimismo, provee los elementos básicos para fundamentar una investigación.
Limitantes: Al utilizar la estadística es importante cuidar cómo se obtiene, cuantifica y presentan los datos para no dar un mal uso de
ellos, porque esto puede hacer que las personas interpreten mal la información y, por tanto, el trabajo pierde validez. Además, está
la ética de quienes recolectan la información y no intervenir en los datos que se obtienen.
Considera que los problemas de investigación social requieren estar definidos teóricamente de manera correcta, de lo contrario de
poco servirá el uso de un aparato estadístico (García, 1989).
La muestra es un subconjunto de la población, seleccionada mediante procedimientos aleatorios (al azar) o por métodos dirigidos a
obtener representatividad de la población de donde se obtiene. Las muestras son consideradas como una autentica representación
de la población donde todos y cada uno de los individuos objetos tienen la misma oportunidad de ser seleccionados, mediante los
diferentes tipos de muestreo.
Muestras de conveniencia
Cuando la conveniencia sea la consideración fundamental y sólo se escojan para observación las unidades elementales más
fácilmente accesibles, el subconjunto resultante de todas ellas o de una población estadística asociada, constituye una muestra de
conveniencia.
La Constitución, en su parte orgánica, señala puntualmente el ámbito de competencia de cada poder y también contiene los medios
de control de su actividad. En el siguiente cuadro se exponen sus rasgos fundamentales:
30
Muestras de juicio
Éste es un tipo de muestra más compleja, ya que se basa en la experiencia previa, juega un papel importante en la selección de
unidades elementales para observación. Sin embargo, formular dicho juicio puede ser punto menos que imposible, en especial
cuando las unidades elementales son heterogéneas y la muestra deseada es pequeña.
31
Malhotra, N. (2008). Clasificación de la técnica de encuesta [esquema]. Tomado de:
Una vez recolectada la información por alguna técnica cuantitativa, ésta se puede analizar mediante un método de investigación que
permita la mejor toma de decisiones.
32
2.1.3. Variables, medición
Existen dos clases de datos, los cuales provienen de las siguientes variables.
Niveles de medición
33
El nivel de medición de los datos rige los cálculos que se llevan a cabo con el fin de resumir y presentar los datos. También determina
las pruebas estadísticas que se deben realizar.
La notación estadística o nomenclatura es un lenguaje simbólico que se usa para representar de alguna forma ideas u operaciones
matemáticas.
La nomenclatura que se usa en estas notas se presentará de acuerdo con los temas que se vayan mencionando.
2.2. FRECUENCIAS
Frecuencias: número de veces que ocurre un evento u observación, se representa ( f ).
Los datos ordenados en grupos o categorías reciben el nombre de distribución de frecuencias. Si se tiene un conjunto de datos,
primero hay que organizarlos en forma ordenada y en subconjuntos que presentan características similares (misma asignatura,
misma edad, misma estatura, etc.), con el propósito de facilitar su interpretación.
El primer procedimiento que se emplea para organizar y resumir un conjunto de datos, organizándolos según su clase y su frecuencia,
es una tabla de frecuencias.
Esta tabla puede ser utilizada para organizar y resumir datos cualitativos y datos cuantitativos.
Ejemplo 1:
La siguiente tabla de distribución de frecuencias es una muestra aleatoria de 130 personas en edad de votar en la ciudad M para
elegir a un nuevo representante, está clasificada por grupo de edad.
34
En la primera columna se encuentran las clases o intervalos donde se clasifican los datos de la muestra obtenida. El paréntesis indica
el límite inferior de clase y el corchete el límite superior de clase. Por lo que el número de veces que se repite el evento sólo es en
esa clase.
En la segunda columna se encuentran el número de veces que se repite el evento en cada clase.
Considerando el ejemplo 1, con los datos recolectados de la muestra de votantes se presenta el desarrollo de la Tabla de distribución
de frecuencias absolutas y relativas.
La Xi es un promedio aritmético de clase, que se obtiene sumando los límites reales de clase y dividiéndolos entre dos.
La fr se obtiene de dividir la f de cada clase entre el total de datos u observaciones (en este caso son 130).
La fa de una clase se obtiene de sumar la fa de esa clase y la f de la clase siguiente. El resultado de la clase 2 es 18 + 27 = 46.
La fra de una clase se obtiene de sumar la fr acumulada de esa clase y la frecuencia relativa de la clase siguiente. El resultado de
la fra de la clase 3 es 0.35 + 0.20 = 0.55.
Nomenclatura:
f: frecuencia absoluta
35
2.2.2.2. Histogramas, gráficas de barra, polígonos
Los gráficos son la representación de los datos en forma de dibujo, de tal manera que la persona que los vea pueda comprender los
datos recabados sin tener que remitirse a una tabla de frecuencias.
36
2.2.3 TENDENCIA CENTRAL TOTAL
Las medidas de tendencia central son medidas descriptivas que indican hacia dónde tienden a concentrarse los valores contenidos
en un conjunto de datos.
Media es el punto del rango o distribución por encima o por debajo del cual hay un número exactamente igual de unidades de
desviación. Se obtiene dividiendo la suma de todas las puntuaciones por el número de éstas.
37
Mediana es el dato central o medida de posición.
Media
Mediana
Moda
Donde:
38
De la distribución de frecuencias del ejemplo 1, determinar las medidas de tendencia central.
Media
39
Mediana
Mediana
Sustituyendo en la fórmula:
40
Para datos no agrupados
Media
Ejemplo 2: Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo
siguiente:
Determinar:
Media:
Mediana
Una vez ordenados los datos, el dato central o medida de posición es 20 años de edad.
41
Moda
Las medidas de tendencia central dan un valor representativo de la distribución de frecuencias situado en un lugar intermedio (promedio)
alrededor del cual se encuentran otros valores. Indican cuál es el comportamiento de los datos, es decir, hacia dónde tienden a agruparse.
Asimetría de Pearson, el coeficiente de asimetría de Pearson mide la desviación de la asimetría, expresando la diferencia entre la media
y la mediana con respecto a la desviación estándar del grupo de mediciones. Las fórmulas son:
Para una distribución simétrica, el valor del coeficiente de asimetría es siempre 0, porque la media y la mediana son iguales.
Para una distribución con asimetría positiva, la media es siempre mayor que la mediana, por lo que el valor del coeficiente es positivo.
Para una distribución con asimetría negativa, la media es siempre menor que la mediana, por lo que el valor del coeficiente es negativo.
Coeficiente de asimetría α3
42
La fórmula de momentos se determina para…
La curtosis es una medida de apuntamiento de una distribución de frecuencias, es el grado de concentración alrededor de la media su
resultado representa el grado de apuntamiento de una distribución, es decir, qué tan puntiagudo o qué tan aplanada es la curva de una
distribución.
Mesocúrtica: De acuerdo a la distribución de valores, ni es plana, ni puntiaguda, tiene una proporcionalidad de concentración alrededor
del centro de la distribución de frecuencias.
43
Platicúrtica: Se tiene poca concentración o menor apuntamiento alrededor del centro en ambas direcciones, su forma es plana.
El índice de curtosis se determina de acuerdo a los datos que se tengan, pueden ser de una muestra o de una población, o que los datos
se encuentren agrupados o no agrupados. Se representa mediante la expresión α4
El cuarto momento es siempre positivo y se usa para conocer el apuntamiento de la distribución o coeficiente de curtosis. Cuando el
índice de curtosis es:
44
Para datos no agrupados
Ejemplo 3:
Con los datos del ejemplo 1, determinar el índice de curtosis.
La tabla siguiente presenta los datos que se requieren para determinar la curtosis (recordemos que la media ya se había
calculado). Se agregan las columnas para calcular la curtosis.
Media
Desviación estándar
45
Se calcula el momento 4, sustituyendo en la fórmula momento 4
como α4 = 1.69, y 1.69 < 3 la forma es platicurtica, es decir, se tiene poca concentración o menor apuntamiento alrededor del centro.
2.3. VARIABILIDAD
La variabilidad o dispersión permite comprender qué tan dispersos (esparcimiento) se encuentran las observaciones con respecto a un
punto medio o promedio. Es decir, es un número que indica el grado de dispersión en un conjunto de datos con respecto al promedio.
Donde:
R = Rango o amplitud
LSC = Límite superior real de la última clase
LIC = Límite inferior real de la primera clase
El rango intercuartílico permite medir la dispersión de los datos y es la diferencia entre el primero y el tercer cuartil. Los cuartiles dividen
a la serie de datos en cuatro partes porcentuales.
46
El valor del Q2 es el que coincide con la mediana o punto medio. Por lo que el Q3 indica que es el valor del cual quedan tres cuartas
partes por debajo de 75 %. Los cuartiles se calculan con la fórmula de la mediana, sólo cambia el número del cuartil a determinar.
Donde:
m = 1, 2, 3 el número de cuartil a calcular.
Li = Límite inferior de la clase donde se encuentra el cuartil m.
n = número de datos.
fa = frecuencia acumulada de la clase que precede a la clase del cuartil m.
i = tamaño del intervalo de la clase del cuartil m.
Con los datos de la tabla de frecuencias absolutas y relativas del ejemplo 1, determinar el rango y el rango intercuartil.
Solución:
Rango
R = LSC - LIC
Sustituir en la fórmula los datos correspondientes.
47
Para datos no agrupados
El rango se puede conocer a partir de una muestra ordenada de tamaño n, en donde el rango es la diferencia que hay entre el valor
máximo y el valor mínimo de la serie o conjunto de datos.
R = Dm – dm Donde:
Dm = Valor mayor
dm = Valor menor
Rango intercuartil
El rango intercuartil es la diferencia entre el primero y tercer cuartil, permite medir la extensión o dispersión de los datos. Se calcula con
la fórmula:
R = Q3 - Q1
Donde:
Q = cuartil.
m = 1, 2, 3 el número de cuartil a calcular.
X = la posición del cuartil a calcular para encontrar su valor.
n = número de datos.
Con los datos del ejemplo 2, calcular el rango y el rango intercuartil.
Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo siguiente:
Rango
Solución
Sustituyendo en la fórmula
R = 25 – 18 = 7
48
2.3.2. DESVIACIÓN ESTÁNDAR
La desviación estándar es una medida de variabilidad que toma en cuenta la dispersión de los valores de los datos respecto a su media
y su resultado se expresa en las mismas unidades de la variable que se examina. Se representa con la letra S para la muestra y σ para
la población.
49
Datos agrupados
Solución
Se agrega una columna para realizar lo que indica el numerador de a fórmula como se muestra en la siguiente tabla.
Sustituyendo en la fórmula
50
Datos no agrupados
Con los datos del ejemplo 2
Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo siguiente:
Determinar:
Desviación estándar
Solución:
Primero calcular lo que indica la fórmula en el numerador (la media ya se había calculado y es 21), se puede realizar una tabla para que
sea más práctico el cálculo.
∑ 79
51
Referencias
INEGI. (2003). Síntesis metodológica de las estadísticas vitales. México: Dirección General de Estadística. Dirección de
estadísticas demográficas y Sociales. Consultado de http://www.inegi.org.mx/est/contenidos/espanol/metodologias/registros
Hernández, R., Fernández, C., Baptista, P. (2010). Metodología de la investigación. México: McGraw-Hill.
Una hipótesis es una afirmación sobre una característica de la población estudiada. Para conocer si podemos aceptar o rechazar una
hipótesis recabamos información de la población. Sin embargo, no siempre será posible recabar información de todos los elementos de
la población; en eso casos tomaremos datos de una o varias muestras. Estos datos se someten a un procedimiento estadístico llamado
prueba de hipótesis para aceptar o rechazar nuestras afirmaciones iniciales.
García (1989), en Socioestadística, nos explica que “Una parte importante de la investigación que se lleva a cabo en el campo de la
sociología está relacionada con la aceptabilidad o rechazo de las hipótesis que se deducen de las teorías sociológicas” (p. 157). Por ello,
en este tema revisaremos en qué consiste el diseño de una hipótesis y cómo se ponen a prueba.
Es posible analizar la relación entre variables utilizando gráficos de dispersión, como los siguientes:
52
La figura (a) muestra una relación lineal positiva entre “ ”y“ ”, esto quiere decir que si aumenta x también aumenta y de manera
más o menos proporcional.
La figura (b) muestra una correlación lineal negativa entre “ ”y“ ”, es decir, si aumenta x disminuye y, de manera más o menos
proporcional.
Además de la apreciación gráfica de una correlación existen formas de medir la intensidad con la que se relacionan dos variables. Para
variables cuantitativas existe el coeficiente de correlación lineal o coeficiente de Pearson. Este estadístico arroja un resultado entre -1 y
1. Cuando el valor del coeficiente de Pearson es cero, decimos que no hay correlación entre las variables. Si el valor del coeficiente es
negativo decimos que hay una correlación lineal negativa, y por el contrario si es positivo hay una correlación lineal positiva. Entre más
se acerque el valor del coeficiente a -1 o a 1 más fuerte será la correlación entre las dos variables.
Cuando se estudian correlaciones es posible caer en el error de considerarlas como relaciones causales, es decir, suponer que una
variable causa a otra. Sin embargo, es posible que una tercera variable esté influyendo en el comportamiento de las dos variables
estudiadas. A esa tercera variable se le llama interviniente.
La hipótesis de partida se llama hipótesis nula. Es común que se formule una hipótesis nula no con el propósito de probarla sino de
rechazarla y de esta manera probar la afirmación deseada. Por ejemplo, si se quiere demostrar que un método de estudio da resultados
diferentes a otro, la primera hipótesis nula sería “los métodos dan el mismo resultado”; luego hacemos la prueba y si rechazamos esta
primera hipótesis al menos habremos obtenido evidencia de que los métodos estadísticos no dan el mismo resultado.
A la evidencia de que la hipótesis nula es rechazable le llamamos hipótesis alternativa. Usualmente, la hipótesis alterna se refiere a
la hipótesis propuesta por el investigador. Siguiendo nuestro ejemplo, la evidencia de que los métodos estadísticos no dan el mismo
resultado es nuestra hipótesis alternativa.
La hipótesis nula es sometida a una prueba de hipótesis con la cual se le rechaza o se le acepta. En caso de que se le rechace, se asume
como factible la hipótesis alterna.
Ahora, una prueba de hipótesis es un procedimiento generalmente aceptado para tomar una decisión: se acepta o se rechaza la
hipótesis. También es conocida como prueba de significancia, test de hipótesis, ensayo de hipótesis o contraste de hipótesis.
53
Un contraste de hipótesis consiste en comparar la hipótesis nula versus la hipótesis alternativa, para ello se dividen los datos muestrales
en dos zonas, la zona de aceptación y la zona de rechazo. El valor que resulte de la prueba de hipótesis caerá en la zona de aceptación
o en la zona de rechazo. Para ejemplificar este concepto gráficamente observa la imagen de la siguiente distribución muestral:
Si el estadístico de contraste cae en la región de rechazo, entonces rechazamos la hipótesis nula. Si el estadístico de contraste cae en
la región de aceptación entonces aceptaremos la hipótesis nula.
A la región de rechazo se le conoce como región crítica y los puntos que la delimitan son conocidos como puntos críticos de rechazo.
García (1989) considera que los procedimientos estandarizados que se siguen en las pruebas de decisión estadística son los siguientes:
En cuanto a la elección de una prueba estadística, diremos que se trata de elegir un estadístico de contraste, es decir, una variable
aleatoria, cuya distribución muestral nos permite determinar la probabilidad asociada a un determinado valor para el estadístico.
Al criterio que utilicemos para saber si aceptamos o rechazamos la hipótesis nula le llamamos regla de decisión. Consiste en definir la
zona de rechazo y la zona de aceptación de la hipótesis nula. La zona de rechazo contiene a todos los valores para el estadístico de
contraste que se alejan de la hipótesis nula y por lo tanto es poco probable que ocurran si dicha hipótesis es verdadera.
La prueba de contraste puede ser unilateral si para tomar la decisión utilizamos sólo valores de uno de los extremos de la gráfica, como
se muestra en la siguiente imagen:
54
También podemos hacer un contraste bilateral si utilizamos ambos extremos de la gráfica.
55
2.4.3.1. ERROR ESTÁNDAR
Existe la posibilidad de una vez concluida la prueba de hipótesis rechazar cuando en realidad sí era verdadera; en este caso se
dice que se comete un error de tipo I. O por el contrario, podríamos aceptar cuando en realidad era falsa, a esto se le llama error
de tipo II. Veámoslo en la siguiente tabla:
Se llama nivel de significación de una prueba de hipótesis a la probabilidad de cometer un error de tipo I. Se representa con la letra
griega alfa .
El nivel significancia o nivel de riesgo se define como la probabilidad de rechazar la hipótesis nula cuando es verdadera. Es posible que
quien realiza la prueba de hipótesis determine el nivel de significancia.
2.4.3.2. ESTIMACIÓN
De una población se extrae una muestra, a partir de dicha muestra se determinan una serie de estadísticos (media muestral, varianza
muestral, etc.), y a través de los procedimientos de estimación y contraste se hallan los parámetros (media poblacional, varianza
poblacional, etc.) que describen a dicha población.
56
• Estimación puntual: determina un valor único para el parámetro.
• Estimación por intervalo de confianza: se determina un intervalo dentro del cual puede estar el parámetro.
Generalmente se realizan estimaciones por intervalo, porque tenemos mayor probabilidad de acertar sobre el valor de un parámetro si
decimos que se encuentra entre todos los números posibles enmarcados por el límite inferior del intervalo y el límite superior del intervalo.
Se lee “theta es mayor o igual que theta uno, y menor o igual que theta dos”.
Error de estimación
Mide la precisión de la estimación. Cuanta más precisión necesitemos, más estrecho debe ser el intervalo de confianza, y por lo tanto
menor será el error de estimación. Un menor error generalmente requiere de muestras más grandes.
Nivel de confianza
Es la probabilidad de que el valor del parámetro que estamos buscando se sitúe en el intervalo de confianza. Se denota con y generalmente
se expresa como porcentaje, es habitual tener niveles de confianza del 95 % y 99 %. Como ya habrás observado, si aumentamos el
ancho de un intervalo tenemos un mayor nivel de confianza pero también admitimos un mayor error de estimación.
57
Valor
Se lee como valor alfa. Conocido como nivel de significación, es la probabilidad de fallar en la estimación del parámetro. Se calcula como
la diferencia entre la certeza (la probabilidad 1) y el nivel de confianza. Entonces si establecemos un nivel de confianza de .95, alfa es
igual a 1-0.95, es decir, alfa es igual a 0.05.
Valor crítico Z
Es el valor de una abscisa en una distribución. Normalmente los valores críticos están tabulados.
Existen diversos procedimientos para encontrar el intervalo de confianza de un parámetro, revisa uno de ellos en el siguiente video:
Ahora que conoces los conceptos referentes a la estimación es importante que los uses para interpretar el valor de un parámetro. Por
ejemplo: si te dicen que un valor promedio se sitúa en 24 puntos, con 3 puntos de margen de error y un nivel de confianza del 95 %,
debemos entender que el valor del promedio en realidad se sitúa entre 22.5 y 25.5 puntos con una confianza de acertar en ese intervalo
el 95 por cien de las veces que lo calculemos. Los límites del intervalo de confianza se obtienen de añadir al parámetro la mitad del
margen de error hacia abajo y la mitad hacia arriba.
58
5. MODELOS PROBABILÍSTICOS
Antes de explicarte los modelos probabilísticos te comentaremos de manera general en qué consiste la teoría de la probabilidad y su
importancia.
Esta teoría estudia qué tan posible es que ocurra un evento. Por ejemplo, ¿qué tan probable es que bajo ciertas condiciones llueva hoy?
¿Qué tan probable es que al lanzar una moneda caiga águila?
La teoría de la probabilidad tiene su origen en los trabajos de Antoine Gombaud —llamado Caballero de Méré—, Blaise Pascal y Pierre
de Fermat. Gombaud era un jugador asiduo sobre todo de cartas y dados, y tratando de encontrar la mejor manera de ganar estos juegos
planteó varios problemas matemáticos relacionados con la probabilidad de obtener uno u otro valor en algún momento del juego. Pascal
y Fermat, junto con Gombaud, comenzaron a resolver los problemas propuestos, y este conocimiento se convirtió en el fundamento de
la teoría de la probabilidad (Hald, AÑO , p. 42).
Se lee “la probabilidad de que ocurra x es igual a los casos favorables entre los casos posibles”.
Por último, podemos comentar que el objetivo de un modelo probabilístico es predecir la manera en como probablemente se comportará
una variable aleatoria.
Una variable aleatoria es aquella cuyo valor está determinado por el azar, es decir, puede tomar un valor dentro de un conjunto de valores
posibles. Hay variables aleatorias discretas y continuas. Las discretas toman valores discontinuos y las continuas toman valores sin
interrupciones. Veamos algunos ejemplos:
Cantidad de personas formadas en una fila. Es una variable discreta porque no puede haber 2.5 personas. Sólo puede haber 2 o 3
personas. Es decir, el valor de la variable se ve interrumpido, es discontinuo.
Consumo de refresco al día. El consumo de refresco se puede medir en litros y es posible tener 2.1 litros, 2.18 litros, 2.1842 litros y así
hasta el infinito. Por lo tanto, la variable tiene valores continuos que nunca se interrumpen.
En el siguiente esquema se observa la relación entre la estadística descriptiva, el estudio de la probabilidad y la creación de un modelo
teórico.
59
Los modelos para encontrar la probabilidad de cada valor de una variable aleatoria se conocen como distribuciones de probabilidad . Una
distribución de probabilidad se concreta en una fórmula, gráfica o tabla.
A continuación mencionaremos algunas de las distribuciones de probabilidad más usadas, brevemente, porque las estudiarás con más
detalle cuando realices la actividad de aprendizaje.
2.5.1. NORMAL
En una distribución normal una variable aleatoria continua se representa gráficamente como una curva simétrica, en forma de campana
(llamada campana de Gauss ). Es la distribución más utilizada porque muchos fenómenos estudiados se distribuyen con esta forma.
Una característica evidente del diagrama anterior es que coinciden en el mismo punto el valor medio, la mediana y la moda de la
distribución.
60
2.5.2. BINOMIAL
La distribución binomial sirve para estudiar la probabilidad de una variable aleatoria discreta que puede tomar uno de dos valores.
Cumple con las siguientes condiciones:
Donde:
x = número de éxitos en “n” ensayos
n = número de ensayos
p = probabilidad de éxito
q = probabilidad de fracaso (q es igual a 1 menos p)
2.5.3. POISSON
La distribución de Poisson se utiliza para calcular la probabilidad de que ocurra un evento durante un intervalo específico. Dicho intervalo
puede referirse a tiempo, distancia, volumen o cualquier magnitud similar.
Se ocupa la fórmula:
Donde:
x = número de ocurrencias de un suceso durante un intervalo
= media de la distribución
e = número euler = 2.71828
61
Para saber más…
https://youtu.be/uAcWCOOPWa8
Referencias
García-Ferrando, M. (1989). Socioestadística: Introducción a la estadística en sociología. España: Alianza.
Hald, A. (2003). A History of probability and statistics and their applications before 1750 Nueva Jersey: John Wiley & Sons.
Elorza, H. (2008). Estadísticas para las ciencias sociales, del comportamiento y de la salud (3.ª ed.). México: Cengage Learning
Editores.
62