Mediscript Antibioticoterapia

34567800975432346780986545 121
67890’0987656790’0987654567
890’0875434578998765456789
0’098765434567890’098765456
7890’098675434567890’098654
3234567890’098765434567890’
MANUAL BÁSICO STATA
098754323457890’0987643234
INICIACIÓN A LA INVESTIGACIÓN
56790’09876543235678909876
SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS
56723394857890329487829300
2394876738290’309485743829
00394875609876123450986234
56098098762352347667809874
56985789878972364654568763
45984569845986459834587634
98345873876569834945687126
asdfads12111111111212111111111111111111121
PRÓLOGO
Es un placer presentar la primera versión del Manual STATA: Iniciación a

la investigación. Lleva este nombre porque se espera que con su uso, se
aprenda a realizar análisis estadísticos básicos e intermedios para
COMITÉ PERMANENTE DE cualquier tipo de trabajo, ya sea descriptivo, transversales analíticos,
PUBLICACIONES CIENTÍFICAS casos y controles, cohortes, e inclusive experimentales.
- JUNTA DIRECTIVA 2015 -
La parte estadística suele ser el talón de Aquiles en el proceso de
Director Nacional investigación durante el pregrado. Suelen presentarse dificultades en la
Carlos Jesús Toro
selección de las pruebas adecuadas, uso de programas estadísticos y en
Huamanchumo
- SCIEMVE, Chiclayo - el análisis e interpretación de los resultados. El propósito de este manual
es tratar de subsanar en la mayor medida posible estas dificultades,
Subdirector Nacional sirviéndole como una ayuda práctica y portátil al estudiante.
José Ernesto Fernández
Chinguel Es muy gratificante poder compartir y extender este manual a través de
- SCIEMVE, Chiclayo - la Sociedad Científica Médico Estudiantil Peruana, esperando que pueda
llegar a la mayor cantidad de estudiantes a nivel nacional. Sé que será de
Coordinadora Norte mucha utilidad y espero se le pueda sacar el máximo provecho posible.
Jessica Meza Liviapoma
Ya no hay excusas para no realizar investigación. Sigamos aportando a
- SOCIEM UNP, Piura
nuestra producción científica nacional.
Coordinadora Centro
¡Investiguen, innoven!
Dyanne de la Rosa Campos
- SOCIEM UPSJB, Lima -
Coordinador Sur
Cender Udai Quispe Juli
- SOCIEMA, Arequipa -
José Ernesto Fernández Chinguel

Subdirector CPPC SOCIMEP 2015
Director CPPC SCIEMVE 2015
SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 2

ÍNDICE
I. DESCRIPCIÓN DEL STATA pág. 04
II. BASE DE DATOS pág. 05
III. DO FILE / LOG FILE pág. 07
IV. ETIQUETAR VARIABLES pág. 09
V. DESCRIPCIÓN DE VARIABLES pág. 12
VI. ANÁLISIS UNIVARIADO pág. 13
Variables categóricas
Variables cuantitativas
NORMALIDAD
VII. ANÁLISIS BIVARIADO pág. 16
Categórica – Categórica
Categórica – Cuantitativa
Cuantitativa – Cuantitativa
Medidas de Asociación: OR RP RR HR
VIII. ANÁLISIS MULTIVARIADO pág. 25
Agradecimientos pág. 27

Referencias pág. 28
I. Descripción del STATA 11.0
DEFINICIÓN:
Stata es un paquete de software estadístico creado en 1985 por StataCorp. Es utilizado

principalmente por instituciones académicas y empresariales dedicadas a la investigación,
especialmente en economía, sociología, ciencias políticas, biomedicina epidemiología.
BARRA DE MENU
BARRA DE
HERRAMIENTAS
TABLA DE
COMANDOS
EFECTUADOS
TABLA DE
VARIABLES
TABLA DE TABLA DE
COMANDOS RESULTADOS
BARRA DE MENU: Se encuentran los menus de file, edit, data, etc.
BARRA DE HERRAMIENTAS: Se encuentran las herramientas de Log file, do file, etc.
TABLA DE COMANDOS EFECTUADOS: Se encuentra la lista de todos los comandos efectuados.
TABLA DE VARIABLES: Se encuentran las variables de la base con sus etiquetas, tipo y
formato.
TABLA DE COMANDOS: Tabla donde se digitan los comandos a efectuarse.
TABLA DE RESULTADOS: Se encuentran los resultados de los comandos efectuados.

II. Base de datos:

- La base debe estar bien organizada, completa y sin errores.
- Se recomienda usar previamente el programa Microsoft Excel para completar corregir la
- base de datos del trabajo.
- Hacer una copia de la base de datos original, esto es importante porque te ayuda a
corregir si hubiese un error, modificar variables, recordar algún dato que se haya
modificado, etc.
- En la base no debe usarse comas decimales, el programa STATA solo reconoce puntos
decimales.
- Se sugiere agregar la columna ID para enumerar cada encuesta. Esto es de mucha ayuda,
por ejemplo en caso de faltar algún dato se consulta al número de encuesta.
- Filtrar la base y comprobar que todos los datos estén completos.

Datos completos y sin vacíos.
- En la base Excel las variables deben estar en mayúsculas o al menos una de las letras. Esto
permite al programa STATA generar etiquetas de las variables.
- En el programa STATA utilizar el comando “edit”, se ejecutará un editor de variables. En el
editor de variables pegar la base del Excel. Al hacerlo saldrá la siguiente tabla:
Dar click en la segunda opción
Lo que significa que tomará a la primera fila como nombres de las variables.

- Para editar la base usar siempre el comando “edit”, y verificar que todas las variables
están completas y no hay errores.
- Si observamos una columna de color rojo significa que en esa columna existen letras,
comas, palabras, etc. Es decir, tiene errores.
- Si observamos que en uno de los datos hay un punto “.”, significa que ese dato está vacío
y STATA lo toma como datos MISSING o datos perdidos.
III. Do file / Log file: Permiten guardar comandos y acciones en STATA.
Log file: Útil para guardar todas las acciones hechas en STATA, por ejemplo: comandos,
modificación de variables, resultados, etc.
 Antes de empezar a utilizar los comandos en STATA es necesario utilizar la herramienta

“Log file”, la cual se encuentra en la barra de herramientas.
 Guardar el archivo Log file, este se guardará en formato *.smcl
 Al finalizar el análisis, hacer click en el ícono Log file de la barra de herramientas.

Aparecerá una ventana:

Hacer click en la segunda opción y luego OK
 Al abrir el archivo *.smcl en el STATA, se verá todas las acciones hechas desde el momento
en que se inició el Log file hasta donde se guardó.
Do file: Útil para guardar la lista de comandos utilizados en STATA
 Hacer click en el ícono “New Do-file editor”
 Se abrirá la ventana de edición de Do file. Copiar de la TABLA DE COMANDOS

EFECTUADOS, todos los comandos que queremos guardar en el Do file. Luego guardar el
Do file.
 La herramienta de Do file es útil en caso de no haber usado el Log file.

 Supongamos que se hizo una nueva base de datos o se modificó esta, tendríamos que
volver a utilizar cada comando hecho anteriormente. La herramienta Do file permite
correr todos los comandos usados usando el ícono (Execute do):
 Para ello seleccionar el comando y luego “Execute do” y automáticamente se ejecutarán

los comandos seleccionados.

IV. Etiquetar variables:

 Haremos el siguiente ejemplo: La variable sexo tiene en su base “0” y “1”, lo que significa
que cero es igual a masculino y uno es igual a femenino. Al hacer el comando “tab sexo”,
obtenemos lo siguiente:
Por lo tanto se necesita poner una etiqueta para el cero y el uno.
 Abrir la base con el comando “edit” y hacer click derecho sobre la variable y luego en
variable properties y saldrá la siguiente ventana

 Hacer click:
 Luego digite “1” en value y etiquetelo en Label con el nombre de Mujer, Apply (aplicar) y
ok.

 En la ventana de Variable Properties, baje la barra de Value Label y seleccione sexo. Luego
Apply (aplicar) y cierre el editor.
 Para comprobar la etiqueta escriba el comando “tab sexo”, y observará los cambios en el
cero y el uno.

V. Descripción de variables.
 Antes de empezar la descripción de las variables se debe utilizar el comando “set more
off”, para poder ver la lista de resultados completa.
 El comando “sum”, sirve para ver la lista de todas las variables con sus datos observados,
medias, desviación estándar, Rangos mínimos y máximos.
 También puedes utilizar “sum varibleejemplo” para ver el resumen de la variableejemplo.

 Se utiliza “sum” para variables numéricas con distribución normal.
 El comando “tab variableejemplo”, te otorga una tabla de frecuencias, percentiles y
porcentajes acumulados de la variable categórica.
 De esta forma uno puede empezar la primera tabla descriptiva en cada trabajo.
 Utilizamos el comando “tab variable_independiente_vertical
variable_dependiente_horizontal”
Ejemplo: tab sexo fuma
 Si queremos ver porcentajes en el mismo ejemplo:

“tab sexo fuma, col”: Ver porcentajes en columnas

“tab sex fuma, row” : Ver porcentajes en filas
VI. Análisis Univariado
CATEGÓRICAS NUMÉRICAS /
/CUALITATIVAS CUANTITATIVAS
NORMAL: MEDIA
FRECUENCIAS Y DESVIACIÓN
ESTÁNDAR
NO NORMAL:
PORCENTAJES MEDIANA Y
RANGOS

6.1 Variables Categóricas: Se miden en Frecuencias y Porcentajes. Para ello se utiliza el

comando “tab variable”. Ejemplo: tab sexo:
6.2 Variables Cuantitativas: Se miden de acuerdo a la Normalidad
- Si es Normal: Se mide Media y Desviación estándar.
- Si no es Normal: Se mide Mediana y Rangos
 Evaluar NORMALIDAD: Existen 4 formas para evaluar normalidad

1) Kurtosis y sesgo: Un valor de kurtosis igual a 3 corresponde a una distribución normal,
considerándose valores cercanos (2 y 4) como distribuciones normales. El sesgo está
entre (-1) y (+1). Para ver la kurtosis y sesgo utilizamos el comando “sum variable,
detail”.
Ejemplo: sum edad, detail
Sesgo = 0.2239296 Kurtosis = 2.799769
Según estos resultados se concluye que la variable edad es normal.
2) Sesgo y kurtosis: Existe otro comando llamado “sktest variable”, este combina el
sesgo y kurtosis obteniéndose un valor P
- Si P es >0,05 = NORMAL
- Si P es <0,05 = No NORMAL
- Ejemplo: sktest edad

P =
0.2780, de acuerdo a estos resultados se concluye que es NORMAL.
3) HISTOGRAMA: Se compara la curva de normalidad con la del histograma, si son

parecidas quiere decir que es normal. Para ellos utilizamos el comando: “hist variable,
norm”.
Ejemplo: hist edad, norm
La curva de normalidad es similar, es posible que sea normal.
4) Shapiro wilk: Es la prueba más utilizada para hallar normalidad. Para ello utilizamos el
comando “swilk variable” obteniéndose un valor P.
- Si P es >0,05 = NORMAL
- SI P es <0.05 = NO NORMAL
Ejemplo: swilk edad
P = 0.00680 Es NO NORMAL

NOTA: La media, desviación estándar, mediana y rangos se obtienen a partir del comando “sum
variable, detail”
Ejemplo:
Media = 47.04215 Desviación estándar = 15.51631
Mediana = 47 Rango = min. 18 máx. 89
VII. Análisis Bivariado
<20% : Chi2
Categórica - Valores
Categórica Esperados
>20%: Exacta de Fisher
Categórica NORMAL: T de Student

Normalidad de
dicotómica -
la cuantitativa
Cuantitativa NO NORMAL: Sumade rangos de
Wilcoxon o U de Manh-Whitney
Si ambas son NORMALES:

Cuantitativa - PEARSON
NORMALIDAD
Cuantitativa
Si al menos una es NO NORMAL:
SPEARMAN

Depende el tipo de variables que queremos cruzar, donde se calculará un valor P, siendo
significativo si es <0,05.
A) CATEGÓRICA – CATEGÓRICA: De acuerdo a los valores esperados se utilizará pruebas

paramétricas y no paramétricas
 Valores esperados:
o Chi2: Se utiliza chi2 si no más del 20% de los valores esperados es menor e igual
que cinco (05).
o Exacta de Fisher: Se utiliza Fisher cuando más del 20% de los valores esperados
son menores e igual a cinco (05).
 Para ver los valores esperados se utiliza el comando “tab variable_independiente
variable_dependiente , exp”
Ejemplo: tab sex edo_civil, exp
Cada sección representa el 10% del total (100%)
Los valores esperados (1.1)(0.5)(5.0)(0.9)(0.5) son menores o igual a cinco (05), esto quiere
decir que el 50% de los valores esperados son menores o igual a cinco, por lo tanto se utiliza
una la prueba Exacta de Fisher.
 Chi2: Para utilizar la prueba paramétrica de Chi2 cruzaremos dos variables en una tabla y
seguido de una coma añadimos “chi2”.
Ejemplo: “tab sex aprobo, chi2”

El valor P es de 0.042 y es menor que 0.05, esto quiere decir que es significativo. En el ejemplo
se interpreta que existe diferencia estadística entre la frecuencia de aprobar de hombres y
mujeres
OJO: no sabemos cuál es esa diferencia estadísticamente significativa; es decir, no se puede

afirmar si ser varón o mujer te permite aprobar o desaprobar.
 Exacta de Fisher: Para utilizar la prueba Exacta de Fisher cruzaremos dos variables en una
tabla y seguido de una coma añadimos “exact”.
Ejemplo: “tab sex aprobo, exact”
El valor P es de 0.044 y es menor que 0.05, esto quiere decir que es significativo y se interpreta
igual que chi2.
NOTA: Se recomienda usar tablas de 2 x 2 para poder facilitar el análisis estadístico.

B) CATEGÓRICA DICOTÓMICA – CUANTITATIVA NORMAL: Para evaluar se necesita saber la
NORMALIDAD de la variable cuantitativa.
- Si es normal, se utilizará la prueba de T-student
- Si no es normal, se utilizará la prueba de Suma de Rangos de Wilcoxon o también llamada
U de Mann-Whitney
 T-student: Utilizamos el comando “ttest var_cuant, by(var_categ)”
Ejemplo: “ttest edad, by(aprobo)”

El valor P es 0.1644 y es mayor que 0.05, esto quiere decir que es NO significativo. En el
ejemplo se interpreta: “No existen diferencias estadísticas entre las edades de los que
aprobaron y desaprobaron”.
 Suma de rangos de Wilcoxon o U de Mann-Whitney: Utilizamos el comando “ranksum

var_cuant, by(var_categ)”
Ejemplo: “ranksum edad, by(aprobo)”
El valor P es 0.0675 y es mayor que 0.05, esto quiere decir que es NO significativo. Se
interpreta igual que la t student
C) CUANTITATIVA – CUANTITATIVA: Para evaluar se necesita saber la NORMALIDAD de

ambas variables:
- Si ambas son normales: Utilizar correlación de pearson
- Si almenos una es NO normal: Utilizar correlación de Spearman
 Pearson: Utilizaremos el comando “pwcorr var_cuant1 var_cuant2, sig”
Ejemplo: “pwcorr edad year, sig”
Coeficiente de Correlación
El valor p es <0,001, esto quiere decir que es significativo.
NOTA: El signo del dato 0.6296, indica si la correlación es positiva o negativa. En el ejemplo
es positivo y quiere decir que a mayor edad mayor año. Si fuese negativo: a mayor edad
menor año. En el ejemplo se interpreta: “Existe asociación significativa moderada entre la
edad y el año”*.

 Spearman: Utilizaremos el comando “spearman var_cuant1 var_cuant2”

Ejemplo: “spearman nota edad”
Rho de Spearman
El valor P es <0,001, esto quiere decir que es significativo. Se puedeinterpretar de manera

similar que Pearson*
NOTA (*): Para la interpretación de los valores de correlación (coeficiente de correlación y/o Rho de
Spearman), es importante tener en cuenta las siguientes interpretaciones, propuestas por diferentes
autores:
Interpretación 1: El coeficiente de correlación oscila entre –1 y +1, el valor 0 que indica que no existe
asociación lineal entre las dos variables en estudio.
Interpretación 2:
Correlación negativa perfecta……………………………………………………………………………………………………… -1
Correlación negativa fuerte moderada débil………………………………………………………………………..-0,5
Ninguna correlación………………………………………………………………………………………………………………………0
Correlación positiva moderada Fuerte……………………………………………………………………………………….+0,5
Correlación positiva perfecta………………………………………………………………………………………………………..+ 1
Interpretación 3:
1) Perfecta R = 1
2) Excelente R = 0.9 < = R < 1
3) Buena R = 0.8 < = R < 0.9
4) Regular R = 0.5 < = R < 0.8
5) Mala R < 0.5
Interpretación 4: Rango Relación
0 – 0,25: Escasa o nula
0,26-0,50: Débil
0,51- 0,75: Entre moderada y fuerte
0,76- 1,00: Entre fuerte y perfecta

NOTA: Las pruebas chi2, exacta de ficher y t-student, U de mann-whitney solo sirven para
calcular el valor P, pero no explica cuál es la fuerza de asociación. Para ello se utiliza valores
de asociación o estadísticos de asociación: RP, OR, OR, RR, HR
D) Medidas de Asociación:
 RP: Razón de prevalencias: Principalmente en estudios de Casos y Controles y
transversales analíticos.
 OR: Odds Ratio o razón de momios: Principalmente en estudios de Casos y Controles y
transversales analíticos.
 RR: Razón de riesgos o riesgo relativo o razón de incidencia: Principalmente en estudios
Cohorte y Experimentales
 HR: Hazzard ratio: Estudios en un punto en el tiempo, Longitudinales.
Para las medidas de asociación se utiliza el mismo comando para todos, y se interpreta de
acuerdo al tipo de estudio.
- El estadístico que utilizaremos va de acuerdo a la variable principal, la dependiente.
Ejemplo
La variable principal es: aprobó (si / no), la cual es categórica.
Se puede aplicar REGRESIÓN LOGÍSTICA O MODELOS LINEALES GENERALIZADOS (GLM). Ambas

son las más utilizadas para medir asociación.
 REGRESIÓN LOGÍSTICA: Se utiliza si la variable de interés es menor del 10%

 MODELOS LINEALES GENERALIZADOS: Se utiliza cuando la variable de interés es mayor
del 10% (en el ejemplo, si la variable “si” es menor que 10%, el resultado que te dé al
aplicar el GLM no es el adecuado porque sobreestima el valor real).
“tab aprobo”:
La variable de interés (SI) representa el 12.85%, esto es mayor que el 10% y por lo tanto se
usará GLM.

 REGRESIÓN LOGÍSTICA: En el ejemplo suponiendo que la variable de interés es menor

del 10%, utilizamos el comando “logistic var_deinteres variableejemplo”
“logistic aprobo sex”:
El Odds Ratio obtenido es de 1.370235 y se puede interpretar de tres formas:
Mujeres: 1 Hombres: 0 Si aprobó: 1 No aprobó: 0
Primera: Las mujeres tienen 1,37 veces la probabilidad de aprobar a comparación de los
hombres.
Segunda: Las mujeres tienen 0,37 veces más la probabilidad de aprobar a comparación de los
hombres.
Tercera: Las mujeres tienen el 37% más probabilidad de haber aprobar a comparación de los
hombres.
 Modelos Lineales Generalizados (GLM): Para entender GLM diremos que la regresión
logística es como un individuo y el GLM es como una familia de regresiones logísticas.
En otras palabras, GLM es una familia especializada para hacer logística/estadística.
Las familias son:
FAMILIA GAUSSIAN: Se usa cuando las variables principales son numéricas.
FAMILIA INVERSE GAUSSIAN: Se usa cuando las variables principales son número inversos.
FAMILIA BINOMIAL /BERNOLLI: Se usa cuando las variables principales son categóricas.
FAMILIA POISSON: Se usa cuando la variable principal es categórica pero se utiliza en casos raros
(ej: problemas de convergencia en el análisis).

Las familias más utilizadas son Binomial y Poisson.
Familia Binomial: Utilizamos el comando:
“glm var_dependiente/categorica var_por_analizar, fam(binomial) link(log) eform nolog”
El eform nolog, sirve para evitar ver logaritmos.
Ejemplo:
“glm aprobo sex, fam(binomial) link(log) eform nolog”
Se interpreta igual a la regresión logística.

Familia Poisson: Utilizamos el comando:
“glm var_dependiente/categorica var_por_analisar, fam(poisson) link(log) eform nolog”
Ejemplo:
“glm aprobo sex, fam(poisson) link(log) eform nolog”
Se interpreta igual a la regresión logística.
NOTA: Cuando la variable por analizar tiene más de dos categorías, por ejemplo la variable
estado civil tiene las categorías: soltero (0), casado (1), viudo (2) y divorciado (3). Siendo la
variable de interés “aprobó”, para ello se utiliza se utiliza el comando:
“xi:glm var_dependiente/categorica i.var_por_analizar, fam(binomial) link(log) eform nolog”
Colocar antes de todo el comando “xi” y antes de la variable de varias categorías “i.”
Ejemplo: “xi:glm aprobó i.edo_civil, fam(binomial) link(log) eform nolog”

El estado civil tiene cuatro categorías y en análisis lo compara contra el “0” (soltero).
NOTA:
Comando “robust”: Sirve para ajustar la muestra cuando la población es muy grande.
Comando “cluster”: Sirve para ajustar el resultado en caso se haya obtenido la muestra de
diferentes sub_muestras. Por ejemplo si se encuestó a nueve universidades diferentes.
“glm aprobo ros_auxilios, fam(binomial) link(log) eform nolog robust cluster(univ)”
VIII. Análisis Multivariado:

 Primero se toma a las variables que resultaron significativas en el análisis bivariado.
Por ejemplo: Semestre (semestre), llevar el curso de primero auxilios (ros_auxilios),
llevar el curso de inyectables (inyectables) y llevar el curso de RCP previamente
(rcp_previo).
 Segundo se aplica el comando:
“glm aprobo semestre ros_auxilios inyectables rcp_previo, fam(binomial) link(log) eform

nolog robust cluster(univ)”

Se obtendrán los OR de cada variable y cada una se interpreta.
Ejemplo: Los que recibieron el curso de RCP previamente tienen 3,08 veces la probabilidad de
aprobar a comparación de los que no recibieron el curso de RCP, ajustado al semestre, recibir
el curso de primero auxilios, recibir el curso de inyectables y por cluster de universidad.

Agradecimientos
Un agradecimiento especial a mi mentor, Cristian R. Mejía Álvarez. Por sus enseñanzas

durante el sexto GIS (Grupo de Investigación de las SOCEMs), en el cual tuve la grata
oportunidad de participar.
También agradezco a Carlos J. Toro Huamanchumo; un gran amigo, colega y ejemplo.

Gracias a su colaboración fue posible la elaboración de este manual.

Referencias
1. Van Belle G, Fisher LD. Biostatistics: a methodology for the health sciences. Hoboken, NJ:
Wiley-Interscience; 2004.
2. Stata Press. Stata Base Reference Manual. 13th ed. College Station, TX: Stata Press; 2013.
3. Osada J, Vidal L, León F. Comparación de variables estadísticas: clavando un tornillo. Rev

Med Chile. 2014. 142(8):1080-81.
4. Martínez-Ortega MM, Tuya-Pendás LC, Martínez-Ortega M, Pérez-Abreu A, Cánovas AM. El

coeficiente de correlacion de los rangos de Spearman. Caracterización. Rev Haban Cienc Méd.
2009;8(2).

Mediscript Antibioticoterapia

Загружено:

Сведения о документе

Исходное описание:

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Mediscript Antibioticoterapia

Загружено:

Авторское право:

Доступные форматы

34567800975432346780986545 121

Es un placer presentar la primera versión del Manual STATA: Iniciación a

José Ernesto Fernández Chinguel

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 2

II. BASE DE DATOS pág. 05

III. DO FILE / LOG FILE pág. 07

IV. ETIQUETAR VARIABLES pág. 09

V. DESCRIPCIÓN DE VARIABLES pág. 12

VI. ANÁLISIS UNIVARIADO pág. 13

VII. ANÁLISIS BIVARIADO pág. 16

VIII. ANÁLISIS MULTIVARIADO pág. 25

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 3

I. Descripción del STATA 11.0

Stata es un paquete de software estadístico creado en 1985 por StataCorp. Es utilizado

BARRA DE MENU: Se encuentran los menus de file, edit, data, etc.

BARRA DE HERRAMIENTAS: Se encuentran las herramientas de Log file, do file, etc.

TABLA DE COMANDOS EFECTUADOS: Se encuentra la lista de todos los comandos efectuados.

TABLA DE COMANDOS: Tabla donde se digitan los comandos a efectuarse.

TABLA DE RESULTADOS: Se encuentran los resultados de los comandos efectuados.

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 4

II. Base de datos:

- Filtrar la base y comprobar que todos los datos estén completos.

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 5

Datos completos y sin vacíos.

Dar click en la segunda opción

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 6

están completas y no hay errores.

comas, palabras, etc. Es decir, tiene errores.

y STATA lo toma como datos MISSING o datos perdidos.

III. Do file / Log file: Permiten guardar comandos y acciones en STATA.

 Antes de empezar a utilizar los comandos en STATA es necesario utilizar la herramienta

 Guardar el archivo Log file, este se guardará en formato *.smcl

 Al finalizar el análisis, hacer click en el ícono Log file de la barra de herramientas.

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 7

Hacer click en la segunda opción y luego OK

Do file: Útil para guardar la lista de comandos utilizados en STATA

 Hacer click en el ícono “New Do-file editor”

 Se abrirá la ventana de edición de Do file. Copiar de la TABLA DE COMANDOS

 La herramienta de Do file es útil en caso de no haber usado el Log file.

 Para ello seleccionar el comando y luego “Execute do” y automáticamente se ejecutarán

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 8

IV. Etiquetar variables:

Por lo tanto se necesita poner una etiqueta para el cero y el uno.

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 9

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 10

Apply (aplicar) y cierre el editor.

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 11

 También puedes utilizar “sum varibleejemplo” para ver el resumen de la variableejemplo.

Ejemplo: tab sexo fuma

 Si queremos ver porcentajes en el mismo ejemplo:

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 12

“tab sex fuma, row” : Ver porcentajes en filas

VI. Análisis Univariado

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 13

6.1 Variables Categóricas: Se miden en Frecuencias y Porcentajes. Para ello se utiliza el

6.2 Variables Cuantitativas: Se miden de acuerdo a la Normalidad

- Si es Normal: Se mide Media y Desviación estándar.

- Si no es Normal: Se mide Mediana y Rangos

 Evaluar NORMALIDAD: Existen 4 formas para evaluar normalidad

Sesgo = 0.2239296 Kurtosis = 2.799769

Según estos resultados se concluye que la variable edad es normal.

SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA VERITAS Page 14