Вы находитесь на странице: 1из 6

Describe el procedimiento que utilizaras para resolver los siguientes problemas con

las herramientas del programa R.



Problema 2.1. Crea una tabla "two-way" utilizando los dos vectores de datos siguientes
para que contenga la frecuencia de ocurrencia de los elementos.
(Soltero, Soltero, Casado, Divorciado, Divorciado, Soltero, Soltero,
Divorciado)

(Joven, Joven, Maduro, Joven, Joven, Mayor de 60, Maduro, Mayor de 60)

Procedimiento
Para construir una tabla de doble entrada con el valor de la frecuencia, podemos
utilizar el comando table().
Abrimos el editor y realizamos lo siguiente:
1. Primero introduciremos los datos usando el comando
bsico

Aqu, equivale al nombre del vector. Los datos, al ser cualitativos,
debenescribirse entre comillas.

2. Despus realizaremos un conteo de datos usando el comando .Este
comando nos arrojar el nmero total de elementos que integran el conjunto.
Dicho valor es necesario si queremos calcular la frecuencia relativa.

3. Finalmente usamos el comandopara generar una tabla de frecuencias
absolutas.Tambin podemos usarpara obtener las frecuencias
relativas.




Problema 2.2. Determina si los datos que se proporcionan en el archivo adjunto
(datos.txt), ubicado en la pestaa de la unidad 2, tienen una distribucin
normal. Para este anlisis podrs utilizar .

Procedimiento

Abrimos el editor y realizamos lo siguiente:

1. Creamos el vector introduciendo los datos del archivo datos.txt usando el
comando
De esta manera podemos ingresar todos los datos sin
necesidad de escribirlos uno por uno.

2. Graficamos las funciones quantile de la muestra, es decir los cuantilesmuestrales vs.
los cuantiles tericos de la distribucin Normal, usando el comando .

El comando compara grficamente la distribucin de una muestra con una
distribucin normal (si los valoresestn alineados, la distribucin es normal).



Problema 2.3. Calcula el intervalo de confianza utilizando una distribucin t con
los siguientes datos:

Media muestral = 5
Desviacin estndar muestral = 2
Tamao de la muestra = 20
Nivel de confianza = 95%

Procedimiento

Recordemos que un intervalo de confianza es un rango de valores (calculado en una
muestra) en el cual se encuentra el verdadero valor del parmetro, con una
probabilidad determinada. Calcular el Intervalo de confianza utilizando una
distribucin t es similar a usar una distribucin normal (), la diferencia es que
se usa el comando asociado a la distribucin t







Abrimos el editor y realizamos lo siguiente:

1. Definimos las variables correspondientes a los valores dados:





2. Determinamos el margen de error de acuerdo a un nivel de confianza del 95%


Recordemos que el error estndar es la desviacin estndar de la distribucin
muestral.Podemos determinarlo con la instruccin

Por otro lado, si el tamao de la muestra es entonces decimos que la
distribucin t tiene grados de libertad (nmero de variables independientes
de la muestra), esto es

As, el margen de error vendr dado por la expresin

3. Finalmente podremos definir el intervalo de confianza:















Problema 2.4. Encuentra el valor p para el conjunto de datos que se proporcionan en el
archivo adjunto (datos.txt). Utiliza una prueba de hiptesis bilateral.

Procedimiento

Un contraste de hiptesis es un proceso estadstico que permite elegir una hiptesis de
trabajo de entre dos posibles y antagnicas. El contraste comienza con la formulacin
de dos hiptesis sobre el valor de algn parmetro poblacional, siendo ambas
incompatibles (si una es cierta, la otra necesariamente ha de ser falsa). Supondremos
cierta una de ellas, a la cual llamaremos hiptesis nula

, y trataremos de determinar
hasta qu grado las observaciones registradas son coherentes con

. Slo en caso de
que haya fuertes indicios de incompatibilidad entre el supuesto de que

sea cierta y
los datos obtenidos empricamente, descartaremos

como hiptesis de trabajo y en su


lugar tomaremos como cierta la hiptesis alternativa

.

Por otro lado, y en un sentido amplio el valor pes una medida de la credibilidad de la
hiptesis nula. Cuanto ms pequeo es el valor p, menos probable es que

sea
verdadera y por ello, si es menor que el nivel de significacin,

se rechaza.

Dada la poblacin (que sigue una distribucin cualquiera), con media y desviacin
estndar desconocidas, se trata de contrastar el tests siguiente:
{





Estadstico de contraste




El para este contraste resulta

{|

| ||}

Para calcular la probabilidad anterior es conveniente dividirla en las siguientes
probabilidades:

{

} {

}

Notemos que por la simetra de la distribucin t de Student ambas probabilidades son
iguales.



Por tanto:

{

}



Entonces, abrimos el editor y realizamos lo siguiente:

1. Creamos un vector introduciendo los datos del archivo datos.txt usando el comando


2. Usamos el comando lenght() para determinar la longitud del arreglo de datos.

3. Escribimos el estadstico de contraste:

4. Finalmente, calculamos usando la instruccin



Problema 2.5. a) Crea el siguiente data-frame (hoja de datos) en el que la columna f sea un
factor.





Procedimiento

Una forma importante en que R puede almacenar datos es como un factor. Muchas veces
un experimento incluye pruebas para los diferentes niveles de una variable. Por ejemplo,
cuando miramos el efecto del dixido de carbono en la tasa de crecimiento de un rbol
podemos tratar de observar cmo los diferentes rboles crecen cuando estn expuestos a
diferentes concentraciones predeterminadas de dixido de carbono. Los diferentes
niveles son tambin llamados factores.
Entonces, abrimos el editor y realizamos lo siguiente:


1. Creamos cada vector con el comando
2. Con la instruccin podemos crear
el , la coleccin de filas y columnas de la misma dimensin.
3. Finalmente, con el comando transformamos la columna en un factor

Вам также может понравиться