Вы находитесь на странице: 1из 8

TUTORIAL PARA PRACTICA CON R

1. Digitar los datos de la aplicación contable. Es recomendable que los encabezados de columnas
no lleven espacios.
2. Abrir el menú Archivo y escoger Guardar Como y en el cuadro desplegable Tipo, escoja
CVS(delimitado por comas)

3. Escriba el nombre del archivo de texto. Ejemplo: PROVEEDORES.csv


4. Haga clic sobre el botón Sí de cada cuadro de sugerencia que aparezca a continuación.
5. Entre a R, si no lo ha hecho antes.
6. Establezca la carpeta donde guardo el archivo como el directorio de trabajo. Ejemplo:
setwd("c:/FRANK/DATOS")
Esto se hace para no tener la necesidad de escribir la ruta cada vez que se haga referencia al
archivo.
7. Escriba el siguiente comando para crear un objeto R en el que se copie el contenido del archivo
csv que creo con Excel: PROV=read.table(file="PROVEEDORES.csv",header=TRUE,sep=",") Esto
quiere decir: que lea una tabla llamada PROVEEDORES.TXT cuyas variables están separadas por
tabuladores (sep=",") y que tiene va a diferenciar los encabezados de columnas o nombres de
variables de los datos(header=TRUE) y el contenido de esa tabla se le asigna al objeto PROV.
8. Limpie la ventana pulsando las teclas CTRL L (opcional).
9. Para ver contenido del objeto PROV, escriba: PROV pulse la tecla Enter. APARECE EL
RESULTADO.
10. Para ver la cantidad de filas y columnas que tiene nuestra tabla: dim(PROV)

ANALISIS DE SEGMENTACION

11. Sacamos un matriz con las 2 últimas columnas de nuestra matriz fuente. Esto es porque estas
son las que tienen valores numéricos que son los que vamos a utilizar.

PROV.SU2C = PROV[,-c(1)]. Aquí le especificamos que reste desde la columna 1 hasta la ocho de
las diez columnas que tiene nuestra matriz PROV (PROV[,-c(1:8)].) , luego asignará el resultado al
objeto PROV.SU2C(sacar 2 columnas es lo que quiere decir la extensión SU2C).

12. Creamos un vector u objeto que contenga el cálculo de la mediana de las dos columnas.
PROV.MEDNC = apply(PROV.SU2C,2,median)
Luego visualizamos el contenido del Nuevo vector u objeto.
PROV.MEDNC

13. Creamos un vector u objeto que contenga el cálculo de la media de las dos columnas.
PROV.MEDSC = apply(PROV.SU2C,2,mad)
Luego visualizamos el contenido del Nuevo vector u objeto.
PROV.MEDSC

14. Estandarizamos restando la media y dividiendo por la desviación aritmética de la


mediana mad (Median Absolute Deviation):
PROV.SU2CS = scale(PROV.SU2C, center=PROV.MEDNC, scale=PROV.MEDSC)
Luego visualizamos el contenido del Nuevo objeto con los resultados:
head(PROV.SU2CS)

CÁLCULO DE UNA MATRIZ DE DISTANCIAS

15. Para calcular la matriz de distancia Euclidiana lo primero que haremos será crear una matriz
llamada PROV.DISTE:
PROV.DISTE = dist(PROV.SU2CS)
Para ver el triángulo inferior de la matriz:
PROV.DISTE

16. Para convertir la matriz de distancia en una matriz regular:


PROV.MDE = data.matrix(PROV.DISTE)
write.csv(PROV.MDE, file = "DATOSPROV.csv")
MATRIZ=read.table("DATOSPROV.csv")
MATRIZ

17. Par las coordenadas: PROV.COREU <- cmdscale(PROV.DISTE )


Para ver los resultados: PROV.COREU
PROV.DAT=PROV[,-c(2:8)]
plot(PROV.COREU[,1], PROV.COREU[,2], type="n", xlab="", ylab="")
text(jitter(PROV.COREU [,1]), jitter(PROV.COREU [,2]), rownames(PROV.DAT), cex=0.8)
abline(h=0,v=0,col="gray75")
grid()
18. Ahora procedemos a hacer el dendograma con enlace (link) average:
PROVHCLUST.HCC = hclust(PROV.DISTE, method = "average")
PROVHCLUST.HCC

plot (PROVHCLUST.HCC)
abline(h=6,v=0,col="gray75")
abline(h=4,v=0,col="gray75")
abline(h=2.75,v=0,col="gray75")
Para colocarles los nombres de los proveedores como leyenda al dendograma:

plot(PROVHCLUST.HCC, labels=PROV.DAT[,1])
abline(h=6,v=0,col="gray75")
abline(h=4,v=0,col="gray75")
abline(h=2.75,v=0,col="gray75")
abline(h=0,v=0,col="gray75")

19. Hhhh
PROV.GrHCC2 = cutree(PROVHCLUST.HCC,2)
PROV.GrHCC2
PROV.GrHCC3 = cutree(PROVHCLUST.HCC,3)
PROV.GrHCC3
PROV.GrHCC4 = cutree(PROVHCLUST.HCC,4)
PROV.GrHCC4

20.

Вам также может понравиться