Вы находитесь на странице: 1из 3

1

2016365-1: Estad stica descriptiva multivariada Programa del curso I-11


Martes y jueves: 2 a.m. a 4 p.m. Campo El Pardo E-mail: cepardot@unal.edu.co as Web: http://www.docentes.unal.edu.co/cepardot/ Consultas: martes y jueves 16 a 18. Mircoles y viernes 11 a 12. Ocina: 404-325 e 4 crditos = 4 horas presenciales y 8 horas de trabajo del estudiante semanalmente. e

Prerrequisitos
Para estudiantes de la Carrera de Estad stica: Algebra matricial Los estudiantes de la carrera de estad stica aprovechan mejor esta asignatura si han tomado los cursos: Comunicacin (espa ol), Bases de datos, Dise o y desarrollo de encuestas y Metodolog o n n a. Para estudiantes de otras carreras Los cursos bsicos de estad a stica propios del plan de estudios. El curso de matemticas que contenga los temas de lgebra lineal. a a

Descripcin de la asignatura o
Aborda el anlisis descriptivo y exploratorio multivariado de tablas grandes de datos (muchas las y a columnas). Recurre a la representacin geomtrica multidimensional de las tablas de datos y a su lectura o e mediante proyecciones en planos, denominados factoriales, y a la conformacin de grupos homogneos en o e el sentido de variabilidad baja dentro de los grupos y alta entre grupos. Las representaciones geomtricas e permiten visualizar la informacin relevante contenida en las tablas de datos. El aprendizaje se consolida o mediante una aplicacin real siguiendo las pautas de la metodolog de la investigacin. o a o El estudiante que curse la asignatura y cumpla con las exigencias acadmicas, podr: e a Aplicar los mtodos empleando programas de uso libre y comercial y utilizarlos en el contexto de e situaciones espec cas. Abordar el aprendizaje de otros mtodos de la estad e stica exploratoria multidimensional. Consolidar los conocimientos sobre metodolog de la investigacin. a o Mejorar las destrezas en redaccin de textos, normas de presentacin de trabajos escritos y de o o presentacin oral de los resultados. o

Contenido
1. Introduccin (semana 1) o Mtodos estad e sticos exploratorios multidimensionales (Lectura: introduccin de Lebart, Morineau o & Piron (1995)). Lectura en l nea del manual de introduccin a R. o 2. Representacin multivariada de datos. (semana 2) o Repaso de espacios euclidianos multidimensionales (espacios vectoriales en n con producto interno). Representacin geomtrica de tablas de datos. Signicado de las estad o e sticas bsicas y de a las operaciones de centrado y reducido. Inercia y contribuciones a la inercia de las y columnas. Proyeccin sobre cualquier eje. Contribucin de las las y columnas a la inercia proyectadas sobre o o un eje. Calidad de la representacin sobre un eje. o

3. Anlisis en componentes principales - ACP. (semana3 a 5) a Objetivos del ACP. Espacio de los individuos. Espacio de las variables. Relaciones entre los dos espacios. Ayudas para la interpretacin de los ejes factoriales. Proyeccin de elementos ilustrativos. o o ACP generalizado. Anlisis en coordenadas principales. a Primer parcial (marzo 15). 4. Anlisis de correspondencias simples - ACS. (semana 6 a 8) a Objetivos del ACS Tablas obtenidas de la tabla de contingencia. Representacin geomtrica de las o e tablas de perles. El ACS como dos ACP. 5. Anlisis de correspondencias m ltiples - ACM. (semanas 9 a 11) a u Objetivos del ACM. Codicaciones de las variables cualitativas. El ACM como el AC de la tabla disyuntiva completa. El ACM como el AC de la tabla de Burt. ACM y ACS en el caso de dos variables. Segundo parcial (abril 28) 6. Mtodos de clasicacin (agrupamiento) (semanas 12 a 14) e o Objetivos de los mtodos de agrupamiento. e Indices de similitud, disimilitud y distancia entre individuos. Inercia intra y entre grupos. Clasicacin alrededor de centros mviles. Clasicacin jerrquica o o o a aglomerativa. El mtodo de Ward. Caracterizacin de las clases. Combinacin de mtodos factoriales e o o e y de clasicacin. o Tercer parcial (mayo 24) 7. Presentacin de trabajos de aplicacin (semana 15 y 16, mayo 26 y 31 y junio 1). o o

Metodolog a
Este es un curso de aprendizaje asistido. Las clases se utilizan para aclarar dudas, presentar avances de los trabajos y controlar el aprendizaje. Durante el curso se realizan varios talleres y es recomendable hacerlos en grupo (los mismos del trabajo de curso). Los talleres no tienen calicacin pero se recomienda o realizarlos por escrito para adquirir destreza en la preparacin de informes utilizando las herramientas o de edicin y las normas de presentacin de trabajos. El curso cuenta con un aula virtual donde se pone o o el programa los talleres, documentos del curso, enlaces de inters, etc. e R. Los paquetes de R que se utilizan en este curso son: FactoMineR, ade4 y FactoClass. Para evitar la proliferacin de virus y el uso ms eciente de R se recomienda utilizar el sistema operativo Linux. En o a la sala esta instalada la distribucin Ubuntu que es bastante amigable. o

Software comercial
Este semestre disponemos del SPAD versin 7 en ingls, instalado en la sala y se utilizar para los o e a talleres en clase (15 licencias simultneas). Los estudiantes pueden utilizar cualquier software comercial a para los talleres y trabajos, siempre que la Universidad tenga licencia, tales como: SAS, SPSS, Xstat (en Excel).

Calicacin o
Tres parciales 20 % c/u : 60. Trabajo de investigacin utilizando los mtodos aprendidos 40 %: propuesta: 10 % y nal: 30 %. El o e A trabajo se debe hacer en grupo de 3 estudiantes. Se recomienda usar L TEX con el tipo de documento \documentclass[report]{revcoles}. La plantilla est disponible en: a http://www.docentes.unal.edu.co/eccubidesg/docs/LaTeX/Report.zip.

Textos gu a
Lebart et al. (1995), Escoer & Pag`s (1992) y Langrand & Pinzn (2009). e o Documentos: Cabarcas & Pardo (2001), Pardo & Ortiz (2004), Pardo (2005, 2008), Bautista (1990), Bautista (1994), Morineau & Aluja (1994).

Referencias
Bautista, L. (1990), Introduccin al anlisis multivariado de datos, Folleto Coloquio Distrital de Mao a temticas y Estad a stica, Bogot. a Bautista, L. (1994), Mtodos de clasicacin, Folleto Simposio de Estadtica [sobre] Anlisis multivae o s a riado de datos, Bogot. a Benzecri, J. (1992), Correspondence Analysis Handbook, Marcel Dekker. Cabarcas, G. & Pardo, C.-E. (2001), Mtodos estad e sticos multivariados en investigacin social, Simposio o de Estadstica . *http://www.docentes.unal.edu.co/cepardot/docs/SimposiosEstadistica/ Escoer, B. & Pag`s, J. (1992), Anlisis factoriales simples y mltiples. Objetivos, mtodos e interpretae a u e cin, Universidad del Pais Vasco, Bilbao. o Greenacre, M. (2007), Correspondence Analysis in Practice, 2 edn, Chapman & Hall, Boca Raton, FL. Jambu, M. (1983), Cluster Analysis and Data Analysis, North-Holland, Amsterdam. Langrand, C. & Pinzn, L. M. (2009), Anlisis de datos. Mtodos y ejemplos, Editorial Escuela Colomo a e biana de Ingenier Bogot. a, a Lebart, L., Morineau, A. & Piron, M. (1995), Statisitique exploratoire multidimensionnelle, Dunod, Paris. Lebart, L., Morineau, A. & Warwick (1984), Multivariate Descriptive Statistical Analysis, Wiley, New York. Morineau, A. & Aluja, T. (1994), Analisis de correspondencias, Folleto Simposio de Estadtica [sobre] s Anlisis multivariado de datos, Bogot. a a Pardo, C. E. (2005), Anlisis de correspondencias de tablas de contingencia estructuradas, in Memorias a Coloquio Distrital de Matemticas y Estad a stica, Universidad Distrital, pp. 6590. *http://www.docentes.unal.edu.co/cepardot/docs/ColoquioDistritalMatEst/AnalCorresTCE.pdf Pardo, C. E. (2008), Geometr euclidiana en estad a stica: mtodos en ejes principales. e *http://www.docentes.unal.edu.co/cepardot/docs/Conferencias/ACPgeometriaEuclidiana.pdf Pardo, C. E. & Ortiz, J. (2004), Anlisis multivariado de datos en R, in Simposio de Estad a stica, Universidad Nacional de Colombia. Departamento de Estad stica, Cartagena. *www.docentes.unal.edu.co/cepardot/docs/SimposiosEstadistica/PardoOrtiz04.pdf Pe a, D. (2002), Anlisis de datos multivariantes, McGraw-Hill, Madrid. n a

Вам также может понравиться