Вы находитесь на странице: 1из 4

UNIVERSIDAD NACIONAL JORGE BASADRE

GROHMANN

FACULTAD DE INGENIERÍA

ESCUELA PROFESIONAL DE INGENIERÍA EN INFORMÁTICA Y


SISTEMAS

PROYECTO DE MACHINE LEARNING

REGRESIÓN

CURSO:

Analítica de datos

INTEGRANTES:

SEMESTRE: X Semestre

AÑO: Quinto año

TACNA - PERÚ
2019
I. Introducción

En este proyecto trabajaremos paso a paso cómo completar un proyecto de

machine learning en R. Trabajaremos un problema de modelado predictivo de regresión

de estudio de caso en R que incluye cada paso del proceso de machine learning.

II. Objetivos

 Cómo trabajar a través de un problema de regresión predictiva de

modelos.

 Cómo utilizar transformaciones de datos para mejorar el rendimiento del

modelo.

 Cómo utilizar el ajuste de algoritmos para mejorar el rendimiento del

modelo.

 Cómo utilizar métodos de conjunto y ajustar de métodos de conjunto

para mejorar el rendimiento del modelo.

III. Definición de la problemática

Para este proyecto, trabajaremos el conjunto de datos Boston House Price. Cada

registro en la base de datos describe un suburbio de la ciudad de Boston. Los datos se

extrajeron del área estadística metropolitana estándar de Boston (SMSA) en 1970.


Los atributos se definen de la siguiente manera (tomados del repositorio

UCI Machine Learning):

 CRIM: tasa de criminalidad per cápita por ciudad.

 ZN: proporción de tierra residencial zonificada para lotes de más de

25000 pies cuadrados.

 INDUS: proporción de acres de negocios no minoristas por ciudad.

 CHAS: variable ficticia del río Charles (= 1 si el trecho delimita el río; 0

de lo contrario).

 NOX: concentración de óxidos nítricos (partes por 10 millones).

 RM: número medio de habitaciones por vivienda.

 AGE: proporción de unidades ocupadas por el propietario construidas

antes de 1940.

 DIS: distancias ponderadas a cinco centros de empleo de Boston.

 RAD: índice de accesibilidad a autopistas radiales.

 TAX: tasa de impuesto a la propiedad de valor total por USD10000.

 PTRATIO: proporción alumno-profesor por ciudad.

 B: 1000(Bk − 0.63)2 donde Bk es la proporción de personas de color por

ciudad.

 LSTAT: % menor estado de la población.

 MEDV: valor medio de las viviendas ocupadas por sus propietarios en

USD1000.

Podemos ver que los atributos de entrada tienen una mezcla de muy diferentes

unidades.

Вам также может понравиться