Академический Документы
Профессиональный Документы
Культура Документы
CHALCO
INGENIERÍA INFORMÁTICA
GESTION DE DATOS
GRUPO: 6951
INDICE
MACHINE LEARNING__________________________________________________________________3
TIPOS DE MACHINE LEARNING_________________________________________________________3
APRENDIZAJE SUPERVISADO:______________________________________________________________4
APRENDIZAJE NO SUPERVISADO:___________________________________________________________4
APRENDIZAJE POR REFUERZO:_____________________________________________________________4
LIBRERÍAS DE PYTHON UTILIZADAS EN MACHINE LEARNING_________________________________5
MATPLOTLIB_______________________________________________________________________________5
SEABORN__________________________________________________________________________________6
NUMPY____________________________________________________________________________________6
PANDAS___________________________________________________________________________________7
DESARROLLO_________________________________________________________________________7
CONCLUSIONES_______________________________________________________________________11
BIBLIOGRAFIAS_______________________________________________________________________12
MACHINE LEARNING
Machine Learning es una disciplina científica del ámbito de la Inteligencia Artificial que
crea sistemas que aprenden automáticamente. La máquina que realmente aprende es un
algoritmo que revisa los datos y es capaz de predecir comportamientos
futuros. Automáticamente, también en este contexto, implica que estos sistemas se
mejoran de forma autónoma con el tiempo, sin intervención humana. Veamos cómo
funciona.
En la informática clásica, el único modo de conseguir que un sistema informático hiciera
algo era escribiendo un algoritmo que definiera el contexto y detalles de cada acción.
APRENDIZAJE SUPERVISADO:
APRENDIZAJE NO SUPERVISADO:
Una de las fases del proceso de Machine Learning más importantes es entender el
problema que vamos a resolver. Una forma que tenemos de mejorar nuestra comprensión
del problema es entender mejor los datos. La visualización de datos nos ayuda a entender
mejor tanto los datos y como el problema.
Así mismo, la visualización de datos será también muy útil para comprender los resultados
y analizar los errores. Aunque hay muchas librerías en python para la visualización de
datos, nos vamos a concentrar en: matplotlib, seaborn y bokeh por el momento.
MATPLOTLIB
NUMPY
PANDAS
Pandas es una de las librerías de python más útiles para los científicos de datos. Las
estructuras de datos principales en pandas son Series para datos en 1 dimensión
y DataFrame para datos en 2 dimensiones. Estas son las estructuras de datos más
usadas en muchos campos tales como finanzas, estadística, ciencias sociales y muchas
áreas de ingeniería. Pandas destaca por lo fácil y flexible que hace la manipulación de
datos y el análisis de datos.
DESARROLLO
Se realiza una data frame mediante la creación de una variable llamada “casas“que por
medio de pandas leerá el archivo csv para su posterior verificación de los datosque
contienen la base de datos.
Para la verificacion de la base de datos se mandan a traer las caracteristicas dentro de
la variable x mediante una orden de codigo en donde se observan los campos que la
conforman y el total de datos capturados con referencia a las casas para su posterior
venta.
Una vez llevada la obtención de datos se llevara a cabo el proceso de machine learnin
con el dataset de casas ,lo dividimos en datos de prueba y datos de entrenamiento
Se crean 4 variables para los datos de prueba y entrenamiento de los cuales se toma
un 30 % de los datos para prueba y especificamos que se recojan de forma aleatoria, a
su vez especificamos que para el entrenamiento le vamos a dejar el 70% de los datos
Se entrena el modelo por medio de un método llamado fit para el cual creamos una
variable que será una instancia de “linear regressión model” y sobre la misma le
aplicamos fit que es entrenar , y le asignamos los datos de entrenamiento.
De acuerdo a los datos arrojados podemos visualizar que tan bueno es el modelo por
medio de un gráfico de tipo scater donde podemos observar que los puntos se acercan
mucho a los valores de la recta que vendrían siendo los datos reales por lo cual
podemos decir que nuestro modelo es muy bueno
print(metrics.mean_squared_error(y_test, predicciones))
resultado=10068422551.401144
Otra métrica seria el mrse que sería la raíz cuadrada de la media a los errores al
cuadrado
print(np.sqrt(metrics.mean_squared_error(y_test, predicciones)))
resultado=100341.52954485567
CONCLUSIONES
https://www.managementsolutions.com/sites/default/files/publicaciones/esp/machine-
learning.pdf
https://www.iaa.csic.es/python/curso-python-para-principiantes.pdf
https://iartificial.net/librerias-de-python-para-machine-learning/
https://www.ibm.com/downloads/cas/GB8ZMQZ3
http://docs.python.org.ar/tutorial/pdfs/TutorialPython2.pdf
https://iaarbook.github.io/ML/ machine-learning.pdf