Introducción al Machine Learning con MATLAB. Erik Cuevas Jiménez

Чтение книги онлайн.

Читать онлайн книгу Introducción al Machine Learning con MATLAB - Erik Cuevas Jiménez страница 5

Автор:
Серия:
Издательство:
Introducción al Machine Learning con MATLAB - Erik Cuevas Jiménez

Скачать книгу

métodos numéricos, que pueden ser adaptados a aplicaciones particulares. Bajo tales condiciones, el usuario puede estar más concentrado en la estructura de su aplicación que en la programación misma. Presentar el código de los programas como ayuda al lector constituye uno de los principales puntos del libro en el área de las ciencias de la informática. Además, colgarlos en una página web puede derivar en su desaparición con el transcurso de los años. Así, una de las principales características de este libro reside en que todos los enfoques presentados han sido programados en MATLAB, y su código se presenta impreso en el libro. Resulta importante hacer notar, igualmente, que los códigos contenidos en el libro no intentan ser eficientes o competitivos, desde la perspectiva de la programación. En lugar de esto, se ha decidido presentar el código de la implementación de cada método de una forma pedagógica, de tal manera que el lector comprenda cómo el método se comporta y ejecuta.

      Con la notación usada en el libro, se asume que el lector se halla familiarizado con conceptos básicos de álgebra, geometría, teoría de conjuntos y cálculo. En términos generales, un lector no aprovechará esta obra si no tiene la intención de implementar informáticamente los métodos presentados. Bajo tales condiciones, se considera como prerrequisito contar con conocimientos básicos de programación.

      Debido a su contenido y a la estructura del libro, este resulta adecuado para estudiantes y profesionales en el área de ciencias de la informática, inteligencia artificial, investigación de operaciones, matemáticas aplicadas y algunas otras disciplinas. De igual manera, muchos ingenieros que trabajan en la industria pueden encontrar interesante el contenido de la obra. En este caso, las sencillas exposiciones y el código provisto pueden servir de ayuda para la rápida solución a problemas de extracción de información a partir de datos que, normalmente, surgen en varios nichos y proyectos industriales o comerciales.

      Escribir un libro de Machine Learning parece intrascendente. Existen ya varios libros de texto y de consulta dirigidos a lectores con diferentes niveles de conocimiento en la materia. Sin embargo, de las decenas de obras que existen, estos se reducen a prácticamente muy pocos, si se restringen las opciones a los escritos en español. Bajo tales circunstancias, cuando se concibió el proyecto de escritura se decidió que era necesario tener algo que decir sobre el orden, la profundidad y la manera de exponer los conceptos del Machine Learning en nuestro idioma.

      Nuestra premisa original fue que los métodos de Machine Learning pueden exponerse de manera comprensible para lectores con poco entrenamiento matemático. En consecuencia, intentamos escribir un libro cuyo contenido fuese no solo entendible, sino aplicable por cualquier estudiante de licenciatura. Aunque algunos conceptos pueden ser complejos para su comprensión cabal, tratamos de exponerlos con claridad y sin pretender disimular su dificultad implícita. Sin sacrificar las necesidades inmediatas del lector, subrayamos la importancia de que se comprendan los métodos descritos, bajo el supuesto de que, a veces, resulta preferible no usar tales métodos a usarlos mal.

      En el largo proceso de escribir el libro, nuestra perspectiva ha variado. Planeado para un curso completo, el material que presentamos puede cubrirse en un semestre. El libro se compone de 10 capítulos. Los detalles en el tratamiento de cada uno de ellos se describen a continuación.

      En el capítulo 1 se presentan los conceptos básicos del aprendizaje máquina, que permitirán al lector familiarizarse con el tema. Además, se introducen los pasos básicos en la aplicación del aprendizaje máquina. Por último, se discute acerca de la importancia de los tipos de datos, su preprocesamiento y su despliegue. Los objetivos principales de este capítulo residen en aprender, de forma rápida y sencilla, el proceso de aplicación del aprendizaje máquina, así como comprender sus principios.

      El capítulo 2 es considerado también introductorio. En él se abordarán las herramientas matemáticas, las cuales nos ayudarán a comprender, de una mejor manera, las técnicas de aprendizaje máquina que se revisarán en capítulos posteriores. En este capítulo se tratarán las bases de probabilidad, álgebra lineal y estadística.

      En el capítulo 3, por su parte, se estudiará la problemática de la clasificación, uno de los principales temas del aprendizaje máquina. El concepto principal de la clasificación es la correcta separación de elementos en grupos o clases, de modo que, cuando un nuevo elemento es adquirido, pueda etiquetarse dentro del grupo con el cual comparta más características, esto con el mínimo error posible en la clasificación. Ciertamente, la clasificación no representa una tarea fácil de realizar, debido a muchos factores que han de ser considerados, por lo que existe una amplia variedad de técnicas para llevar a cabo dicho trabajo. En este capítulo se describen diferentes métodos de clasificación para distintos esquemas, en los que un solo clasificador no podría realizar la separación de manera correcta.

      En el capítulo 4 se analizan diversas técnicas clásicas de predicción mediante el ajuste de parámetros lineales. Este tipo de metodologías son muy populares dentro del área de aprendizaje automático debido, principalmente, a que la matemática con que se las describe se presenta relativamente sencilla y de fácil implementación. La idea fundamental en este tipo de metodologías de regresión resulta muy similar a la de clasificación analizada en el capítulo anterior. La diferencia radica en que, mientras que con la clasificación se predice una variable de tipo categórica, en la regresión se infiere una variable de respuesta continua. En el desarrollo del capítulo se analiza de manera detallada las bases matemáticas de las distintas técnicas de regresión, así como su implementación en el ambiente del software MATLAB®.

      En el capítulo 5 se realiza una introducción a varios paradigmas de agrupamiento y asociación de datos. En él se analizan los principales enfoques de agrupamiento, como lo son los basados en centroide, los jerárquicos, los basados en principios difusos y aquellos en los que se considera la optimización de una función objetivo. En la estructura del capítulo, cada técnica es tratada de forma individual analizando primeramente sus conceptos teóricos. Después, un ejemplo numérico tiene el objetivo de facilitar su comprensión. Finalmente, una implementación sencilla en MATLAB es incorporada y discutida.

      En el capítulo 6 se aborda el tema de la reducción de dimensionalidad, proceso en el cual, teniendo datos con altas dimensiones, estos son mapeados en un espacio con una menor dimensionalidad. Tales técnicas se emplean cuando se tiene una gran cantidad de datos en altas dimensiones, esto se hace para poder tratar dichos datos de una manera más práctica con un esfuerzo computacional menor, al igual que se evita para ciertos casos la mala generalización para técnicas de aprendizaje. Existen varias técnicas para llevar a cabo dicha reducción, en este capítulo se analizarán las técnicas más utilizadas para la reducción de dimensionalidad.

      En el capítulo 7 se expone una introducción a varios paradigmas importantes del Machine Learning, como lo son los árboles de decisión y el método Bootstrap. Los árboles de decisión son herramientas importantes para la clasificación y estimación de datos. Estos presentan una estructura de subdivisión de la información a partir de umbrales, y aportan información completa acerca de cómo los datos se dividen para efectuar su propósito de clasificación o estimación. Esta información resulta importante para analizar la naturaleza del conjunto de datos. Por otro lado, el enfoque de Bootstrap permite caracterizar el valor medio y el error producido por la estimación de un parámetro estadístico obtenido de un conjunto de datos. Su uso es importante en el Machine Learning, ya que obtener esta información por medios estadísticos tradicionales resulta extremadamente complejo.

      En

Скачать книгу