Introducción al Machine Learning con MATLAB. Erik Cuevas Jiménez
Чтение книги онлайн.
Читать онлайн книгу Introducción al Machine Learning con MATLAB - Erik Cuevas Jiménez страница 4
10.5. El balance entre el sesgo y la varianza
10.6.1. Técnicas comunes de validación cruzada
10.7. Métricas de error en regresores lineales
PRÓLOGO
Durante muchos años, los humanos hemos buscado detalles estructurales en la información, tales como reglas o patrones con los que describir, con precisión, la manera en cómo funcionan los sistemas importantes que nos rodean, sean estos sistemas agrícolas, biológicos, físicos, financieros, etc. Estos detalles estructurales de la información permiten comprender mejor un sistema, predecir con precisión su comportamiento futuro y, en última instancia, manipularlo. Sin embargo, el proceso de encontrar la estructura adecuada que parece describir un sistema dado no ha sido históricamente una tarea sencilla. Todavía, en el pasado reciente, los datos disponibles que registran alguna característica emitida por un sistema han sido un elemento extremadamente escaso. Además, la capacidad para calcular, para probar varios métodos y verificar cuál presenta un mejor funcionamiento se ha limitado a lo que se podía lograr con calculadoras o equipos con escasos recursos informáticos. Ambos factores limitaron la gama de problemas que, en el pasado, se pudieron investigar y los forzaron, inevitablemente, a utilizar enfoques filosóficos y/o visuales para la extracción de conocimiento a partir de la información. Hoy, sin embargo, se tiene un mundo inundado de datos, y tenemos un poder informático impresionante al alcance de la mano. Bajo estas condiciones, se puede actualmente abordar una gran gama de problemas mucho más compleja, y adoptar un enfoque mucho más empírico para la extracción de información que en el pasado. El Machine Learning (o «aprendizaje de máquinas», en castellano), el tema de este libro, es una expresión usada para describir una colección amplia (y cada día creciente) de métodos de extracción de conocimiento diseñados para identificar, adecuadamente, información del sistema de manera empírica a partir de un conjunto de datos.
El Machine Learning representa una herramienta importante para la exploración de la extracción de conocimiento. Su principal objetivo reside en construir modelos que permitan describir posibles patrones estructurales en la información a partir de los datos, con el objetivo de tomar decisiones o hacer predicciones. El Machine Learning es un área que ha crecido vertiginosamente en los últimos años requiriendo, cada vez más, de técnicas sofisticadas que puedan tratar problemas más complejos de una manera flexible y con capacidades de adaptación. El Machine Learning abarca un numeroso conjunto de disciplinas tales como las matemáticas, la estadística, la informática, la ingeniería, etc.
El objetivo de este libro radica en brindar una visión particular de los principales métodos de Machine Learning y su implementación. La idea es proveer de los principales conceptos en los que se basan dichos métodos, y aplicarlos a problemas típicos del procesamiento de datos. Existe una gran cantidad de libros centrados solo en los aspectos teóricos de las técnicas de Machine Learning. Por otro lado, existe también una gran cantidad de bibliografía que brinda únicamente un nivel introductorio, sin considerar los principales detalles de los métodos. En general, en tales libros no se considera ni siquiera el aspecto práctico ni de implementación. Bajo dichas condiciones, con este libro se pretende llenar el espacio entre esas dos perspectivas. De esta manera, se intenta abordar específicamente las características importantes de los enfoques del Machine Learning, de tal modo que el lector pueda implementarlos y utilizarlos sin problemas a casos reales.
En la última década, el número de usuarios de Machine Learning ha crecido de forma espectacular. Partiendo de un círculo relativamente pequeño en los departamentos de Informática, Ingeniería y Matemáticas, los usuarios de Machine Learning ahora incluyen a estudiantes e investigadores de todas las áreas del conocimiento, así como a miembros de la industria, científicos de datos, emprendedores y entusiastas del Machine Learning. Este libro es el resultado de un desmantelamiento completo del plan de estudios estándar del Machine Learning en sus componentes más fundamentales, y un reensamblaje de esas piezas (cuidadosamente pulidas y organizadas), que creemos beneficiarán más a la audiencia cada vez mayor de estudiantes. Contiene descripciones intuitivas, pero rigurosas, de los conceptos más fundamentales y necesarios para analizar información a partir de datos.
En esta obra se presentan enfoques para la exploración y el análisis de datos. En particular, se discute acerca de los esquemas de Machine Learning y de Data Mining. Aunque el libro incluye diferentes aspectos matemáticos de la teoría de Machine Learning y de los operadores de reconocimiento de patrones, no debe ser considerado un libro meramente teórico. Su contenido se encuentra más relacionado con los aspectos prácticos de tales métodos, y su aplicación como herramientas de ciencias de la computación. El principal objetivo reside en brindar una visión unificada de los métodos de Machine Learning, de tal forma que se presentan los principios fundamentales, así como los métodos considerados esenciales.
Los esquemas de Machine Learning tratados en este libro son examinados con el objetivo de que sean implementados y utilizados. Esta obra, a diferencia de otras existentes sobre Machine Learning o ciencia de datos, ha sido escrita desde una perspectiva pedagógica. Su material ha sido tratado de tal forma que el lector es asistido para obtener una idea clara, pero, al mismo tiempo, rigurosa de cada método. En muchos libros se discute acerca de una gran variedad de métodos como un recetario sin ningún soporte teórico. Por otro lado, en otros libros también se consideran los enfoques de Machine Learning de forma solamente teórica, siendo no totalmente accesibles a estudiantes o profesionales de otras áreas ajenos a las ciencias de la informática, como lo son la administración o la economía. Por el contrario, se pretende hacer un compromiso entre ambos objetivos, presentando cada enfoque con el contenido teórico necesario, además de información de fácil implementación.
El libro provee, así, de los conceptos necesarios que habilitan al lector a implementar y modificar los métodos de Machine Learning, con el fin de obtener las habilidades proyectadas en las necesidades específicas de cada problema. Para ello, se introducen numerosos ejemplos de problemas y soluciones, con los que se demuestra la potencia de tales métodos. Se provee también, con cada enfoque, de ejemplos simples fáciles de entender, preparados de una manera intuitiva al lector, con los que esperar el resultado fácilmente. Esto contrasta con la mayoría de los libros de esta área, donde se presentan ejemplos de tal complejidad que resulta difícil el entendimiento del propio problema, sin contar con la comprensión de su solución.
La obra se basa enteramente