En la asignatura de inteligencia artificial que se impartía en mi facultad (de Física) a mediados de los noventa, el grueso del temario se dedicaba a estudiar sistemas expertos, pese a que estos ya empezaban a perder prestigio en el ámbito académico. El concepto de red neuronal también aparecía, aunque creo que de pasada. Leyendo a toro pasado sobre aquella época resulta claro que esta disciplina atravesaba un período de crisis.

Han pasado más de veinte años, y el mundo de la inteligencia artificial de hoy no puede ser más distinto: una disciplina de moda, que atrae dinero de la empresa privada en cantidades increíbles, y que aparece en los medios de comunciación asociada a historias de éxito como la derrota de uno de los mejores jugadores de Go de la historia o la impresionante mejora del servicio de traducción de Google.

Las inteligencias artificiales leen código ofuscado para evadirse
Las inteligencias artificiales leen código ofuscado para evadirse

Deep learning

Detrás de este resurgir no hay un cambio de paradigma ni un descubrimiento revolucionario. La diferencia con el pasado es más cualitativa que cuantitativa: los ordenadores de hoy en día son mucho más rápidos, y existen muchos más datos con los que entrenar a los algoritmos utilizados. Todos estos grandes avances están basados en los principos sobre redes neuronales definidos en los años cincuenta, reencarnados en la actualidad en la disciplina conocida como machine learning, y su hija aventajada, deep learning.

Machine learning (Aprendizaje automático es una de las traducciones al español, yo voy a mantener el término en inglés) es una rama de la inteligencia artificial que estudia la capacidad de los ordenadores para aprender. Existen varias definiciones formales de qué significa aprender en este contexto, pero podrímos decir que un ordenador aprende cuando realiza una tarea mejor cuanto más veces la realiza, es decir, según va adquiriendo experiencia.

Deep learning (Aprendizaje profundo parece ser el término más habitual en español) es, a su vez, una rama del machine learning. Lo que caracteriza al machine learning es el tipo de algoritmos que utiliza: jerárquicos, no lineales y con múltiples capas.

En las profundidades del aprendizaje
En las profundidades del aprendizaje

El objeto de esta serie de entradas es dejar por escrito algunas ideas básicas de uno de los libros que estoy leyendo: Deep Learning, de Ian Goodfellow, Yoshua Bengio y Aaron Courville. Este libro está destinado a estudiantes universitarios y no es una lectura ligera, pero me decidí a leerlo porque tiene muy buenas críticas.

Bueno, también me decidí a leerlo porque está disponible de forma gratuita en esta web. Esta web incluye también algunas diapositivas para exponer cada tema, orientadas a profesores.

Mi plan es dedicar una entrada a cada tema, haciendo un pequeño resumen del mismo. Es posible que alguno de los temas requiera más de una entrada.