Pasar al contenido principal

Aprendizaje automático

También conocido como machine learning (ML), el aprendizaje automático es una rama de la inteligencia artificial (IA) centrada en la creación de sistemas informáticos con capacidad de aprender y realizar tareas sin instrucciones explícitas. Se trata de programas que pueden modificar su comportamiento al exponerse a nuevos datos, con los que crean patrones y reajustan sus acciones para mejorar o personalizar su respuesta. Dicho de forma sencilla, lo que hace el aprendizaje automático es usar datos para responder preguntas.

En vez de decirles paso a paso y caso por caso, cómo hacer algo, los sistemas de ML “aprenden” procesando repetidamente “datos de entrenamiento” (conjuntos representativos de información de muestra). Los resultados del procesamiento se califican en función de su proximidad al resultado deseado. Este proceso se va repitiendo, y los algoritmos y parámetros con mejor puntuación se utilizan como base para los nuevos.

La característica esencial de los sistemas de aprendizaje automático es que mejoran su desempeño con la experiencia y los datos, es decir: aprenden.

El ML es útil, por ejemplo, cuando un conjunto de datos de entrada es masivo o inviable de procesar con un algoritmo escrito por un ser humano.

Un sistema o una máquina pueden aprender de varias maneras. Los diferentes enfoques del aprendizaje automático varían en función de los tipos de problemas que resolverán, así como del tipo y la cantidad de retroalimentación que el programador aporte. El aprendizaje automático se desarrolla a través de distintos tipos de algoritmos (o tipos de aprendizaje):

  • Algoritmos supervisados / Aprendizaje supervisado: Pueden aplicar lo aprendido en el pasado a los nuevos datos. Cada dato de entrenamiento tiene una entrada y una “etiqueta” (una salida o respuesta óptima predefinida). El sistema ejecuta una función objetivo para intentar llegar a la salida asociada a esa entrada. A continuación, itera sobre esta función, modificando los parámetros hasta que la función pueda procesar con éxito datos no incluidos en el conjunto de entrenamiento.
  • Algoritmos no supervisados / Aprendizaje no supervisado: Pueden extraer inferencias en conjuntos de datos. Los datos de entrenamiento están “sin etiquetar”, es decir, no se proporciona la salida deseada al algoritmo. Estos algoritmos se centran en encontrar patrones y estructuras en los datos.
  • Algoritmos semisupervisados / Aprendizaje semisupervisado: Algunos datos de entrenamiento están etiquetados y otros no. Los científicos han descubierto que, en algunos casos, estos algoritmos rinden mejor que el aprendizaje no supervisado, y de forma más eficiente que el aprendizaje supervisado.
  • Algoritmos de aprendizaje activo: El algoritmo trata de optimizar el equilibrio de la supervisión (conocer las salidas). Selecciona datos de entrada representativos y pide a un humano que le proporcione interactivamente la mejor salida para esas entradas. Un ejemplo es cuando en un sitio de internet nos piden que identifiquemos fotografías para “demostrar que no eres un robot” (lo que se conoce como CAPTCHA). Las respuestas a tareas como “selecciona todas las fotos que contengan parquímetros" se introducen en algoritmos de aprendizaje activo, como los utilizados para mejorar la visión por ordenador en los vehículos autónomos.
  • En el aprendizaje reforzado, los algoritmos se centran en cómo aumentar las posibilidades de acumular una recompensa cuantificable. Un ejemplo de este tipo de recompensa acumulativa es tomar la pieza de un oponente en una partida de ajedrez. En el ajedrez, un peón vale 1, los caballos y los alfiles valen 3 (aproximadamente el valor de tres peones), una reina vale 9, etc. Los algoritmos que aumentan la ventaja material a medida que avanza la partida aumentan la probabilidad de ganarla. El aprendizaje por refuerzo se aplica en la teoría de juegos, la inteligencia de enjambre y los algoritmos genéticos.

Supervisado, no supervisado, reforzado... parece un ecosistema complicado, pero en realidad no lo es tanto. Lo importante es saber que existen diferentes tipos de aprendizaje, y que problemas diferentes requieren enfoques de aprendizaje automático diferentes.

Aunque parezca un concepto de ciencia-ficción, el aprendizaje automático ya forma parte de nuestra vida y de muchos productos y servicios que usamos a diario, por ejemplo:

  • Servicios de streaming como Netflix o Spotify.
  • Software de navegación GPS como Google Maps.
  • Motores de búsqueda como Google Search.
  • Los feeds o contenidos (noticias, publicaciones) que nos muestran redes sociales como Facebook o LinkedIn; utilizan el aprendizaje automático para personalizar el contenido de cada usuario analizando si se detiene a leer o si pulsa “me gusta” en ciertas publicaciones, creando así un patrón y personalizando el feed en consecuencia.

El aprendizaje automático se está aplicando en todo tipo de sectores, desde la salud al comercio, pasando por el desarrollo de vehículos sin conductor.

La expresión “aprendizaje automático” fue acuñada por el ingeniero de IBM y pionero de la IA Arthur Samuel en 1959. Se le ocurrió este término para describir a un ordenador que diseñó para jugar a las damas, analizar las partidas anteriores y mejorar sus futuras elecciones de juego. Como campo de estudio científico, el ML se ramificó a partir de la IA en las décadas de 1970 y 1980. En aquella época, los científicos experimentaban con diversas técnicas de IA, como las redes neuronales y la programación lógica inductiva, para ayudar a los ordenadores a procesar datos de forma inteligente. En la década de los 90, el aprendizaje automático dejó de centrarse en la simulación de la inteligencia para hallar enfoques prácticos para el análisis de datos complejos y masivos.