La inteligencia artificial (IA) parece estar en todas partes. La experimentamos en casa y en nuestros teléfonos. Antes de que nos demos cuenta, si creemos a los empresarios y a los innovadores comerciales, la IA estará presente en casi todos los productos y servicios que compramos y utilizamos. Además, su aplicación a la resolución de problemas empresariales está creciendo a pasos agigantados. Y al mismo tiempo, aumenta la preocupación por las implicaciones de la IA: nos preocupa el impacto de la automatización posibilitada por la IA en el lugar de trabajo, el empleo y la sociedad.
Alexa
Una realidad que a veces se pierde entre los temores y los triunfos de los titulares, como Alexa, Siri y AlphaGo, es que las propias tecnologías de IA -a saber, el aprendizaje automático y su subconjunto, el aprendizaje profundo- tienen muchas limitaciones que todavía requerirán un esfuerzo considerable para superarlas. Este es un artículo sobre esas limitaciones, destinado a ayudar a los ejecutivos a entender mejor lo que puede estar frenando sus esfuerzos de IA. A lo largo del artículo, también destacaremos los avances prometedores que están preparados para abordar algunas de las limitaciones y crear una nueva ola de oportunidades.
Nuestras perspectivas se basan en una combinación de trabajo en primera línea -investigación, análisis y evaluación de cientos de casos de uso en el mundo real- y nuestras colaboraciones con algunos de los líderes de opinión, científicos pioneros e ingenieros que trabajan en las fronteras de la IA. Hemos tratado de destilar esta experiencia para ayudar a los ejecutivos que a menudo, según nuestra experiencia, sólo están expuestos a sus propias iniciativas y no están bien calibrados en cuanto a dónde está la frontera o lo que los que marcan el ritmo ya están haciendo con la IA.
En pocas palabras, los retos y limitaciones de la IA están creando un problema de «blanco móvil» para los líderes: Es difícil llegar a una frontera que siempre está avanzando. También es decepcionante cuando los esfuerzos de la IA se topan con barreras del mundo real, lo que puede disminuir el apetito por seguir invirtiendo o fomentar una actitud de esperar y ver, mientras otros se adelantan. Como indica un reciente estudio del McKinsey Global Institute, existe una enorme brecha entre los líderes y los rezagados en la aplicación de la IA, tanto en los distintos sectores como dentro de ellos.
Los ejecutivos que esperan reducir la brecha deben ser capaces de abordar la IA con conocimiento de causa. En otras palabras, tienen que entender no sólo dónde la IA puede impulsar la innovación, el conocimiento y la toma de decisiones, conducir a un aumento de los ingresos y a la obtención de eficiencias, sino también dónde la IA no puede aportar todavía valor. Es más, deben apreciar la relación y las diferencias entre las limitaciones técnicas y las organizativas, como las barreras culturales, la escasez de personal capaz de crear aplicaciones preparadas para el negocio e impulsadas por la IA, y el reto de la «última milla» de integrar la IA en los productos y procesos. Si quiere convertirse en un líder que entienda algunos de los retos técnicos críticos que frenan el avance de la IA y esté preparado para aprovechar los prometedores desarrollos que podrían superar esas limitaciones y, potencialmente, cambiar la trayectoria de la IA, siga leyendo.
Desafíos, limitaciones y oportunidades
Un punto de partida útil es comprender los recientes avances en las técnicas de aprendizaje profundo. Podría decirse que estos avances son los más emocionantes de la IA, ya que están proporcionando saltos en la precisión de la clasificación y la predicción, y lo están haciendo sin la habitual «ingeniería de características» asociada al aprendizaje supervisado tradicional. El aprendizaje profundo utiliza redes neuronales a gran escala que pueden contener millones de «neuronas» simuladas estructuradas en capas. Las redes más comunes se denominan redes neuronales convolucionales (CNN) y redes neuronales recurrentes (RNN). Estas redes neuronales aprenden mediante el uso de datos de entrenamiento y algoritmos de retropropagación.
Aunque se ha avanzado mucho, aún queda mucho por hacer.1 Un paso fundamental es adaptar el enfoque de la IA al problema y a la disponibilidad de datos. Dado que estos sistemas se «entrenan» en lugar de programarse, los distintos procesos suelen requerir enormes cantidades de datos etiquetados para realizar tareas complejas con precisión. Obtener grandes conjuntos de datos puede ser difícil. En algunos ámbitos, puede que simplemente no estén disponibles, pero incluso cuando están disponibles, los esfuerzos de etiquetado pueden requerir enormes recursos humanos.
Además, puede ser difícil discernir cómo un modelo matemático entrenado por el aprendizaje profundo llega a una determinada predicción, recomendación o decisión. Una caja negra, incluso una que hace lo que se supone que debe hacer, puede tener una utilidad limitada, especialmente cuando las predicciones o decisiones tienen un impacto en la sociedad y tienen ramificaciones que pueden afectar al bienestar individual. En estos casos, los usuarios a veces necesitan saber los «porqués» del funcionamiento, como por ejemplo, por qué un algoritmo ha llegado a sus recomendaciones -desde hacer conclusiones fácticas con repercusiones legales hasta llegar a decisiones empresariales, como los préstamos, que tienen repercusiones regulatorias- y por qué ciertos factores (y no otros) fueron tan críticos en un caso determinado.
Exploremos cinco formas interconectadas en las que estas limitaciones, y las soluciones que están surgiendo para abordarlas, están comenzando a desarrollarse.
Etiquetado de datos
La mayoría de los modelos de IA actuales se entrenan mediante «aprendizaje supervisado«. Esto significa que los humanos deben etiquetar y categorizar los datos subyacentes, lo que puede ser una tarea considerable y propensa a errores. Por ejemplo, las empresas que desarrollan tecnologías de conducción autónoma están contratando a cientos de personas para que anoten manualmente horas de vídeo de vehículos prototipo para ayudar a entrenar estos sistemas. Al mismo tiempo, están surgiendo nuevas y prometedoras técnicas, como la supervisión en el flujo de datos (demostrada por Eric Horvitz y sus colegas de Microsoft Research), en la que los datos pueden ser etiquetados en el curso del uso natural.2 Los enfoques no supervisados o semisupervisados reducen la necesidad de grandes conjuntos de datos etiquetados. Dos técnicas prometedoras son el aprendizaje por refuerzo y las redes generativas adversariales.
Aprendizaje por refuerzo. Esta técnica no supervisada permite a los algoritmos aprender tareas simplemente por ensayo y error. La metodología se asemeja al enfoque del «palo y la zanahoria»: por cada intento que hace un algoritmo de realizar una tarea, recibe una «recompensa» (como una mayor puntuación) si el comportamiento es exitoso o un «castigo» si no lo es. Con la repetición, el rendimiento mejora, superando en muchos casos las capacidades humanas, siempre que el entorno de aprendizaje sea representativo del mundo real.
El aprendizaje por refuerzo se ha utilizado en el entrenamiento de ordenadores para jugar, más recientemente, en combinación con técnicas de aprendizaje profundo. En mayo de 2017, por ejemplo, ayudó al sistema de IA AlphaGo a derrotar al campeón mundial Ke Jie en el juego de Go. En otro ejemplo, Microsoft ha puesto en marcha servicios de decisión que se basan en el aprendizaje por refuerzo y se adaptan a las preferencias del usuario. La aplicación potencial del aprendizaje por refuerzo abarca muchos ámbitos empresariales. Las posibilidades incluyen una cartera de negociación impulsada por la IA que adquiere o pierde puntos por las ganancias o pérdidas de valor, respectivamente; un motor de recomendación de productos que recibe puntos por cada venta impulsada por una recomendación; y un software de rutas de camiones que recibe una recompensa por las entregas puntuales o la reducción del consumo de combustible.
El aprendizaje por refuerzo también puede ayudar a la IA a trascender las limitaciones naturales y sociales del etiquetado humano, desarrollando soluciones y estrategias antes inimaginables que incluso los profesionales experimentados nunca habrían considerado. Recientemente, por ejemplo, el sistema AlphaGo Zero, utilizando una novedosa forma de aprendizaje por refuerzo, derrotó a su predecesor AlphaGo tras aprender a jugar al Go desde cero. Para ello, tuvo que empezar a jugar contra sí mismo de forma totalmente aleatoria, en lugar de entrenarse con partidas de Go jugadas por y con humanos.3
Redes generativas adversariales (GAN). En este método de aprendizaje semisupervisado, dos redes compiten entre sí para mejorar y perfeccionar su comprensión de un concepto. Para reconocer el aspecto de los pájaros, por ejemplo, una red intenta distinguir entre imágenes auténticas y falsas de pájaros, y su red contraria intenta engañarla produciendo imágenes que se parecen mucho a los pájaros, pero que no lo son. A medida que las dos redes se enfrentan, la representación de un pájaro de cada modelo se vuelve más precisa.
GAN
La capacidad de las GAN de generar ejemplos de datos cada vez más creíbles puede reducir significativamente la necesidad de conjuntos de datos etiquetados por humanos. Para entrenar un algoritmo que identifique diferentes tipos de tumores a partir de imágenes médicas, por ejemplo, se necesitarían normalmente millones de imágenes etiquetadas por humanos con el tipo o el estadio de un determinado tumor. Utilizando un GAN entrenado para generar imágenes cada vez más realistas de diferentes tipos de tumores, los investigadores podrían entrenar un algoritmo de detección de tumores que combinara un conjunto de datos etiquetados por humanos mucho más pequeño con el resultado del GAN.
Aunque la aplicación de los GAN en el diagnóstico preciso de enfermedades aún está lejos, los investigadores han empezado a utilizar los GAN en contextos cada vez más sofisticados. Entre ellos, la comprensión y producción de obras de arte en el estilo de un artista concreto y el uso de imágenes por satélite, junto con la comprensión de las características geográficas, para crear mapas actualizados de zonas en rápido desarrollo.