La inteligencia artificial, ¿cómo funciona?
El poder de la inteligencia artificial sobre nuestras vidas y libertades puede crear preocupación e incertidumbre. Igualmente, suscita muchas preguntas entre los expertos del ámbito, y también, desde un punto de vista político, con la voluntad de la Unión Europea de legislar y controlar su uso. Para comprender mejor la IA, más vale saber como funciona...
Geoffrey Hinton, Premio Turing de Informática (el equivalente del Premio Nobel en este ámbito), conocido como uno de los “padres fundadores” de la IA, preguntó en una ocasión: “Supongamos que tiene un cáncer que debe ser operado, y que te dan a elegir entre un “cirujano artificial”, una “caja negra” que no puede explicar cómo funciona pero que tiene un 90% de tasa de éxito, y un humano que tiene un 80% de tasa de éxito, ¿quiere que el “cirujano artificial” sea ilegal?”.
Evidentemente, era una provocación deliberada, pero ilustra bien la concepción actual asociada a la IA. Las dos posibilidades (humanos y IA) están presentadas como opuestas, perdiendo de vista el punto crucial de la inteligencia artificial: los humanos y la IA no lo son. La IA es una herramienta a disposición de los humanos. Y, los humanos y los ordenadores tienen capacidades complementarias: el humano es bueno para ampliar sus conocimientos, mientras que la IA es buena para repetir. Veremos porqué al presentar el funcionamiento de la IA.
Figura 1 – Los humanos son mejores para resolver los problemas diversos y complejos. Las máquinas son muy eficientes para los problemas repetitivos y poco complejos.
Fuente: https://medium.com/@rbaeza_yates/human-or-robot-cf6777d15de8
Un corto descifrado de la IA
Es importante comprender la terminología asociada a la Inteligencia Artificial y también comprender porqué la IA conoce tal auge actualmente. Inteligencia Artificial es un término genérico que designa la disciplina, mientras que las técnicas empleadas son, por ejemplo, el aprendizaje automático (Machine Learning) y el aprendizaje hondo (Deep Learning). Para entender el funcionamiento de los algoritmos de aprendizaje, comparemos este concepto con la informática clásica.
La informática clásica sesolver así el problema. En cuanto al Machine Learning, consiste en hacer entender a un algoritmo «simple» cómo resolverigue esquemáticamente el siguiente enfoque: el objetivo es enumerar todas las posibilidades en un algoritmo que permita r un problema complejo (para el cual es imposible enumerar todas las posibilidades) gracias a unos datos sacados de este problema.
Por último, el Deep Learning consiste en hacer entender a un algoritmo (algo menos) “simple”, llamado redes de neuronas, cómo resolver un problema (aún más) complejo, gracias a (aún más) datos sacados de este problema. El Deep Learning es un tipo de algoritmo del Machine Learning.
Figura 2 – Una cronología de la inteligencia artificial, que también ilustra las conexiones entre técnicas.
¿De qué hablamos cuando evocamos la IA?
Pues bien, estos últimos años hablamos mayoritariamente de Deep Learning. Es un concepto relativamente antiguo que conoció un gran periodo de carencias entre los años 1980 y 2010. Sin embargo, estas técnicas están actualmente en auge gracias al Big Data y a que las capacidades de cálculose han desarrollado mucho. Así, estos algoritmos tan glotones pueden ahora ser lo suficientemente “alimentados” con datos para ser eficaces, lo que no era el caso en el pasado. Los avances en capacidad de cálculos permiten practicar en un tiempo razonable.
Pero, ¿qué es el Deep Learning? Es una categoría de algoritmo inspirada en el funcionamiento del cerebro. Es una red compuesta de lo que se llama neuronas por analogía, que están interconectadas y que sirven para efectuar operaciones matemáticas. Así, los algoritmos de Deep Learning pueden visualizarse como capas sucesivas de neuronas, utilizando cada capa los resultados de los cálculos de las capas anteriores para efectuar nuevos cálculos.
Figura 3 – El funcionamiento de una red de neuronas
Fuente : https://www.youtube.com/watch?v=Rg9CdkwavmY
El Deep Learning tiene un éxito peculiar por diferentes razones: estas técnicas permiten producir todo tipo de datos (imagen, texto, sonido, números...) al contrario del Machine Learning. Estos algoritmos pueden, así, calcular y resolver problemas más complejos. Por último, el trabajo anterior de formateo y análisis de datos es, en general, menos complejos con los algoritmos de Deep Learning.
Una historia de aprendizaje
Ya lo has entendido, para que los algoritmos puedan aprender, hace falta proporcionarles datos para formarlos. Esto vale para cualquier tipo de algoritmo de aprendizaje, ya sea Machine Learning o Deep Learning.
Figura 4 – Un proceso clásico de Deep Learning. Un modelo, el algoritmo de Deep Learning, va a recibir de entrada datos de formación. Una vez el modelo conseguido, se aplica a datos desconocidos para probarlo y después, en el ámbito en el cual sera utilizado. Fuente: https://arslanali4343.medium.com/complete-introduction-about-a-career-path-in-al-ml-dl-and-ds-7508d1adaafc
Existen varios tipos de formación, y las dos más conocidas son el aprendizaje supervisado y el aprendizaje no supervisado. La primera consiste en proporcionar datos etiquetados al modelo para que éste comprenda las características asociadas a cada una de esas etiquetas. Supongamos que estamos trabajando en la creación de un modelo de clasificación de imágenes de animales. Para entrenar al modelo, se le dará un gran numero de imágenes de animales con una etiqueta asociada que corresponde al animal presente en la imagen. El algoritmo comprenderá entonces, gracias a su formación, qué características son propias a las imágenes de cada raza de animal.
En cuanto al aprendizaje no supervisado, esta vez vamos a proporcionar un gran numero de datos al modelo, sin especificar por ello etiquetas. Así, va a tener que comprender él solo cómo distinguir las categorías, pero también definir por sí mismo cuáles son estas categorías. Cabe destacar que para cada una de esas técnicas, nunca explicamos a los algoritmos las características de los elementos que deben analizar. He aquí todo el interés: comprenderá por sí mismo cuales son.
Figura 5 – Ilustración de diferentes tipos de aprendizaje. A la izquierda, el aprendizaje supervisado por la clasificación. Este procedimiento consiste en asociar una clase o una etiqueta a un dato en entrada. El proceso no supervisado, siendo aquí un algoritmo de clustering, es decir, de partición de datos, consiste en agrupar los datos similares en grupos. Estos grupos, al contrario del proceso de clasificación, no son especificados en los datos de formación. Fuente : https://blog.westerndigital.com/machine-learning-pipeline-object-storage/
El funcionamiento practico
Ahora que hemos entendido el principio de la formación, examinemos lo que pasa desde un punto de vista matemático. Para que el problema pueda ser resuelto por un algoritmo de aprendizaje automático, dos grandes hipótesis deben cumplirse. Hipótesis 1, el problema sigue una función matemática (o más bien una distribución) desconocida, que el modelo debe aproximar. Esta hipótesis sirve principalmente para asegurar que el proceso que intentamos modelar no es completamente aleatorio.
Figura 6 – Simplificación del funcionamiento de un algoritmo de aprendizaje formado. En azul, la función desconocida que hay que aproximar. En naranja, la función que el algoritmo conseguirá aprender con la ayuda de los datos de formación.
Hipótesis 2, los datos de formación describen correctamente la «función desconocida». Esta segunda hipótesis es particularmente importante. En efecto, un algoritmo de aprendizaje, por muy eficiente que sea, es totalmente dependiente de los datos que le serán proporcionados en entrada. Si formamos un algoritmo de clasificación de imágenes de animales, el algoritmo formado será probablemente eficiente para las categorías de animales que ya ha visto. No obstante, tendrá dificultades infinitas en generalizar las características de un animal a una especie animal que nunca ha visto. Igualmente, será extremamente dependiente de la representación de las imágenes: si los animales están siempre de frente, tendrá probablemente dificultades para clasificara los animales de espalda. Del mismo modo, si está formado solamente para reconocer alos perros de raza de montaña de Berna, le costará probablemente entender lo que es un yorkshire.
Figura 7 – Ilustración de la necesidad de tener datos de formación que representen la función buscada. En azul, la función desconocida. En naranja, los datos que representan supuestamente esta función y permiten al modelo “adivinarla”.
Hoy en día, los algoritmos de inteligencia artificial están revolucionando numerosos campos pero aún presentan limitaciones. Actualmente, la IA tan sólo se aproxima a una función que describe datos con los que fue formada. Responde a un problema muy preciso y tan sólo tiene una débil capacidad para aprender lo que no se halla en los datos de formación. Sobretodo, la IA no ha aprendido como aprender, simplemente aprendió una función matemática que se acerca a la “función desconocida” subyacente, supuestamente descrita por los datos de formación. Por lo tanto, seguimos muy lejos de los casos de ciencia ficción de la IA omnisciente e incluso de la Inteligencia Humana.
Fuentes :
[1] https://medium.com/@rbaeza_yates/human-or-robot-cf6777d15de8
[3] https://www.youtube.com/watch?v=Rg9CdkwavmY
[5] https://blog.westerndigital.com/machine-learning-pipeline-object-storage/
Comentario ( 0 ) :
Compartir
Categorías
Puede que te interese esto:
Suscríbete a nuestro boletín
Publicamos contenido regularmente, manténgase actualizado suscribiéndose a nuestro boletín.