Por Jonathan Tennenbaum
Parte 2 de 10
MSIa Informa, 4 de septiembre de 2020.-Las raíces últimas de la estupidez de los sistemas de inteligencia artificial (IA) se encuentran, a mi parecer, en su carácter estrictamente algorítmico. La IA, como se entiende en la actualidad, parte de sistemas de procesamiento digital que realizan operaciones numéricas binarias en un procedimiento de “paso a paso”, de acuerdo con conjuntos fijos de algoritmos, a partir de un arreglo de entradas numéricas.
Alguien podrá objetar dicha caracterización señalando que los sistemas de la IA pueden alterar constantemente sus propias “reglas” –al reprogramarse a ellos mismos, por así decirlo. Esto es verdad, pero la auto reprogramación debe seguir el mismo algoritmo. Lo mismo es válido para los procedimientos por los que el sistema reacciona a entradas diversas. Al final de cuentas, cada sistema de IA está gobernado por un conjunto de reglas y de procedimientos instalados en el diseño del sistema, los que permanecen inalterados durante su operación, mientras el sistema permanezca íntegro.
Alan Turing, uno de los grandes pioneros de la IA, tuvo éxito en dar una definición precisa de la noción general de “algoritmo” o “procedimiento mecánico”, que fundamenta todos los sistemas de IA que pudieran, posiblemente, utilizarse con equipos digitales. Turing demostró que cualquier sistema de ese género es equivalente matemáticamente a una entidad abstracta, conocida actualmente como una “máquina de Turing”.
Existe además una única “máquina Turing” universal que puede simular a otra, cuando el diseño de esta última se incorpora a la primera de una forma adecuadamente codificada. De acuerdo a esto, se pueden investigar las posibilidades teóricas y las limitaciones de los sistemas de la IA con métodos matemáticos, dejándose de lado la velocidad y otros aspectos físicos.
El diagrama muestra una cinta sin fin con cuadrados, en los cuales se ha escrito cero o uno. La máquina posee una cabeza capaz de leer, borrar o imprimir cero o mover la cinta un paso a la derecha o a la izquierda. Los rectángulos numerados abajo contienen las reglas (programa) de la máquina.
La regla 1 dice que, por ejemplo: si usted lee cero, bórrelo e imprima uno, mueva la cinta un espacio a la derecha y vaya a la regla 4; pero si usted lee un uno, déjelo así, mueva la cinta un espacio a la izquierda y aplique la regla 1 nuevamente. La máquina inicia en la regla 1, con algunas secuencias de ceros y unos grabados en la cinta. También puede haber una regla que le diga a la máquina que se detenga.
No importa cuán sofisticada sea un sistema de IA, no importa cómo podamos combinar los sistemas de la IA de varias formas, en la interacción de arquitecturas jerárquicas paralelas y automodificables, siempre acabaremos con algo como una “máquina de Turing” que opera con un conjunto fijo de reglas.
La estupidez se instala en los sistemas de la IA desde los niveles más bajos hasta los más altos.
En el espacio micro tenemos miles de millones de elementos de conmutaciones individuales en los chips de los circuitos integrados, cada uno de los cuales realiza sus transiciones conecta-desconecta de una manera 100 por ciento determinista y rígidamente mecánica. Son 100 por ciento estúpidos. Fue para eso para lo que los construyeron. Difícilmente se asemejan a células vivas -neuronas y células gliales (células no neuronales del sistema nervioso central que proporcionan soporte y nutrición a las neuronas, n. e.) integradas en el sistema intersticial del cerebro –que constituyen el sustrato de los procesos mentales humanos. El macro, el comportamiento de un sistema de IA se subordina a sus reglas de gobierno. Nos hay forma de alterarlos por dentro. Ella interpreta y reacciona a todos los acontecimientos de acuerdo con ellas y seguirá haciéndolo, aunque ello conduzca a un desastre.
Así que todos los sistemas de la IA que utilizan hardware digital son inherentemente estúpidos, aun si manifiestan un comportamiento inteligente, de acuerdo con los dos primeros cuatro criterios de estupidez, presentados en el primer artículo de esta serie. Para recordarlos, aquí están de nuevo: E1. Adhesión continua a los procedimientos, hábitos, modos de pensar y de comportamiento existentes, combinada con la incapacidad en un caso dado concreto. Adhesión rígida a experiencias pasadas y aprendizaje rutinario ante situaciones que exigen nuevos pensamientos. Se puede hablar de un comportamiento ciegamente “algorítmico” en el sentido más amplio.
E2. Incapacidad de “pensar fuera de la caja”, de ver el cuadro general, de salir mentalmente del proceso en el que está envuelto y hacer las preguntas correspondientes, como: “¿Qué estoy haciendo realmente?”; “¿Esto tiene sentido?”; y “¿Qué está pasando aquí realmente?”
En seguida vamos a examinar algunos ejemplos de cómo la estupidez de los sistemas de la IA se manifiesta en su desempeño práctico.
Aprendizaje profundo
Los sistemas de aprendizaje profundo desempeñan actualmente un papel dominante en las aplicaciones de la IA. La idea principal quizá sea conocida por muchos lectores, pero la resumiré brevemente aquí.
El aprendizaje profundo parte del uso de redes artificiales neuronales de varias capas. Las redes se componen de capas de nudos interconectadas eléctricamente (“neuronas artificiales”), cada una de las cuales recibe entradas de nudos en la capa anterior y calcula una salida que va a los nudos de la capa siguiente. Las entradas de cada nudo, oriundas de otros nudos, reciben pesos relativos que se ajustan en el transcurso de un proceso de “aprendizaje”.
La primera capa de nudos recibe entradas de afuera: por ejemplo, pixeles de una imagen que identificar. La idea es, ajustando los pesos correspondientes, hacer que los nudos de cada capa respondan a los patrones correspondientes en los datos de la capa anterior, para que los nudos de la capa final nos den la respuesta deseada.
Por ejemplo, podemos querer que uno de esos nudos finales se active si la imagen fuese un círculo; otro nudo, si la imagen fuese un cuadrado.
Con un algoritmo extremadamente ingenioso se puede prever que esa red ajuste gradualmente sus referencias internas por sí mismo, cuando se presenta con un gran número de pares de entradas y de respuestas correctas (en este ejemplo, imágenes identificadas correctamente), de forma que proporciones respuestas cada vez mejores a entradas arbitrarias –por los menos en sentido estadístico.
Se puede describir como un método muy sofisticado de ajuste de curvas.
Cisnes negros y cajas negras
El abordaje del aprendizaje profundo ha tenido éxitos sorprendentes. Pero también hay problemas.
Como la optimización es de naturaleza estadística, tiende a brindar las respuestas correctas tan sólo a entradas semejantes a las que ocurren con frecuencia en los conjuntos en que fueron entrenadas. Para entradas encontradas más recientemente, los resultados pueden ser totalmente erróneos. Este fenómeno, llamado “cisne negro”, presenta un gran desafío para el desarrollo de vehículos autónomos que pueden enfrentarse a una gran variedad de situaciones poco comunes. El problema de la “caja negra” es igualmente serio: las redes de aprendizaje profundo, como las usadas en la identificación de imágenes, tienen 10 millones o más de referencias internas. Los valores de estos millones de referencias surgirán de un entrenamiento que involucra grandes cantidades de datos.
La red se convirtió así en una “caja negra”: la función de entrada y salida de la red es tan complicada matemáticamente que no tenemos como prever o explicar el comportamiento del sistema en general.
La identificación de objetos visuales, que se está empleando a gran escala en todas partes, nos da un ejemplo.
A pesar de las mejorías constantes, esos sistemas continuaban siendo atormentados por casos extremos de identificaciones falsas de objetos, de tipo que los humanos prácticamente nunca hacemos. Además de esto, esos errores pueden ser provocados deliberadamente por los llamados ejemplos contradictorios, que se convierten en un campo nuevo de investigación en la IA.
En seguida, por cortesía de Dan Hendrycks, presento algunos errores de identificación cometidos por el sistema de reconocimiento de imagen AI ResNet-50 –una red neuronal de aprendizaje profunfundo de 50 camadas entrenadas con más de un millón de imágenes.
El fenómeno de los ejemplos adversos demuestra que lo que esos sistemas “aprenden” a hacer difiere fundamentalmente de cómo los seres humanos reconocen los objetos. En muchos casos los sistemas detectan un tipo de textura en la imagen, y no la forma (Gestalt), que un ser humano percibe. Ejemplos adversos análogos se pueden producir para sistemas de reconocimiento de voz.
Lo que se llama “aprendizaje” en los sistemas existentes de inteligencia artificial, en general, tienen poco o nada que ver con la forma en la que los hombres aprenden realmente. En la mejor de las hipótesis, se pueden encontrar analogías con la memorización mecánica irracional o con técnicas “skinnerianas” de modificación del comportamiento (referencia a la tesis conductista de B.F. Skinner, que parte del estímulo o de la represión del comportamiento, lo que genera un aprendizaje mecánico y repetitivo n. de e.), a las que ninguna persona inteligente se sometería.
Los ejemplos adversos se convirtieron en una fuente muy sería de preocupación, principalmente en los usos militares, por ejemplo, en los sistemas de identificación de blancos, y en la seguridad de la IA. (Los interesados pueden consultar los artículos “How Adversarial Attacks Could Desestabilize Military AI Systems” y “Military artificial intelligence can be easily and dangerously fooled”.)
Traducir sin entender
Otro ejemplo es la traducción automática. El enfoque del aprendizaje profundo alcanzó aquí éxitos extraordinarios, gracias, en gran medida, a su gigantesco banco de datos y a sus mejoras constantes. Pero el problema de la estupidez permanece.
El traductor de Google es un buen ejemplo. Opera con un enorme banco de datos en constante crecimientos, con centenares de millones de documentos y fragmentos de texto con traducciones acopladas hechas por humanos.
Entre otras fuentes, el Traductor Google utiliza el banco de datos multilingüe de Naciones Unidas, que incluye más de un millón y medio de pares de documentos alineados en los seis idiomas oficiales de esa organización y la base de documentos multilingües de la Comisión Europea. La traducción de frases se genera en correlación con frases traducidas por humanos y optimizadas estadísticamente para producir la “mejor” traducción.
No es necesario decir que procedimiento del Traductor de Google no involucra nada más allá de manipulaciones de series de ceros y unos de la entrada y del banco de datos. Si una persona viviese tiempo suficiente –quizá miles de años- y tuviese la paciencia suficiente para ejecutar los procedimientos de cálculo, esa persona, en teoría, podría traducir textos, en formato codificado digitalmente, del suajili al tibetano sin saber una palabra de los dos idioma. El Traductor de Google hace esencialmente una forma exitosa, más o menos, de chapucear: traducir textos sin entenderlos. La falta de capacidad de entender es una forma de estupidez (E4).
Es frecuente que la estupidez de la traducción automática con el aprendizaje profundo produzca resultados hilarantes. Me he divertido alimentando textos chinos que contienen 成语
(chengyu) –expresiones idiomáticas tradicionales, principalmente, de cuatro caracteres- en varios servicios de traducción online.
Por ejemplo; el chengyuǎ 齿徒增 (mǎchǐtúzēng)
-literalmente “dientes de caballo, inútil, crece”- se podría traducir –dejando atrás el humor, la ironía y el ritmo- como: “envejecer sin realizar mucho”. Este chengyu, incorporado a una frase adecuada, puede enloquecer a los traductores automáticos:
平心思量, 一年来马徒增成, 成也忍气吞声当牛做马。
Traductor de Google: “Si usted piensa en eso un año, sus dientes aumentarán y su carrera fracasará”.
Es costumbre que la salida de la herramienta de traducción sea inestable. Si digita la frase una vez más, podrá obtener traducciones diferentes.
Traductor de Google (por segunda vez): “Pensativamente, en el año hubo un aumento de número de dientes y ningún éxito en sus carreras”.
Traductor Baidu: “Creo que el año pasado, el número de caballos aumentó en vano y su carrera no tuvo éxito. Sólo puedo aguantar ser un buey y un caballo”.
Estos ejemplos hacen evidente que los sistemas de traducción de la IA, por lo menos de los del tipo que existen actualmente, no tienen acceso al significado en sí. En este sentido son 100 por ciento estúpidos (E4).

Português
Msia Informa
