{"id":9757,"date":"2020-11-29T13:53:23","date_gmt":"2020-11-29T13:53:23","guid":{"rendered":"https:\/\/msiainforma.org\/?p=9757"},"modified":"2020-11-29T13:53:23","modified_gmt":"2020-11-29T13:53:23","slug":"la-estupidez-de-la-inteligencia-artificial","status":"publish","type":"post","link":"https:\/\/msiainforma.org\/es\/la-estupidez-de-la-inteligencia-artificial\/","title":{"rendered":"La estupidez de la Inteligencia Artificial"},"content":{"rendered":"<strong>Parte 13 -Traducci\u00f3n autom\u00e1tica a partir del aprendizaje no tan profundo<\/strong><\/p>\n<p><em>Por Jonathan Tennenbaum<\/em><\/p>\n<p><em>MSIa Informa, 26 de noviembre de 2020.-<\/em>7 de enero de 1954. Un grupo selecto se re\u00fane en las oficinas de la International Business Machines Corporation (IBM) para ser testigos de la primera demostraci\u00f3n p\u00fablica de una traducci\u00f3n autom\u00e1tica. IBM 701, el primer computador cient\u00edfico comercial de la empresa ocupaba la sala entera.<\/p>\n<p>Con una capacidad de memoria de cerca de 20 kilobytes (Kb) y con la capacidad para realizar 2 mil multiplicaciones por segundo, el 701 estaba cerca de ser un mill\u00f3n de veces menos poderoso que los computadores personales actuales. Sin embargo, esta reuni\u00f3n, que se conocer\u00eda como el experimento Georgetown-IBM, en homenaje a su copatrocinador acad\u00e9mico, entr\u00f3 a la Historia.<\/p>\n<p>El cerebro tras la reuni\u00f3n era L\u00e9onDostert, cofundador del Instituto de Lenguas y Ling\u00fc\u00edstica de la Universidad de Georgetown y uno de los ling\u00fcistas m\u00e1s destacados de su \u00e9poca. Durante la Segunda guerra mundial, Dostert fue el int\u00e9rprete personal del general y futuro presidente de Estados Unidos, Dwight D. Eisenhower, y, luego del conflicto, se encarg\u00f3 de organizar el mecanismo de traducci\u00f3n simult\u00e1nea que se utiliz\u00f3 en el Tribunal de Nuremberg. Tambi\u00e9n era amigo de mucho tiempo del fundador de IBM, Thomas J. Watson.<\/p>\n<p>Lo forma de abordar la traducci\u00f3n autom\u00e1tica (TA) iniciada por Dostert y otros en los 1950 so conoce con el nombre de \u201cbasada en reglas\u201d: los ling\u00fcistas elaboran conjuntos de reglas que rigen el funcionamiento de las lenguas en cuesti\u00f3n -reglas que se pueden expresar de forma matem\u00e1tica.<\/p>\n<p>El ordenador, cuando se le programa adecuadamente, deber\u00eda ser capaz de analizar un texto de entrada y transformarlo con el uso de diccionarios biling\u00fces apropiados y de reglas de transformaci\u00f3n, en una frase correcta gramaticalmente en el idioma de destino. El texto de salida debe expresar el mismo significado que el texto de entrada, en la medida de los posible, en un estilo natural fluido del idioma de destino.<\/p>\n<p>Una soluci\u00f3n amplia exigir\u00eda claramente un gran n\u00famero de reglas y de otros datos, adem\u00e1s de capacidades de c\u00f3mputo mucho m\u00e1s all\u00e1 de las existentes en aquella \u00e1poca. Para reducir los requisitos, Dostert escogi\u00f3 frases con estructuras muy simples, un m\u00ednimo de ambig\u00fcedades y un vocabulario relativamente restringido. La mayor\u00eda trataba de qu\u00edmica y fueron escritas en \u201cruso cient\u00edfico\u201d.<\/p>\n<p>Despu\u00e9s de muchos esfuerzos. Dostert y sus colegas consiguieron formular seis reglas elementales de demostraci\u00f3n. Las reglas se escribieron en el programa del ordenador junto con el equivalente a un diccionario ruso-ingl\u00e9s de 250 palabras.<\/p>\n<p>Antes de la ejecuci\u00f3n del programa, Dostert realiz\u00f3 una prueba con humanos. Lo describi\u00f3 as\u00ed en su informe de 1954, \u201cUn experimento de traducci\u00f3n autom\u00e1tica: aspectos del programa general\u201d:<\/p>\n<p>\u00abEsto inclu\u00eda dar a individuos que la sab\u00edan el idioma de origen, el ruso, frases escritas en ese idioma en caracteres latinos. Se les oriento por escrito para que hicieran una consulta, no s\u00f3lo de aspectos del l\u00e9xico, sino tambi\u00e9n de manipulaciones sint\u00e1cticas. La consulta parti\u00f3 de instrucciones reducidas a t\u00e9rminos estrictamente mec\u00e1nicos, en lugar de operaciones de \u201cpensamiento\u201d\u2026 Los individuos fueron capaces de captar una frase que se les present\u00f3 en ruso latinizado y de proporcionar una traducci\u00f3n correcta de las frases de ruso al ingl\u00e9s, con el empleo de instrucciones que una m\u00e1quina podr\u00eda seguir\u2026 El hecho m\u00e1s significativo es que, sin conocer la lengua rusa y, por lo tanto, sin contribuir con nada m\u00e1s que su capacidad de investigar, que es lo que el computador es capaz de hacer, consiguieron una versi\u00f3n en ingl\u00e9s correcta\u00bb.<\/p>\n<p>Las oraciones rusas, trasliteradas fon\u00e9ticamente al alfabeto latino, se codificaron en cartones perforados y se ejecutaron en la m\u00e1quina. Ante los ojos de los testigos reunidos ah\u00ed, el computador tradujo 60 frases del ruso al ingl\u00e9s, a un ritmo de una cada seis o siete segundos. Esta haza\u00f1a sensacional fue ampliamente divulgada por la prensa.<\/p>\n<p>El experimento Georgetown IBM dio un enorme \u00edmpetu al desarrollo inicial de la Inteligencia Artificial (IA), gran parte de la cual se concentr\u00f3 originalmente en el campo de la traducci\u00f3n autom\u00e1tica (TA) y recibi\u00f3 el financiamiento de instituciones de la defensa de Estados Unidos para ese fin. Dostert se convirti\u00f3 en uno de los principales defensores de la TA.<\/p>\n<p>En un aspecto, sin embargo, el experimento fue demasiado exitoso.<\/p>\n<p>Al igual que la demostraci\u00f3n de ELIZA, en 1966, de Joseph Weizenbaum -un programa que pod\u00eda realizar di\u00e1logos escritos en ingl\u00e9s (ver parte 8 de esta serie) la haza\u00f1a de Dostert dio lugar a expectativas muy exageradas. La selecci\u00f3n favorable de las oraciones rusas, en especial, creo ilusiones sobre el poder real del sistema. Sigui\u00f3 luego la desilusi\u00f3n, que culminar\u00eda una d\u00e9cada despu\u00e9s en el devastador \u201cInforme ALPAC\u201d, que caus\u00f3 la suspensi\u00f3n s\u00fabita del financiamiento de las investigaciones de TA y de la IA en general (v\u00e9ase Parte 9).<\/p>\n<p>La traducci\u00f3n autom\u00e1tica a partir de reglas demostr\u00f3 ser mucho m\u00e1s dif\u00edcil que se esperaba originalmente. En las d\u00e9cadas de 1950 y 1960, los esfuerzos para resolverla produjeron progresos notables en la teor\u00eda ling\u00fc\u00edstica, pero no crearon sistemas de TA viables. La predicci\u00f3n de Yehoshua Bar-Hillel de 1960, de que la traducci\u00f3n totalmente autom\u00e1tica de alta calidad era imposible, parec\u00eda confirmada por los progresos de los 30 a\u00f1os siguientes.<\/p>\n<p>En ese \u00ednterin, sin embargo, el aumento de los \u00f3rdenes de magnitud de la velocidad, de la memoria y de los recursos de procesamiento d datos de los ordenadores modernos le devolvieron la vida a la TA de reglas. Con esto, ya se puede programar un n\u00famero incomparablemente mayor de reglas y de otros datos de las lenguas de origen y de destino.<\/p>\n<p>Se incluyen ah\u00ed relaciones sem\u00e1nticas generales. Por ejemplo, un \u00abterrier\u00bb es un perro; un perro es un animal; un animal es un organismo vivo. Agr\u00e9guese a esto relaciones m\u00e1s complejas, que se sobrepongan al dominio de los datos del mundo real, como las relaciones entre \u201ccomer\u201d, \u201ccomida\u201d, \u201chambre\u201d, \u201csabor\u201d, \u201ccocinar\u201d, \u201cest\u00f3mago\u201d, \u201cdientes\u201d, \u201cagricultura\u201d, \u201crestaurante\u201d, y as\u00ed sucesivamente.<\/p>\n<p>Las relaciones sem\u00e1nticas elementales de la vida cotidiana est\u00e1n entre las cosas que el pionero de la IA John McCarthy ten\u00eda en mente cuando insisti\u00f3, a partir del final de la d\u00e9cada de 1950, en que los sistemas de IA deben adquirir una base amplia de \u201cconocimiento del sentido com\u00fan\u201d, como condici\u00f3n para alcanzar en desempe\u00f1o m\u00e1s semejante al humano. Como dije en la Parte 3 de esta serie, el esfuerzo heroico de Douglas Bruce Lenat para integrar el conocimiento de sentido com\u00fan en su sistema de IA, o Cyc, exigi\u00f3 la programaci\u00f3n de m\u00e1s de 2 millones de datos y de 24 millones de reglas y afirmaciones de sentido com\u00fan en el sistema. Muchos de ellos los tuvieron que escribir los colaboradores del grupo de Lenat.<\/p>\n<p>La traducci\u00f3n autom\u00e1tica de reglas, por fortuna, puede funcionar bien sin exigir toda la gama y la amplitud del \u201csentido com\u00fan\u201d. Prob\u00f3 su habilidad en varios campos, pero sigue siendo un procedimiento trabajoso.<\/p>\n<p>Tengo, una vez m\u00e1s, la impresi\u00f3n de que la IA necesita producir m\u00e1s informaci\u00f3n que la que se invirti\u00f3 en ella. (\u00a1No hace falta decir que eso no impide que la IA sea indispensable y altamente productiva en otros aspectos!)<\/p>\n<p>En un plano fundamental, el procedimiento de reglas para la TA, aunque sea \u00fatil en aplicaciones, casi no tiene nada que ver con la forma en la que los seres humanos adquieren realmente el lenguaje y los conocimientos del mundo.<\/p>\n<p>Los beb\u00e9s no nacen con la gram\u00e1tica del lenguaje programada en sus cabezas. Las lenguas se aprenden. Lo mismo ocurre con la mayor parte de lo que llamamos sentido com\u00fan. Adem\u00e1s, los ni\u00f1os adquieren fluidez en sus primeras lenguas sin haber estudiado ninguna gram\u00e1tica y, en general, antes de saber incluso qu\u00e9 es la gram\u00e1tica. Tambi\u00e9n se puede dudar si lo que llamamos sentido com\u00fan no es tan s\u00f3lo un saco de datos y reglas.<\/p>\n<p>A medida que la IA aspira a alcanzar la verdadera inteligencia humana, el procedimiento de reglas tiene un car\u00e1cter no natural y ad hoc.<\/p>\n<p>Con las cosas as\u00ed, es interesante notar que el inicio de la traducci\u00f3n autom\u00e1tica se sobrepone fuertemente a la criptograf\u00eda de la Segunda guerra mundial -el esfuerzo exitoso del pionero de la IA, Alan Turing, para descifrar los c\u00f3digos secretos que usaban las fuerzas armadas alemanas, y tambi\u00e9n al trabajo de Claude Shannon, cript\u00f3grafo tambi\u00e9n sirvi\u00f3 en la guerra.<\/p>\n<p>Warren Weaver, cuyo \u201cMemorando sobre traducci\u00f3n\u201d de 1949 inici\u00f3 efectivamente la empresa de traducci\u00f3n autom\u00e1tica, profiri\u00f3 la famosa frase: \u201cLas personas se preguntan, naturalmente, si el problema de la traducci\u00f3n podr\u00eda concebirse al tratarlo como un problema de criptograf\u00eda. Cuando leo un art\u00edculo en ruso, digo: \u201cEsto est\u00e1 escrito realmente en ingl\u00e9s, pero fue codificado en algunos s\u00edmbolos extra\u00f1os. Ahora voy a hacer la descodificaci\u00f3n\u201d.\u201d Pero \u00bfSer\u00e1 que las lenguas humanas, en su uso real, funcionan realmente como c\u00f3digos?<\/p>\n<p><strong>Entra el aprendizaje de la m\u00e1quina<\/strong><\/p>\n<p>No es ninguna sorpresa que los avances espectaculares de la TA de las \u00faltimas d\u00e9cadas provengan de sistemas de IA que han adquirido su capacidad por medio de una especie de \u201caprendizaje\u201d. Son sistemas que \u201centrenan\u201d para traducir con el uso de grandes bancos de datos (<em>corpuses<\/em>) de pares de frases originales y traducidas por humanos.<\/p>\n<p>No es necesario insertar ninguna informaci\u00f3n sobre la estructura gramatical o sem\u00e1ntica de las lenguas dadas. Ni siquiera un diccionario biling\u00fce. Esos sistemas generan todo el \u201cconocimiento\u201d que se precisa para convertirse en traductores versados, mientras trabajen con bancos de datos.<\/p>\n<p>Los resultados parecen nada menos que milagrosos. En cierta medida de desempe\u00f1o, los sistemas m\u00e1s nuevos parecen estarse aproximando al desempe\u00f1o de los traductores humanos -y hasta de capacidades sobre humanas en lo que respecta a la velocidad de traducci\u00f3n.<\/p>\n<p>La evoluci\u00f3n de esos sistemas ha exigido enormes cantidades de esfuerzo y de ingenio. Pas\u00f3 por dos estadios de principales: primero, la que se llam\u00f3 traducci\u00f3n autom\u00e1tica estad\u00edstica (SMT, por sus siglas en ingl\u00e9s), seguida, en los \u00faltimos a\u00f1os, por la traducci\u00f3n autom\u00e1tica neuronal NMT, por sus siglas en ingl\u00e9s) que utiliza redes neuronales artificiales y \u201caprendizaje profundo\u201d. M\u00e1s recientemente se ha presentado la tendencia creciente de sistemas h\u00edbridos de TA que combinan NMT con una cierta cantidad de procesamiento \u201cde reglas\u201d.<\/p>\n<p>En lugar de tratar de describir la AMT y la NMT aqu\u00ed, har\u00e9 tan s\u00f3lo una observaci\u00f3n que viene al caso para mi teses sobre la estupidez de la inteligencia artificial.<\/p>\n<p>No hay hada sorprendente per se en el hecho de que los ordenadores con recursos computacionales suficientes pudieran adquirir la capacidad de traducir textos de rutina con banco de datos muy grande de traducciones humanas,<\/p>\n<p>La SMT y la NMT, as\u00ed como el aprendizaje de m\u00e1quina en general no son en esencia nada m\u00e1s que formas extremadamente sofisticadas de ajuste de curvas, aplicados a tipos espec\u00edficos de problemas. En lenguaje m\u00e1s matem\u00e1tico: interpolaci\u00f3n y extrapolaci\u00f3n de un conjunto de puntos dados (o pares de textos debidamente codificados en formato digital) con m\u00e9todos de optimizaci\u00f3n estad\u00edstica.<\/p>\n<p>\u201cAprendizaje\u201d equivale, en general, a un proceso interactivo para determinar los valores de los par\u00e1metros para la funci\u00f3n de entrada-salida, que el computador usa para generar sus traducciones. El objetivo es obtener una funci\u00f3n de entrada-salida que se aproxime a la salida de un traductor humano ideal cuando sea \u201calimentado\u201d con un texto de entrada. Abordar\u00e9 mejor este punto en la siguiente entrega.<\/p>\n<p>El famoso ling\u00fcista Noam Chomsky se refiere a la metodolog\u00eda actual de la TA como un punto de vista de \u201cfuerza bruta\u201d.<\/p>\n<p>Yo preguntar\u00eda: \u00bfEl tipo de aprendizaje realizado por los actuales sistemas de IA es realmente semejante al humano? \u00bfEsos sistemas entienden -de alguna forma significativa- los textos que est\u00e1n traduciendo?<\/p>\n<p>La respuesta a la \u00faltima pregunta es claramente no. Eso, ir\u00f3nicamente, es lo que hac\u00eda tan optimista a L\u00e9on Dostert en lo tocante a las perspectivas de traducci\u00f3n autom\u00e1tica: \u00a1traducir sin entender!","protected":false},"excerpt":{"rendered":"<p>Parte 13 -Traducci\u00f3n autom\u00e1tica a partir del aprendizaje no tan profundo Por Jonathan Tennenbaum MSIa Informa, 26 de noviembre de 2020.-7 de enero de 1954. Un grupo selecto se re\u00fane en las oficinas de la International Business Machines Corporation (IBM) para ser testigos de la primera demostraci\u00f3n p\u00fablica de una traducci\u00f3n autom\u00e1tica. IBM 701, el &#8230;<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[37],"tags":[],"class_list":["post-9757","post","type-post","status-publish","format-standard","hentry","category-ciencia-e-tecnologia"],"_links":{"self":[{"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/posts\/9757","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/comments?post=9757"}],"version-history":[{"count":0,"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/posts\/9757\/revisions"}],"wp:attachment":[{"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/media?parent=9757"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/categories?post=9757"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/msiainforma.org\/es\/wp-json\/wp\/v2\/tags?post=9757"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}