Hace 6 años | Por adria a blogs.microsoft.com
Publicado hace 6 años por adria a blogs.microsoft.com

Microsoft alcanza un hito histórico, usando Inteligencia Artificial para alcanzar el desempeño humano en la traducción de noticias del chino al inglés. Microsoft ha creado el primer sistema de traducción automática que puede traducir oraciones de artículos de noticias del chino al inglés con la misma calidad y precisión que una persona. Logró la paridad humana en un conjunto de pruebas comúnmente usado, llamado newstest2017. Evaluadores humanos bilingües externos compararon los resultados de Microsoft con dos de referencias independiente

Comentarios

D

#3 señor de AliExpress tu querer mandarme 4 piezas to Spain

kucho

#4 son unos cracks!

a

#3 Amazon está lleno de gloriosas traducciones no inferiores a esta. Al final vas pillando el vocabulario y lo entiendes más o menos.

kucho

#8 es que amazon se ha llenado de vendedores externos que envian desde china. ya no es lo que entiendas, son las risas que te echas.

kwisatz_haderach

#6 los traductores llevan una década acojonados. El google translate lo hace bastante bien y cada vez mejor por ejemplo. Los traductores que conozco sobreviven todos por el tema de traducciones juradas, que deben ir homologadas y firmadas (e incluso eso empieza a ser bastante laxo). Curiosamente el que mejor le va de los que conozco emigro a Bruselas a hacer un master y ha conseguido curro en el parlamento de la UE haciendo papeleos y esta mu mu feliz. (aparte de los que hicieron el CAP y estan opositando como locos para conseguir plaza)

C

#21 pues cuando vean el traductor de deepl.com van a temblar. Mil vueltas a Google (aunque menos idiomas soportados)

D

#28 Muchisimos menos.

H

#21 DeepL es incluso mejor que Google translate
https://www.deepl.com

lilili

#14 #29

Será mejor que el Google translate, aún así es caca!

celyo

#6 ¿seguro?

¿Centro Botín o Centro del Saqueo? El nuevo "ridículo" de la promoción turística de Santander

Hace 6 años | Por --394145-- a eldiario.es


#21 Dudo que para textos profesionales o contratos, te arriesgues a que por un término mal formulado en otro idioma, pueda derivarse en pérdidas de dinero.

maybe-me

#6 Yo estoy muy tranquila, la verdad. La traducción no solo consiste en reescribir palabra por palabra lo que dice el texto original.

AlexCremento

#70 No, pero para entenderse basta. Solo unos pocos traductores serán necesarios para lo que tú dices.

maybe-me

#74 No sé si te has parado a pensar en la cantidad de textos que se traducen al día que no son solo “para entenderse”.

D

#6 Los traductores están encantados. El trabajo pesado lo hace el software, ellos pulen los detalles.

D

#76 Están tan encantados que el precio por palabra les está bajando cada dos por tres.

D

#13 Tienes razón. No puedo contrargumentarte con datos porque no puedo dártelos. No es que no los tenga, es que no puedo dártelos.

De verdad. No voy de farol. Y eso que en mi empresa soy un mindundi pero la gente habla, el CEO dice ciertas cosas, se abandonan ciertas líneas de investigación, etc.

Wintermutius

#19 Esto suena a que estás en el negocio de la traducción, pero no eres un traductor, lingüista, investigador, etc., sino un administrativo, comercial, financiero, otros, etc. Lo digo por lo de mindundi

Si eso fuera así, no puedes usar el principio de autoridad, solo porque escuchas comentarios "radio patio".

Hablo desde un gran desconocimiento en la materia, pero un gran interés en esta noticia y, por tanto, interés también en que todos argumentemos lo máximo posible.

En mi caso, sigo sin creerme mucho la noticia, ...

D

#42 Soy técnico. Pues nada oye... Que tienes razón.

Ferk

#53 Técnico en linguística/localización o en software?

Estamos además hablando de chino, que hay casi que echarle de comer aparte en temas de discrepancias culturales, dobles sentidos y ambiguedades.

Me puedo imaginar que una red neuronal, dentro de un contexto particular limitado, bajo un dialecto restringido (como el de un periodico), donde probablemente muchas frases se repitan, pueda ser capaz de dar resultados decentes en muchos casos (no todos). Pero la sacas del contexto, o mezclas nuevos términos y me puedo imaginar que la liará parda.

D

#19 Para cuándo un babelfish real entonces?

D

#60 Ya lo hay, sobre todo si se utiliza como source un language controlled. Al final los traductores van a desaparecer y quedarán unos cuantos revisores para hacer un afinado de el motor de MT (machine translation) para cada tipo de cliente/ámbito.

Al final las empresas de traducción van a desaparecer y los proveedores de traducciones van a ser: Google, Microsoft.

Las empresas de traducción se van a tener que reciclar en otros valores añadidos.

D

#64 Si lo hay desde luego público no es, porque ningún traductor es capaz de dejarte un texto que no tenga fallos de construcción e interpretación

EauDeMeLancomes

#22 es un juego de palabras intraducible ya que no hay equivalencia homófona en castellano. Que pretendes demostrar con eso? Igual hablas pocos idiomas pero los juegos de palabras no se traducen. Como mucho, en contexto, los cambias por una expresión similar. Eso no es traducción...

u

#31 Pues eso, que los juegos de palabras no se traducen, cosa que microsoft translator este no sabe...

Aparte, que como dice #38, "diptangas" sería una buena traducción, cosa que tampoco no ha sabido ver la ia.

EauDeMeLancomes

#40 diptangas me mola #38 pero para mi gusto pierde el 50% del juego de palabras (dip > deep > profundo) ... Por eso para mi, eso no es traducir, sino interpretación. Y la máquina, de momento, se vende como traductora. Pero vamos que nada más lejos de mi campo, no soy traductor ni por asomo.
De momento creo que él metodo que dices sería lo más apropiado y barato... pero no le quedarán muchos años hasta que, leyendo, sea capaz de indexar casi todas esas expresiones y entenderlo. Nos parece algo muy humano pero yo lo veo bastante sencillo. No se.

KeyserSoze

#54 Yo es que el principal problema que le veo a todo esto es, si ya a un equipo de traducción con solera, experiencia, recursos (tanto idiomáticos como culturales) les cuesta traducir según qué cosas... veo complejo que por mucho que las IA avancen puedan llegar a la profundidad de los dobles y triples sentidos y los juegos de palabras (y vuelvo a poner a Pratchett de ejemplo como autor que juega con el inglés de una manera muy jodida de trasladar con toda su esencia a otros idiomas)

llorencs

#38 Muy costoso. Se tendría que ver si vale la pena entrenar el motor, y luego ver si la postedicion no es muy alta que se convierte finalmente en traducción.

Z

#31 Todo puede adaptarse, desde un juego de palabras, hasta referencias humorísticas que conlleven referencias culturales (con mayor o menor éxito) tal y como apunta #38 . Pretendo demostrar que no existe aún la capacidad de procesamiento suficiente en las redes neuronales como para traducir todo tipo de textos. Te pongo un ejemplo: Hay un accidente de coche en la puerta de tu edificio, tú llegas de trabajar y te encuentras a una multitud rodeando lo que parecen dos coches totalmente destrozados (es obvio que han tenido un accidente). En ese momento llega tu vecino, que también se sorprende y te pregunta:

+¿Qué ha pasado?
Tú le respondes:
-Antonio que ya iba... glu glu glu.

Ambos conocen el contexto. Un tercer individuo, conocido por ambos, con problemas de alcoholismo, y que problablemente haya ocasionado ya algún que otro conflicto de cualquier otra naturaleza, se ha emborrachado y ha ocasionado un accidente de tráfico. Ninguno de los dos interlocutores parece estar sorprendido, por lo que puede deducirse que se esperaban que tarde o temprano sucediese algo así. Ambos interlocutores tienen la suficiente cercanía / confianza como para hablar de ese modo ligeramente condescendiente de un tercer individuo conocido por ambos.

Mientras que una máquina no sea capaz de extraer toda esa información en forma de algoritmo, nunca habrá paridad con un traductor humano. Por supuesto que el traductor ya no será necesario para traducir manuales de instrucciones, guías de distinta índole, normativas... etc. Pero mientras se parta de la premisa de que la lengua es algo estanco y estático, jamás habrá paridad en traducciones literarias, ni en traducciones que requieran conocer las distintas acepciones de un término homógrafo. En algunos sociolectos hay palabras que según la entonación y el contexto pueden llegar a tener más de 20 o 30 significados distintos.

PD: Para #38 sí, yo también creo que en gran parte de los distintos ámbitos de la traducción la figura del traductor pasará paulatinamente a la de "revisor". Alimentando a su vez a la IA que tome debida nota de estos errores. Pero insisto, mientras no se tenga en cuenta la teoría de la relevancia, no habrá paridad.

cc #11

D

#61 Ya pero imagínate que esa MT te traduce el 95% del texto que sabe que está bien traducido y te deja un 5% de frases ambígüas para revisión de un traductor humano.

Te has cargado el 95% de la facturación de un traductor y donde antes tenías 10 traductores ahora necesitas 1 simplemente para revisar.

D

#38 Evidentemente no todo lo puede traducir una máquina perfectamente. Pero la mayoría sí. Existe lo que se llama Language controlled que significa que tu redactas el Source (el idioma fuente) de una manera que no sea ambíguo etc...

Eso se puede hacer en el 97% de la documentación técnica. De otro tipo de traducciones "mas humanas" se encargarán revisores que adapten lo ya traducido por una máquina y le den un toque más humano. Pero no te creas que van a tener que tocar mucho.

A parte a una MT no le dices "Tradúceme esto" le dices, voy a traducir un manual técnico de una impresora Toshiba y la MT tiene ciertas reglas que son diferentes si por ejemplo traduces un manual de un equipo médico.

A parte hay mezcla de MT (Machine translation) y TM (Translation memory). Es decir la clásica traducción basada en repositorios de bases de datos y la creatividad de MT+Glosarios, estilos, etc.

llorencs

#65 Has dicho que eras técnico, ¿quieres decir qué eres ingeniero de localización?

Y agreed, más o menos.

SoyUnLimon

#65 A lo que llamas retocar para que suene mas humano se le denomina "proof reading".

El problema es que cuando en el paso anterior, la traducción ha sido hecha por una máquina y la caga, el significado original se pierde completamente o incluso se cambia, haciendo mucho mas costosa su validación, con lo que el esfuerzo se multiplica en el proof reader.
mas tiempo de validación=cobra mas caro
Además se incrementa el riesgo de hacer una mierda de traducción.

llorencs

#80 Obviamente no se puede aplicar la traducción automática en todos los casos. Pero, sí que es verdad que la tendencia es hacer más uso de traducción automática más post-edición para muchos tipos de texto, y cada vez más.

Obviamente hay tipos de texto donde ese riesgo que mencionas es muy alto, y que te cambie los sentidos y al final la post-edición se parezca más a una traducción normal, porque el traductor tiene que hacer un montón de cambios. En ese caso, normalmente no se usará la traducción automática e irás a la traducción tradicional.

SoyUnLimon

#81 Efectivamente, a día de hoy casi todos los traductores traducen textos cuyo resultado final debe ser preciso y fiel al significado e intención del texto original, esto no va a cambiar.
A día de hoy una maquina no es capaz ni de traducir entre lenguajes de programación de alto nivel de forma óptima, ni que decir entre lenguajes humanos.

Ferk

#31 Si no traduces un juego de palabras no te enteras del chiste.

Y ahí está la cosa: traducir una frase no implica que se pueda comprender. Y normalmente el objetivo es la comprensión, lo que se busca no es tanto una "traducción" sino una "localización".

Un ser humano no sólo traduce la frase sino que la puede localizar para que pueda aproximarse a la intención que el autor original pretendía para la gente del país objetivo.

D

¡Por fin podremos comprender los menús de los restaurantes chinos!

celyo

#7 No te den gato por liebre o perro San Bernardo por ternera.

shem

Esto me recuerda una noticia reciente donde un ejercito de meneantes se me tiró a la yugular por decir que la traduccion automática iba a hacer irrelevante la enseñanza de idiomas...
Corea del Sur prohibe enseñar inglés hasta los 10 años de edad [ENG]/c9#c-9

RamonMercader

#17 yo lo mantengo. Traducir noticias es un subconjunto muy limitado del lenguaje y menos sensible al contexto.

shem

#27 Cierto, cierto, pero recordemos que tu eres el que considera que "La traducción en tiempo real probablemente este ya en su apogeo" y que ni siquiera el goteo constante de progresos le hace dudar de su axiomática afirmación lol

RamonMercader

#47 progresos técnicos de meterle una red neuronal mejor entrenada, mas refinada, etc... Quizá me explique mal, me refiero a que en base a las limitaciones teóricas que tenemos estamos al máximo o cerca. Cuando se rompa esa barrera teórica volveremos a la casilla de salida en cuanto a avances. Pero si, apogeo no es el mejor termino.
Va a hber un goteo constante de progresos, como en casi todo. Como el motor de combustión, no ha parado de mejorar, pero en lo fundamental es básicamente igual al primer motor. Los ordenadores de hoy son muchisimo mejores que los de hace años, pero fundamentalmente son arquitectura von-neumann y su base teorica es la misma.

El ordenador cuántico (si llega a materializarse) sería el equivalente al salto en la traducción automática que yo digo que falta. Mientras no haya se salto, se puede refinar lo que quieras, pero no sustituir a un humano. Sustituirlo en según que caso, en aliexpress no usan humanos par atraducir y les va bien lol.

En cualquier caso, la noticia viene a decir que han entrenado una red neuronal para que traduzca un set de noticias tan bien como personas, que ahora queda conseguir que traduzca cualquier noticia. También te puedo entrenar yo una red neuronal que adivine el número de lotería ganador basado en un set de datos de sorteos, lo difícil va a ser que acierte uno que no ha ocurrido o que no está en el dataset.

llorencs

#49 Y además que probablemente esos set de datos estén completamente ya se hayan adaptado para la traducción automática.

Aunque es un hecho, que cada vez va a haber menos traducción directa y más post-edición. Y a muchos traductores eso los va a joder un mogollón.

RamonMercader

#50 si, tiene pinta de que lo que hace ahora un equipo de traductores lo haran un software y un revisor. Pero lo que dicen muchos de que la traducción simultánea en tiempo real que nos permita comunicarnos con cualquier persona del mundo no se vislumbra en el horizonte. Ojalá algún dia exista, la tecnología y la ciencia derrotando a Dios y la maldición de la torre de babel. Como la epidural, otra derrota de Dios

D

#50 Eso es lo que hay ahora mismo. MT+Revisión. Pero si el documento tiene 100.000 palabras MT le da 3.000 al revisor y le dice "Estas 3.000 no estoy seguro si las he traducido bien". No es que diga "revísame las 100.000 palabras"

Imagina el avance que es tener a 5 tíos traduciendo (con sus preferencias presonales en la manera de traducir por mucho glosario y guía de estilo que haya) a una máquina que te lo traduce todo y una pequeña parte la tienes que revisar.

llorencs

#67 Sí, lo sé. Lo único que he dicho, que la tendencia es hacia menos traducción directa y más MT con post-edición.

D

#10 No tienes ni idea (Y sé perfectamente de lo que hablo, estoy en el negocio de la traducción)

Wintermutius

#10 Iba a decir que no acabo de creerme la noticia. Tu comentario es la explicación de por qué no me lo creo, pero no sabía cómo expresarlo. Gracias: dos noticias en una.

p

con la misma calidad y precisión que una persona, pero igual la persona no era muy lista...

llorencs

#41 A ver, depende del par lengua. Alemán-español, ruso-español... no lo uses mas que para hacerte una ligera idea de lo que dicen, porque las traducciones sera malas.

Prueba alemán -inglés, es probable que sea mejor. Además de que para algunos pares de lenguas usa el inglés de lengua pívot, y eso reduce mucho la calidad.

D

#41 Es lo que te comenta #45 yo lo uso siempre en inglés, porque muchos idiomas los hacen cruzando diccionarios (Español - inglés + inglés - chino) como es lógico la mejor versión de cualquier diccionario siempre es la inglesa.

Y no sólo rótulos de una estación de tren o menús de restaurante (que son cosas muy simples, pero la otra opción es ponerte en plan Indiana Jones y buscar los símbolos que te has apuntado)

Alquilando una moto, le dije al programa que tradujera "oye y que pasa si pincho una rueda o no funciona?" la app hizo su magia y la señora a la que me dirigía me dio una tarjeta de asistencia en carretera.

curaca

A mí me parece que la traducción automática está avanzando a pasos agigantados. Es verdad que durante algunos años google translate, el más popular, ha traducido un poco en indio, pero yo he notado que últimamente ha mejorado mucho, te da opciones para contextualizar la frase que quieres traducir, y del inglés al español es bastante eficaz, con alguna limitación, pero seguro que está "aprendiendo" con la cantidad de datos que todos los días le proporcionamos a Google.
Y como dice un meneante más arriba, esto es lo que hay de cara al públio, lo que se esté haciendo en los laboratorios no lo sabemos, pero el uso de las IA's debe ser masivo.
Lo que quiero decir es que de aqui a diez años, no es que se vaya a dar una paso, en mi opinión estamos ante las puertas de un salto cualitativo.

s

Ojalá sea verdad... El traductor de google lleva décadas siendonun truño...

Y sigue siendo un truño.
Un traductor automático efectivo sería un enorme paso para la humanidad.

SpanishPrime

#12 Décadas no, siglos. lol

Psst, psst... se lanzó en 2006...

celyo

#15 Millennials ..... lol

D

#12 El traductor que ponen a tu disposición querrás decir.

Para la humanidad puede, para los traductores una putada.

D

#12 No tan truño, yo me lo llevé por China y me sacó de bastantes problemas. Sacar la cámara y que el programa te traduzca caracteres encima de lo que estás viendo en tiempo real es la puta hostia.

s

#30 #33 Carteles de la calle pase, pero cada vez que abro un periódico alemán en Google translate lloro de dolor.
Chinos ya ni se me ocurre! Lo que puede salir de ahí es, probablemente, motivo de guerra.
En verano fui a Alemania y fue la última vez que lo usé. Le daré una nueva oportunidad... Pero en verano era ub truño y creo que lloraré.

air

#12 Eres del 2012? El Google Translate hace al menos un año que ha tenido una actualización severa, le han implementado lenguaje natural y machine learning. Cada vez es más preciso, de forma exponencial, desde luego no perfecto, pero coges cualquier artículo en alemán y parece que lo ha escrito uno que sabe español, infinitamente más de lo que era hace 3 años.

obmultimedia

el siguiente paso Rajoy-maquuina, para que traduzcan bien lo que este señor dice.
por cierto, llegara un dia que no hara falta estudiar idiomas para entenderlos, llevarmos traductores automaticos tanto para la escucha como para el habla.

D

Antes se hablará una única lengua en el mundo que funcionarán bien los traductores automáticos.

systembd

¿El mismo resultado que los traductores chinos? Así que el sistema de Microsoft sigue haciendo un trabajo mediocre... pero ha aprendido perder el tiempo regateando el precio a posteriori

D

Esto acerca a Alonso a Ferrari.

lilili

Otro más!

D

Hay que tener en cuenta que tanto el chino como el inglés tienen gramáticas muy simples. El chino es puramente analítico, y el inglés no pero dentro de los idiomas indoeuropeos es el que más se acerca. Ahora que intenten traducir entre dos idiomas con gramáticas complejas, no sé, finlandés y euskera, a ver que pasa

llorencs

#56 Yo te aseguro que además de tener una base de datos mucho inferior, por lo tanto, más difícil, ciertamente, traducir de esas dos lenguas es una jodienda. Más del finés que es aglutinante a tope, y te pueden meter palabras compuestas de cualquier cosa.

Claramente, con lenguas con gramáticas jodidas es más duro. Por ejemplo, la traducción ruso-español es una puta mierda. Ruso-inglés está algo mejor.

D

#57 Eso está claro, todos estos algoritmos modernos se basan en tener bases de datos descomunales de las que extraer el modelo. Para idiomas más pequeños no hay datos suficientes.

Lo que no me quiero ni imaginar es un idioma polisintético como esos que hay en América, que con una palabra te dicen una frase entera

AlexCremento

Algunos lo venimos diciendo hace mucho. Ya no tiene sentido aprender una lengua que no sea la tuya.

t

Llevo unos meses en Shanghai (y lo que me queda) por lo que de idioma chino, poquino, con lo que tengo que estar constantemente usando traductores online y no hay ni uno que se salve. Ni uno! Todos te vomitan un párrafo totalmente ininteligible. Para palabras concertas ok, pero cuando tienen que estructurar una frase, date por jodido amigo.

D

#26 Yo creo que es probable que los traductores humanos sigan existiendo para idiomas con raíces y estructuras totalmente distintas como Español-Chino y vayan desapareciendo para lenguas con raíces comunes. No veo mucho sentido un traductor para ingles alemán cuando el traductor lo hace cada vez mejor y mejor. O un traductor para Español-Francés. Ya para Español-Italiano ni te digo.

El traductor ya no es que tenga que traducir, es que tiene que contextualizar y muchas cosas más.

llorencs

#34 En 2013-2014 en la facultad hicimos una mini comparación de motores de traductores automáticos del castellano -catalán. Los resultados con Google translate con la mini muestra que usamos, un artículo de la Wikipedia fue bastante bueno. Tuvimos que hacer poca post edición. En los otros motores el resultado fue bastante peor. Creo que usamos el de Microsoft también y por aquel entonces el de Google le pagaba mil vueltas.

Conclusión, ciertamente para traducir entre románicas la traducción automática probablemente logre la paridad en unos años.

PS. Los textos antes de pasarlos por el traductor automático se simplificaron, frases cortos, nada de subordinadas o coordinadas... etc.

Si hay frases complejas la traducción automática suele fallar.

D
D

#2 No fui yo,