EDICIóN GENERAL
262 meneos
1058 clics
Paridad Hombre-Maquina en la traducción Chino-Ingles conseguida [EN]

Paridad Hombre-Maquina en la traducción Chino-Ingles conseguida [EN]

Microsoft alcanza un hito histórico, usando Inteligencia Artificial para alcanzar el desempeño humano en la traducción de noticias del chino al inglés. Microsoft ha creado el primer sistema de traducción automática que puede traducir oraciones de artículos de noticias del chino al inglés con la misma calidad y precisión que una persona. Logró la paridad humana en un conjunto de pruebas comúnmente usado, llamado newstest2017. Evaluadores humanos bilingües externos compararon los resultados de Microsoft con dos de referencias independiente

| etiquetas: traducción , idiomas , ingles , chino , ai
#2 No fui yo,
IIOZO Caso Para el iphone 7 8 8 más Lindo Gato Espacio Luna Gato hombre Tiburón Pandas Animal negro Cajas Del Teléfono Cubierta para el iphone 8 Caso
#3 señor de AliExpress tu querer mandarme 4 piezas to Spain
#4 son unos cracks!
#3 Amazon está lleno de gloriosas traducciones no inferiores a esta. Al final vas pillando el vocabulario y lo entiendes más o menos.
#8 es que amazon se ha llenado de vendedores externos que envian desde china. ya no es lo que entiendas, son las risas que te echas.
Reíros, reíros, pero los traductores están acojonados.
#6 los traductores llevan una década acojonados. El google translate lo hace bastante bien y cada vez mejor por ejemplo. Los traductores que conozco sobreviven todos por el tema de traducciones juradas, que deben ir homologadas y firmadas (e incluso eso empieza a ser bastante laxo). Curiosamente el que mejor le va de los que conozco emigro a Bruselas a hacer un master y ha conseguido curro en el parlamento de la UE haciendo papeleos y esta mu mu feliz. (aparte de los que hicieron el CAP y estan opositando como locos para conseguir plaza)
#21 pues cuando vean el traductor de deepl.com van a temblar. Mil vueltas a Google (aunque menos idiomas soportados)
#28 Muchisimos menos.
#21 DeepL es incluso mejor que Google translate
www.deepl.com
#14 #29

Será mejor que el Google translate, aún así es caca!  media
#6 ¿seguro?

www.meneame.net/m/mnm/centro-botin-centro-saqueo-nuevo-ridiculo-promoc

#21 Dudo que para textos profesionales o contratos, te arriesgues a que por un término mal formulado en otro idioma, pueda derivarse en pérdidas de dinero.
#6 Yo estoy muy tranquila, la verdad. La traducción no solo consiste en reescribir palabra por palabra lo que dice el texto original.
#70 No, pero para entenderse basta. Solo unos pocos traductores serán necesarios para lo que tú dices.
#74 No sé si te has parado a pensar en la cantidad de textos que se traducen al día que no son solo “para entenderse”.
#6 Los traductores están encantados. El trabajo pesado lo hace el software, ellos pulen los detalles.
#76 Están tan encantados que el precio por palabra les está bajando cada dos por tres.
¡Por fin podremos comprender los menús de los restaurantes chinos!
#7 No te den gato por liebre o perro San Bernardo por ternera.
es.wikipedia.org/wiki/Pragmática#Teoría_de_la_relevancia_de_Sperber_

La teoría de la relevancia de Sperber y Wilson aún no ha sido adaptada en forma de algoritmo. Por lo que sin inferir información del contexto, no hay paridad ni de lejos, sino una mera ilusión de "traducción de calidad" basada en soluciones elegidas por frecuencia estadística.
#10 No tienes ni idea (Y sé perfectamente de lo que hablo, estoy en el negocio de la traducción)
#11 Has usado el principio de autoridad, pero sin contrargumentar más allá del no tienes ni idea.
#13 Tienes razón. No puedo contrargumentarte con datos porque no puedo dártelos. No es que no los tenga, es que no puedo dártelos.

De verdad. No voy de farol. Y eso que en mi empresa soy un mindundi pero la gente habla, el CEO dice ciertas cosas, se abandonan ciertas líneas de investigación, etc.
#19 Esto suena a que estás en el negocio de la traducción, pero no eres un traductor, lingüista, investigador, etc., sino un administrativo, comercial, financiero, otros, etc. Lo digo por lo de mindundi

Si eso fuera así, no puedes usar el principio de autoridad, solo porque escuchas comentarios "radio patio".

Hablo desde un gran desconocimiento en la materia, pero un gran interés en esta noticia y, por tanto, interés también en que todos argumentemos lo máximo posible.

En mi caso, sigo sin creerme mucho la noticia, ...
#42 Soy técnico. Pues nada oye... Que tienes razón.
#53 Técnico en linguística/localización o en software?

Estamos además hablando de chino, que hay casi que echarle de comer aparte en temas de discrepancias culturales, dobles sentidos y ambiguedades.

Me puedo imaginar que una red neuronal, dentro de un contexto particular limitado, bajo un dialecto restringido (como el de un periodico), donde probablemente muchas frases se repitan, pueda ser capaz de dar resultados decentes en muchos casos (no todos). Pero la sacas del contexto, o mezclas nuevos términos y me puedo imaginar que la liará parda.
#19 Para cuándo un babelfish real entonces?
#60 Ya lo hay, sobre todo si se utiliza como source un language controlled. Al final los traductores van a desaparecer y quedarán unos cuantos revisores para hacer un afinado de el motor de MT (machine translation) para cada tipo de cliente/ámbito.

Al final las empresas de traducción van a desaparecer y los proveedores de traducciones van a ser: Google, Microsoft.

Las empresas de traducción se van a tener que reciclar en otros valores añadidos.
#64 Si lo hay desde luego público no es, porque ningún traductor es capaz de dejarte un texto que no tenga fallos de construcción e interpretación
#11 Teoría de la relevancia 1 - Microsoft 0
PD: Tú tampoco tienes ni idea, yo también estoy en el negocio de la traducción xD  media
#22 es un juego de palabras intraducible ya que no hay equivalencia homófona en castellano. Que pretendes demostrar con eso? Igual hablas pocos idiomas pero los juegos de palabras no se traducen. Como mucho, en contexto, los cambias por una expresión similar. Eso no es traducción...
#31 #22 Entiendo que la traducción del juego de palabras debería ser algo como "diptangas" (que si, sabemos que no es la palabra real, pero por el bien de la gracia debería ser así).

Pregunta seria ya que ambos estáis en el "negocio de la traducción". Al igual que en el chiste del twit, y como pasa por ejemplo en las traducciones de Terry Pratchett a otros idiomas, hay muchísimos juegos de palabras y perversiones lingüisticas imposibles muy jodidas de traducir. Puede que el futuro de la traducción (literaria al menos) pase por una primera versión de la máquina con revisión y perfeccionamiento por parte de la persona? Cómo lo veis?
#31 Pues eso, que los juegos de palabras no se traducen, cosa que microsoft translator este no sabe...

Aparte, que como dice #38, "diptangas" sería una buena traducción, cosa que tampoco no ha sabido ver la ia.
#40 diptangas me mola #38 :-) pero para mi gusto pierde el 50% del juego de palabras (dip > deep > profundo) ... Por eso para mi, eso no es traducir, sino interpretación. Y la máquina, de momento, se vende como traductora. Pero vamos que nada más lejos de mi campo, no soy traductor ni por asomo.
De momento creo que él metodo que dices sería lo más apropiado y barato... pero no le quedarán muchos años hasta que, leyendo, sea capaz de indexar casi todas esas expresiones y entenderlo. Nos parece algo muy humano pero yo lo veo bastante sencillo. No se.
#54 Yo es que el principal problema que le veo a todo esto es, si ya a un equipo de traducción con solera, experiencia, recursos (tanto idiomáticos como culturales) les cuesta traducir según qué cosas... veo complejo que por mucho que las IA avancen puedan llegar a la profundidad de los dobles y triples sentidos y los juegos de palabras (y vuelvo a poner a Pratchett de ejemplo como autor que juega con el inglés de una manera muy jodida de trasladar con toda su esencia a otros idiomas)
#38 Muy costoso. Se tendría que ver si vale la pena entrenar el motor, y luego ver si la postedicion no es muy alta que se convierte finalmente en traducción.
#31 Todo puede adaptarse, desde un juego de palabras, hasta referencias humorísticas que conlleven referencias culturales (con mayor o menor éxito) tal y como apunta #38 . Pretendo demostrar que no existe aún la capacidad de procesamiento suficiente en las redes neuronales como para traducir todo tipo de textos. Te pongo un ejemplo: Hay un accidente de coche en la puerta de tu edificio, tú llegas de trabajar y te encuentras a una multitud rodeando lo que parecen dos coches totalmente…   » ver todo el comentario
#61 Ya pero imagínate que esa MT te traduce el 95% del texto que sabe que está bien traducido y te deja un 5% de frases ambígüas para revisión de un traductor humano.

Te has cargado el 95% de la facturación de un traductor y donde antes tenías 10 traductores ahora necesitas 1 simplemente para revisar.
#38 Evidentemente no todo lo puede traducir una máquina perfectamente. Pero la mayoría sí. Existe lo que se llama Language controlled que significa que tu redactas el Source (el idioma fuente) de una manera que no sea ambíguo etc...

Eso se puede hacer en el 97% de la documentación técnica. De otro tipo de traducciones "mas humanas" se encargarán revisores que adapten lo ya traducido por una máquina y le den un toque más humano. Pero no te creas que van a tener que tocar mucho.

A…   » ver todo el comentario
#65 Has dicho que eras técnico, ¿quieres decir qué eres ingeniero de localización? :-D

Y agreed, más o menos.
#65 A lo que llamas retocar para que suene mas humano se le denomina "proof reading".

El problema es que cuando en el paso anterior, la traducción ha sido hecha por una máquina y la caga, el significado original se pierde completamente o incluso se cambia, haciendo mucho mas costosa su validación, con lo que el esfuerzo se multiplica en el proof reader.
mas tiempo de validación=cobra mas caro
Además se incrementa el riesgo de hacer una mierda de traducción.
#80 Obviamente no se puede aplicar la traducción automática en todos los casos. Pero, sí que es verdad que la tendencia es hacer más uso de traducción automática más post-edición para muchos tipos de texto, y cada vez más.

Obviamente hay tipos de texto donde ese riesgo que mencionas es muy alto, y que te cambie los sentidos y al final la post-edición se parezca más a una traducción normal, porque el traductor tiene que hacer un montón de cambios. En ese caso, normalmente no se usará la traducción automática e irás a la traducción tradicional.
#81 Efectivamente, a día de hoy casi todos los traductores traducen textos cuyo resultado final debe ser preciso y fiel al significado e intención del texto original, esto no va a cambiar.
A día de hoy una maquina no es capaz ni de traducir entre lenguajes de programación de alto nivel de forma óptima, ni que decir entre lenguajes humanos.
#31 Si no traduces un juego de palabras no te enteras del chiste.

Y ahí está la cosa: traducir una frase no implica que se pueda comprender. Y normalmente el objetivo es la comprensión, lo que se busca no es tanto una "traducción" sino una "localización".

Un ser humano no sólo traduce la frase sino que la puede localizar para que pueda aproximarse a la intención que el autor original pretendía para la gente del país objetivo.
#10 Iba a decir que no acabo de creerme la noticia. Tu comentario es la explicación de por qué no me lo creo, pero no sabía cómo expresarlo. Gracias: dos noticias en una.
Ojalá sea verdad... El traductor de google lleva décadas siendonun truño...

Y sigue siendo un truño.
Un traductor automático efectivo sería un enorme paso para la humanidad.
#12 Prueba este: www.deepl.com/translator

No hace milagros, pero es algo mejor que el de Google.
#12 Décadas no, siglos. xD

Psst, psst... se lanzó en 2006...
#15 Millennials ..... xD
#12 El traductor que ponen a tu disposición querrás decir.

Para la humanidad puede, para los traductores una putada.
#12 No tan truño, yo me lo llevé por China y me sacó de bastantes problemas. Sacar la cámara y que el programa te traduzca caracteres encima de lo que estás viendo en tiempo real es la puta hostia.
#30 #33 Carteles de la calle pase, pero cada vez que abro un periódico alemán en Google translate lloro de dolor.
Chinos ya ni se me ocurre! Lo que puede salir de ahí es, probablemente, motivo de guerra.
En verano fui a Alemania y fue la última vez que lo usé. Le daré una nueva oportunidad... Pero en verano era ub truño y creo que lloraré.
#41 A ver, depende del par lengua. Alemán-español, ruso-español... no lo uses mas que para hacerte una ligera idea de lo que dicen, porque las traducciones sera malas.

Prueba alemán -inglés, es probable que sea mejor. Además de que para algunos pares de lenguas usa el inglés de lengua pívot, y eso reduce mucho la calidad.
#41 Es lo que te comenta #45 yo lo uso siempre en inglés, porque muchos idiomas los hacen cruzando diccionarios (Español - inglés + inglés - chino) como es lógico la mejor versión de cualquier diccionario siempre es la inglesa.

Y no sólo rótulos de una estación de tren o menús de restaurante (que son cosas muy simples, pero la otra opción es ponerte en plan Indiana Jones y buscar los símbolos que te has apuntado)

Alquilando una moto, le dije al programa que tradujera "oye y que pasa si pincho una rueda o no funciona?" la app hizo su magia y la señora a la que me dirigía me dio una tarjeta de asistencia en carretera.
#12 Eres del 2012? El Google Translate hace al menos un año que ha tenido una actualización severa, le han implementado lenguaje natural y machine learning. Cada vez es más preciso, de forma exponencial, desde luego no perfecto, pero coges cualquier artículo en alemán y parece que lo ha escrito uno que sabe español, infinitamente más de lo que era hace 3 años.
con la misma calidad y precisión que una persona, pero igual la persona no era muy lista...
Esto me recuerda una noticia reciente donde un ejercito de meneantes se me tiró a la yugular por decir que la traduccion automática iba a hacer irrelevante la enseñanza de idiomas...
www.meneame.net/c/23808393
#17 yo lo mantengo. Traducir noticias es un subconjunto muy limitado del lenguaje y menos sensible al contexto.
#27 Cierto, cierto, pero recordemos que tu eres el que considera que "La traducción en tiempo real probablemente este ya en su apogeo" y que ni siquiera el goteo constante de progresos le hace dudar de su axiomática afirmación xD
#47 progresos técnicos de meterle una red neuronal mejor entrenada, mas refinada, etc... Quizá me explique mal, me refiero a que en base a las limitaciones teóricas que tenemos estamos al máximo o cerca. Cuando se rompa esa barrera teórica volveremos a la casilla de salida en cuanto a avances. Pero si, apogeo no es el mejor termino.
Va a hber un goteo constante de progresos, como en casi todo. Como el motor de combustión, no ha parado de mejorar, pero en lo fundamental es básicamente igual al…   » ver todo el comentario
#49 Y además que probablemente esos set de datos estén completamente ya se hayan adaptado para la traducción automática.

Aunque es un hecho, que cada vez va a haber menos traducción directa y más post-edición. Y a muchos traductores eso los va a joder un mogollón.
#50 si, tiene pinta de que lo que hace ahora un equipo de traductores lo haran un software y un revisor. Pero lo que dicen muchos de que la traducción simultánea en tiempo real que nos permita comunicarnos con cualquier persona del mundo no se vislumbra en el horizonte. Ojalá algún dia exista, la tecnología y la ciencia derrotando a Dios y la maldición de la torre de babel. Como la epidural, otra derrota de Dios :troll:
#50 Eso es lo que hay ahora mismo. MT+Revisión. Pero si el documento tiene 100.000 palabras MT le da 3.000 al revisor y le dice "Estas 3.000 no estoy seguro si las he traducido bien". No es que diga "revísame las 100.000 palabras"

Imagina el avance que es tener a 5 tíos traduciendo (con sus preferencias presonales en la manera de traducir por mucho glosario y guía de estilo que haya) a una máquina que te lo traduce todo y una pequeña parte la tienes que revisar.
#67 Sí, lo sé. Lo único que he dicho, que la tendencia es hacia menos traducción directa y más MT con post-edición.
¿El mismo resultado que los traductores chinos? Así que el sistema de Microsoft sigue haciendo un trabajo mediocre... pero ha aprendido perder el tiempo regateando el precio a posteriori :troll:
Esto acerca a Alonso a Ferrari.
translation system that can translate sentences of news articles from Chinese to English

Parece que no pero ese pequeño matiz cambia totalmente el problema. Las frases de las noticias son muy directas, cortas y sin ambiguedades. Es un avanze, sí, pero el sistema no es capaz de traducir chino a inglés como aquí se imagina todo el mundo. También os digo que si yo fuera traductor me iba formando en algo más porque algún día no muy lejano dejarán de ser útiles.

P.S. titular amarillista a más no poder
#24 Ahí te has pasado, llamar a titular amarillista porque va de chinos es muy racista.
Llevo unos meses en Shanghai (y lo que me queda) por lo que de idioma chino, poquino, con lo que tengo que estar constantemente usando traductores online y no hay ni uno que se salve. Ni uno! Todos te vomitan un párrafo totalmente ininteligible. Para palabras concertas ok, pero cuando tienen que estructurar una frase, date por jodido amigo.
#26 Yo creo que es probable que los traductores humanos sigan existiendo para idiomas con raíces y estructuras totalmente distintas como Español-Chino y vayan desapareciendo para lenguas con raíces comunes. No veo mucho sentido un traductor para ingles alemán cuando el traductor lo hace cada vez mejor y mejor. O un traductor para Español-Francés. Ya para Español-Italiano ni te digo.

El traductor ya no es que tenga que traducir, es que tiene que contextualizar y muchas cosas más.
#34 En 2013-2014 en la facultad hicimos una mini comparación de motores de traductores automáticos del castellano -catalán. Los resultados con Google translate con la mini muestra que usamos, un artículo de la Wikipedia fue bastante bueno. Tuvimos que hacer poca post edición. En los otros motores el resultado fue bastante peor. Creo que usamos el de Microsoft también y por aquel entonces el de Google le pagaba mil vueltas.

Conclusión, ciertamente para traducir entre románicas la traducción…   » ver todo el comentario
A mí me parece que la traducción automática está avanzando a pasos agigantados. Es verdad que durante algunos años google translate, el más popular, ha traducido un poco en indio, pero yo he notado que últimamente ha mejorado mucho, te da opciones para contextualizar la frase que quieres traducir, y del inglés al español es bastante eficaz, con alguna limitación, pero seguro que está "aprendiendo" con la cantidad de datos que todos los días le proporcionamos a Google.
Y como dice un…   » ver todo el comentario
el siguiente paso Rajoy-maquuina, para que traduzcan bien lo que este señor dice.
por cierto, llegara un dia que no hara falta estudiar idiomas para entenderlos, llevarmos traductores automaticos tanto para la escucha como para el habla.
Hay que tener en cuenta que tanto el chino como el inglés tienen gramáticas muy simples. El chino es puramente analítico, y el inglés no pero dentro de los idiomas indoeuropeos es el que más se acerca. Ahora que intenten traducir entre dos idiomas con gramáticas complejas, no sé, finlandés y euskera, a ver que pasa :troll:
#56 Yo te aseguro que además de tener una base de datos mucho inferior, por lo tanto, más difícil, ciertamente, traducir de esas dos lenguas es una jodienda. Más del finés que es aglutinante a tope, y te pueden meter palabras compuestas de cualquier cosa.

Claramente, con lenguas con gramáticas jodidas es más duro. Por ejemplo, la traducción ruso-español es una puta mierda. Ruso-inglés está algo mejor.
#57 Eso está claro, todos estos algoritmos modernos se basan en tener bases de datos descomunales de las que extraer el modelo. Para idiomas más pequeños no hay datos suficientes.

Lo que no me quiero ni imaginar es un idioma polisintético como esos que hay en América, que con una palabra te dicen una frase entera :-D
Antes se hablará una única lengua en el mundo que funcionarán bien los traductores automáticos.
Otro más!  media
Algunos lo venimos diciendo hace mucho. Ya no tiene sentido aprender una lengua que no sea la tuya.
comentarios cerrados

menéame