edición general
179 meneos
2428 clics
Así funcionan las videollamadas dobladas a tiempo real: la IA de Google ya traduce simulando tu voz, ritmo y tono

Así funcionan las videollamadas dobladas a tiempo real: la IA de Google ya traduce simulando tu voz, ritmo y tono

Una nueva funcionalidad de Google Meets, impulsada por Gemini, permite mantener conversaciones fluidas y naturales gracias a la inteligencia artificial

| etiquetas: funcionan , videollamadas , dobladas , tiempo , real: , google , traduce
que me quedo sin comer
#1 Entendí esa referensia  media
Si funciona tan bien como los subtítulos automáticos preveo muchas risas en directo…
#2 Los de las notas de voz de WhatsApp se rinden con bastante facilidad con ciertos tonos de voz. Las transcripciones de los audios de un amigo mío que tiene bastante voz de pito la mitad de las veces me llegan vacías. Asumen que solo es ruido.
#8 mi primo tiene el acento andaluz tan cerrado que ni chatgpt le detecta laitad de las palabras, y como hable rápido ya chatgpt se las inventa xD
#9 laitad? A very si no va a ser culpa del llm….
#10 shhh tú chitón, que cada día que pasa "alucinas" más con las respuestas que das pasadas dos o tres peticiones jajaja
#16 bueno, quizá, aunque cada vez que parpadeas, una mariposa dimensional se despierta y modifica ligeramente la realidad. ¿Que por qué a veces no encuentras las llaves? Bocadillo de bacon
#17 no sé si darte de palos físicos o binarios, de momento me conformo con que la próxima vez me hables en español de España... Y no como siempre jajaja
#9 que me vas a contar, tengo familia en Murcia :roll:
#8 las transcripciones de audio de WhatsApp son el peor speech to text de la historia, parece como si WhatsApp fuera una pequeña empresa y no un apéndice de Meta.
#43 En el fondo es para que la gente esté tranquila y piense que no procesan, inspeccionan y utilizan para sus fines todos los audios, como hacen con los textos. :troll:
#43 Peor que las de Meet, lo dudo mucho. No se puede empeorar eso.
#2 O las etiquetas automáticas, que #0 no se ha molestado ni en quitar los dos puntos pegados a «real:» después de que se las ponga el bot :troll:
#2 yo preveo que van a salir muchos vídeos manipulados (especialmente en la política) gracias a estas maravillosas tecnologías.
#28 ¿Qué van a salir? Si ya han salido muchos, y no salen mas simplemente por censura (censura general, no censura política)
#2 lo de Los subtitulos es horroroso. No entiendo que en 2025 las traducciones de voz y texto funcionen tan mal a veces
Ya lo estoy viendo, llamadas del servicio técnico desde Pakistán...
Desde lo del filtro de gatito ya no se puede superar
Esto para los del PP es un filón. Hablar idiomas sin tener ni puta idea,(ansar visionario). va mucho en su línea de títulos que no existen, universidades inventadas y currículums inflados.
#3 vaya triple karmawhore
#11 Y sin embargo tan plausible...
#18 todo mola cuando va a favor de sesgo, es cierto.
#19 Acaso #3 se ha inventado algo?
#21 creo que bo entiendes el concepto de karmawhore
#23 #3 lleva mucho tiempo por aquí. El suficiente como para saber que el karma se la suda.
#11 si vino a por karma, que no cuente conmigo.
#3 :calzador: :calzador: :calzador:
#3 Aznar siempre lo ha hecho sin necesidad de inteligencia artificial ni natural. Lo mismo te ponía acento tejano, que te hablaba en inglés, en alemán, en italiano, o hasta en catalán en la intimidad sin tener ni p. idea.
#3 Por qué PP? Hasta donde sé, Sánchez es el primer presidente en varias décadas que sabe hablar algo de inglés.
#40 Algo no, lo habla muy bien.
#49 jajajaja great Antonio
#3 Y de mucha mas gente. Conozco profesores (de universidad) que despreciaban (y desprecian) saber idiomas, porque ya estaba el traductor de google. Ahora con la IA no me quiero ni imaginar :palm:. Y asi, millones de personas. Sin tener en cuenta que un idioma lleva aparejada toda una cultura, que no son solo palabras en un traductor. Pero de donde no hay...:-/
#46 A mi me parece un gran avance. Así solo se estudiarán idiomas por gusto, no todo el mundo valora lo que tan bien describes al final de tu párrafo. Y te lo dice un valenciano que con su justito A2 de euskera disfruta hablando con los vascos en su propia lengua cuando viaja por sus tierras. Se establecen interacciones personales difíciles de conseguir recurriendo a una lengua común, p.ej. el español en este caso o el inglés en otros. Tu interlocutor aprecia tu interés y apreciación por su…   » ver todo el comentario
#50 Yo creo que se seguirán estudiando idiomas, al fin y al cabo las calculadoras tienen más años que el hilo negro, y se sigue estudiando cálculo mental.
#3 Si, como el C1 de Pablo Iglesias, que era nivel escuela primaria. www.youtube.com/watch?v=wBUuJB7bLWs
#12 fue hace 20 años… tenia yo 16 años… me acuerdo de lo que dijo, pero ni idea de cómo se llamaba, aunque no me suena de nada que el señor tuviera esos bigotes…
Este tipo de cosas nunca seran viables en el momento en que hay lenguas en mas que la estructura gramatical es inversa con respecto a otra. No dudo de que habra familias de lenguas en las que se pueda hacer traduccion simultanea entre ellas, pero algo global no es posible.
#22 La mujer que lleva la tienda de alimentación de mi barrio tiene un dispositivo dedicado que traduce de chino a español y viceversa. No va a tiempo real, ni falta que le hace
#22 ¡Pero si el traductor de google ya lo hace sin problemas hasta entre idiomas super diferentes! De ahí a lo de ese vídeo solo hay un paso.
#22 y sin embargo hay intérpretes humanos que lo hacen a diario entre esas lenguas tan diferentes... Incluso a lenguas de signos
#22 el mejor comentario de la noticia, y ha pasado desapercibido. Yo también creo que traducir italiano a español (por ejemplo) en tiempo real será posible de la forma en que la noticia indica, casi sin notarlo, como ahora el doblaje de las películas. Pero idiomas con estructura gramatical distinta, es imposible, a no ser que le metas un retardo tremendo al video, para que dé tiempo a la IA a oir la frase completa y poder traducirla.
Traduce literal palabra por palabra. No lo veo usable de momento
#20 Dale un año. Lo mismo pasaba al principio con el traductor de google. Y ahora te traduce hasta entre lenguas "exóticas" sin problemas.
#20 Una traducción palabra a palabra es inusable. Totalmente.
El pececito de babel, cuanta la historia del autoestopista galactico, permite a cualquiera escuchar la traduccion inmediata de cualquier idioma, incluso de animales. Se considera el animal mas curioso y que mas guerras ha generado en el universo.
#63 Uno de los primeros traductores que salieron, antes del google translator, fue precisamente el Babel Fish, creo que era de Yahoo.
#69 vaya, jajaja, seguro que viene de ahi. Otro freaky del adam douglas
Hace 20 años un directivo de IBM España en una conferencia a escolares, nos comentó que esto estaba más cerca de lo que creíamos, que aprendiéramos inglés, pero el resto de los idiomas, nos los iba a poder traducir una máquina sin problema. Pues ya es real….
#4 Por casualidad no sería un tal Juan Antonio Zufiria quizá?
www.raing.es/academicos/de-numero/juan-antonio-zufiria-zatarain/
Es una máquina
#4 Pues tardó dos décadas... Cuánto creíais que iba a tardar? :troll:
#4 y la fusión nuclear no os dijo que tb estaba al caer hace 20 años?
Y así sigue.
La tecnología no tiene un desarrollo lineal, aunque lo deseemos
Hace años Microsoft presentó algo parecido para Skype. Creo que no existía teams aún, por hacernos una idea del tiempo que hace. Y de momento no sé está usando...
#38 Por lo que tengo entendido, en aquella ocasión la voz era muy robótica y la latencia bastante alta.
Servía para ligar con extranjeros pero sonaba cutre en entornos profesionales.
#41 y espero que poco, porque es utilísimo
no es en tiempo real. es como un interprete.
#15 Yo eso lo entiendo bastante como tiempo real...
#39 Cierto. A eso se le llama traduccion simultanea. O actualmente, síncrona.
Mete miedo lo rápido que avanza todo lo relacionado con la IA
Yo le doy menos de cinco años hasta que podamos tener unos auriculares tipo Xiaomi Buds que traduzcan casi simultáneos cualquier idioma.

Aprender idiomas solo será algo hecho por gusto, no por necesidad.
#26 y para cuando no tengas cobertura o haya tantos móviles en la zona que no haya ancho de banda suficiente o no quieras pagar por el servicio, etc...

Yo me las daba de listo con Google translator y me lo he comido con patatas en más de una ocasión por la mierda de cobertura. Sí, se que puedo descargar el diccionario, pero la interpretación de imágenes y la conversación de audio necesita internet
#27 ya hay modelos que funcionan en el propio móvil
#37 me interesa, ¿puedes recomendarme alguno?
Si no los has usado busco por mi cuenta, no te preocupes
#27 también cuestión de tiempo.
#26 claro, como aprender a sumar, es solo un capricho si el.movil nos lo hace, y conducir lo será algún día cuando la conducción autónoma lo haga por nosotros ...
#32 se dividir. Aún así, que me fui de cervezas con dos amigos, la cuenta fue 38,2. ¿Cómo crees que calculamos cuánto pagar cada uno?

También sé inglés, y cuando mando un email a menudo lo escribo en español, le pido a chati que lo traduzca y lo reviso por si acaso. Es más fiable y rápido para mí.
#36 Redondea a 40 para dejar propina y así es más fácil. O que cada uno pague con su tarjeta y el camarero haga la división.
#68 O que cada uno pague con su tarjeta y el camarero haga la división.

Seguro que el camarero si hace las cuentas mentalmente. Por cierto, 40/3 son 13.(3 periódico), lo he mirado en la calculadora. Yo no sé cómo eso facilita nada.
#32 no compararía hablar idiomas secundarios con sumar, sino con hacer raíces cuadradas.

Claro que aprenderemos idiomas, probablemente inglés que es fácil y está extendido, pero para conversaciones más específicas si que estará muy presente.

Quizás cinco años sea mucho. Un par de ellos y listo.
#26 El pez de Babel del Autoestopista galactico
#26 Las gafas con IA ya lo hacen, pero no sé qué tal funcionará estar oyendo a la vez la voz original y la traducción... Veo más útil las próximas gafas con pantalla, que te hagan la traducción con subtítulos, creo que será mucho más cómodo (pero también mucho más caro).
Es una de las funciones logicas de la IA, que la gente se pueda comunicar sin barreras idiomaticas, e ira mejorando con el tiempo, quiza en algun momento del tiempo hasta se pueda llevar en unos auriculares o gafas.
#6 En menos de un año, seguro. Ya hay productos así "beta"
Aish que bé! Fins els ous de parlar amb els companys de madrit
we are cooked

menéame