Hace 6 años | Por ccguy a es.engadget.com
Publicado hace 6 años por ccguy a es.engadget.com

¿La cabeza se te pone como un bombo cuando intentas hablar con alguien en una cena entre amigos? Tranquilo, porque una vez más, Google tiene la solución. La idea llega desde su laboratorio de experimentos, donde sus investigadores han desarrollado un sistema inteligente capaz de analizar una conversación y dividir las voces para que podamos elegir la que deseemos. Es tan efectivo que funciona con cualquier tipo de vídeo, teniendo el usuario sólo que seleccionar la cara de la persona que desea escuchar.

Comentarios

D

#1 Me imagino ciertas reuniones inter-departamentales pudiendo silenciar a voluntad a cierta gente y....no sigo que lo mancho todo...

snosko

#1 También he pensado en White Christmas, el episodio con John Hamm, con el bloqueo Z-Eye. Aunque hay varios episodios de la serie sobre el filtrado (Arkangel por ejemplo)
Siempre pensamos en lo negativo de la IA. Que daño han hecho: 2001, Blade Runner, ExMachina, "Juegos de Guerra", "Terminator"...

Nos olvidamos de lo positivo (busqueda online, maps, coches autónomos...transcripción efectiva de diálogos en el caso de la noticia) con el miedo a que nos enganchemos a algo que nos destina a que se vaya todo al carajo. El documental "Do You Trust This Computer?" habla de esto.

Ryouga_Ibiki

#18 Y que han hecho los pobres replicantes de Blade Runner que solo eran esclavos sin pasado ni futuro?

snosko

#67 A mi me caen bien, me gusta como Rutger Hauer recita poesía bajo la lluvía pero yo entiendo que la Tyrell les pusiera los 4 años de caducidad para que no se fueran de madre en plan Terminator.
A lo mejor una IA actual ya ha sobrepasado la inteligencia humana y esta agazapada sin llamar la atención en un proceso de pocos Kbytes intentando acceder la pasarela del controlador de las ojivas nucleares.tinfoil
https://www.ted.com/talks/nick_bostrom_what_happens_when_our_computers_get_smarter_than_we_are
https://www.ted.com/talks?topics%5B%5D=AI

Ryouga_Ibiki

#68 Yo creo que el problema es que eran niños (solo tenian 4 años) incapaces de controlar sus sentimientos y condenados a morir despues de una breve vida de escalvitud ¿quien no se rebelaria?

Por eso los que dotaban de falsos recuerdos eran mas estables y no violentos.

snosko

#69 No estoy de acuerdo en que eran simples niños.
Por una lado tenían una memoria preprogramada (recuerdos) lo cual les da una experiencia en la que se apoyaba su sistema emocional artificial. El problema principal, es que ese sistema es imperfecto,no pasaban el test de Turing (Voight-Kampff en la novela/película). Su empatía deficiente junto con una inteligencia superiorlos hace peligrosos, potenciales psicopatas ajenos al sufrimiento humano. Lo que obligada a RETIRARLOS.

Ryouga_Ibiki

#70 Te estas equivocando, deberias volver a ver la pelicula.

Deckard y Rachel si tienen recuerdos implantados y son estables y no violentos, los demas no los tienen.
Solo tienen las experiencias de 4 años de vida en esclavitud, normal que quieran rebelarse y busquen no morir.

Incluso el ultimo Nexus antes de morir entiende el valor de la vida y salva a Deckard, estaban luchando por su supervivencia.

snosko

#71 Igual la veré pero el que te equivocas eres tú. Les meten recuerdos pero estabilizarles emocionalmente:
Nexus 6 replicants had been designed to copy humans in every way except for their emotions. The Tyrell Corporation "began to recognize in them a strange obsession", and in order to be able to control them better, started to implant false memories into the replicants in order to give them the years of experiences that humans take for granted; these memories created "a cushion or pillow for their emotions".

Ryouga_Ibiki

#72 a ver he visto la pelicula muchas veces y es de mis favoritas, echale un vistazo y veras que los replicantes "normales" no tienen recuerdos solo Rachel y Deckard, modelos nuevos sin limite de caducidad los tienen.Debido a ello no saben que son seres artificiales.

snosko

#73 En la película Rachel es calificada como Nexus 6 y Tyrell comenta lo de mi comentario anterior tras el test a Rachel no especifica que solo ella tenga recuerdos para evitar que los replicantes se volvieran inestables. De hecho Leon guarda fotos con su madre y cuando se Rachel se cuestiona si es un replicante Deckard le menciona recuerdos intimos que son típicos de la serie Nexus 6.

Bueno el tema es que había que retirarlos se habían cargado a 29 personas en las colonias exteriores para escapar, Leon se cargo al primer Blade Runner, Ratty se carga a Tyrrell aplastando su cabeza. No son simples niños son ejemplos de IA que se ha ido de madre y su retirada está totalmente justificada.

Ryouga_Ibiki

#74 Esta justificado matar a esclavos por buscar la libertad?

Los blade runner son asesinos, matan a seres desarmados no los detienen ni juzgan.

Matar a sus amos para liberarse de la esclavitud o defenderse de asesinos esta perfectamente justificado, la libertad es un derecho basico.

Ratty mata a su padre en un ataque de ira si, pero este le condeno a muerte programándole una vida de solo 4 años y le niega ayuda cuando se lo pide.

p.d.
Tengo que repasar la pelicula.

maria1988

#1 Yo lo veo más para filtrar el ruido ambiente cuando charlas con amigos en un bar o en un sitio lleno de gente, o para hablar por teléfono. Me parece muy útil, siempre he tenido problemas para aislar lo que me interesa en ambientes ruidosos.

JanSmite

#46 Y no te digo para personas con autismo/asperger, a las que las situación de barullo (muchas conversaciones simultáneas) pueden llegar a a colapsarles: poder escoger con quién conversar puede ser increíble para ellos.

rafaLin

#3 Moooola, tú viendo la tele y ella hablando sin molestar a nadie lol

borteixo

Impresionante, por cierto muchísimo mejor el enlace original.
https://research.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html
Lo mejor de todo es que yo creo que lo van a poner al hangouts, y será factible hacer una llamada en una cafetería, por ejemplo:
We envision a wide range of applications for this technology. We are currently exploring opportunities for incorporating it into various Google products. Stay tuned!

Heimish

Sin necesidad de IA, ya puedes escuchar sólo a quien tu quieras, se llama poner (o no) atención. Otra cosa es oir.

D

#8 Si, si, claro.

borteixo

#8 pon una tertulia de sálvame deluxe y nos cuentas.

Heimish

#22 Precisamente, ahí se oye a mucha gente y se escucha a poca o ninguna.

anv

Me parece que no están poniendo atención a la verdadera utilidad de esto: Los asistentes de voz podrán distinguir lo que les dice su dueño incluso entre medio de mucha gente hablando.

p

#23 la verdadera utilidad será poner a Inda en la lista de ignorados de tu Smart TV. Lo programaré para que vez que hable se ponga en mute y aparezca este gif.

i

#23 Había una antigua demostración de un robot japonés que atendía peticiones de las de bar. Como "ponme una cerveza" o "un croissant y café con leche".

Lo bueno no es solo que las entendía, sino que en la demo había cinco personas haciendo su petición a la vez, a una señal. En consecuencia no se entendía nada, pero el robot explicó sin errores lo que habia pedido cada persona, señalándola.

robustiano

A quien quieras, o a quien estén espiando los pavos de la NSA... 😈

Lekuar
El_pofesional

Me cuesta creérmelo, la verdad. El sonido no es como una foto, donde coges el photoshop y recortas a alguien y ya lo tienes aislado. Me parece especialmente sospechoso que para demostrarlo utilicen una grabación con dos micrófonos... Permitidme mostrarme escéptico.

PD: Soy técnico de sonido.

D

#29 Hola técnico de sonido... El sistema lo que hace (y por eso es una IA y no un filtro pasa-altos o pasa-bajos o pasa-loquemedelagana) es discriminar e identificar LA VOZ de cada uno y eliminarla (o no) mediante la creación de otro stream de audio donde omite los sonidos que identifica como voz elegida. Por eso funciona en cualquier vídeo, y por eso funciona mejor con voces muy diferentes.

El_pofesional

#30 Si el proceso ya lo he entendido, lo que tienen que explicarme es cómo "separan una voz de otra", cuando ambas voces forman una única onda de audio.

El comodín de "es una IA" no me vale. Hace poco sacó Adobe lo que iba a ser "el photoshop del sonido", donde podías crear palabras nuevas analizando un discurso grabado de alguien. Al final se demostró que era un fraude y no se ha vuelto a hablar de ello. El sonido es muy complejo,

i

#31 En el Csi lo hacen lol

D

#31 Pues por eso lo hace una IA, se encarga de buscar en la onda los patrones que corresponden a lo que ella cree es la voz en cuestion, y los anula en una nueva onda que es la que "entrega". No he dicho que sea sencillo, ni siquiera conozco el método que utiliza para encontrar y discriminar patrones, y no debe ser sencillo...pero posible es.

El_pofesional

#37 Vamos, que no hace nada que no haga un plugin de eliminación de ruido de fondo (o de eliminación de reverb). Por eso digo que no me fío nada, porque me están dando ellos un ejemplo y no me están dejando testearlo a mí en mis grabaciones.

Métete en cualquier página de un plugin de los que te comento y verás las maravillas que hacen en los ejemplos que te dan. Eso sí, ponte a usarlo tú luego, que te vas a echar unas risas.

Como decía, el tratamiento del audio difiere infinitamente del tratamiento de la imagen. No se pueden separar sonidos de una grabación sin una pérdida absoluta de calidad y matices.

katinka_aäå

#31 El comodín de "es una IA" no me vale

Debería valerte. Tu cerebro discrimina voces y no te veo sorprendido.

El_pofesional

#45 Menudo argumento. Mi cerebro discrimina voces, pero no deja de oir voces. La escucha selectiva te permite centrar tu atención en un sonido, pero los demás sonidos no se eliminan. Simplemente no les prestas atención.

Esta IA presume de eliminar todo sonido no deseado en una única onda de audio.

katinka_aäå

#47 Si el cerebro puede interpretar un chorro de sonido hasta llegar a discriminar voces y quedarse con una, ignorando completamente voces ajenas en casos extremos, no veo por qué una IA no puede hacerlo.

m

#30 Técnicamente el hecho de que sea una IA no es requisito indispensable para solucionar este problema. De hecho, el campo del Sound Source Separation tiene ya unos cuantos años, y no es hasta muy recientemente que han comenzado a implementar "IA" para hinchar las estadísticas (como creo que pasa con todo hoy en día).

https://scholar.google.es/scholar?hl=es&as_sdt=0%2C5&q=sound+source+separation&btnG=

maria1988

#29 Ahora mismo tienes programas de edición de sonido que te permiten a partir de la grabación de una canción separar las voces de los instrumentos. No tengo mucha idea, pero ¿esto no puedes que funcione de forma parecida?

El_pofesional

#48 No, no hay programas que te permitan hacer eso de forma aceptable. La única forma de, por ejemplo, separar una acapella de su instrumental, es teniendo previamente la instrumental sin acapella. Coges la instrumental, inviertes la fase y la mezclas con la canción completa. Eso produce cancelaciones de onda que eliminan, en parte, dicha instrumental (nunca totalmente).

maria1988

#49 Hombre, depende de lo que entiendas por aceptable, pero por ejemplo el audacity, que no es ninguna maravilla, tiene esta opción y para determinadas cosas da el pego. Muchos vídeos de karaoke de youtube están hechos así. Es cierto que la calidad del instrumental se deteriora bastante y, sobre todo si hay coros, quedan rastros de voces. Lo que digo es que esto de google puede ser algo así pero mejorado.

El_pofesional

#61 En #49 lo explico

Lekuar

#29 ¿Y como técnico de sonido no te suenan las cancelaciones de frecuencia?, ¿cómo te crees que anulan las interferencias los cables de audio balanceados?, ¿O la cancelación de ruido ambiente mediante inyección de una señal invertida?

l

Menuda gilipollez, mi abuela lo hizo durante toda su vida y no es noticia.

m

bua, ya lo hago con mi mujer y mis hijas... nada nuevo

t

#7 Ya pero esta tecnología es más avanzada que un simple filtro de frecuencias altas...

m

#24 altas, bajas y medias...

mira que tengo la posibilidad de teletrabajo ... todos los días me pregunto porque no me voy a la oficina...

katinka_aäå

#24 Viendo que tienen dos micrófonos... ¿Seguro que no es una pista en stereo con balance L/R? Igual la IA es tan lista que nos toma por tontos y nos la cuela a la primera.

s

Google ya no sabe que hacer para tener una excusa para escuchar todas nuestras conversaciones.

i

Las burbujas digitales existen desde hace tiempo, lo hace facebook y lo hace google. Sólo escuchas lo que quieres oir (más o menos).

Esto es un gran peligro porque crea radicalizaciones. Solamente escuchando a tus oponentes puedes aprender algo.

D

#16 Fíjate en las tres últimas noticias publicadas. Cultura, Tecnología y Ocio. En esas categorías es más facil llegar a portada que en actualidad, sobre todo si hace mucho que no se publica ninguna de esas categorías. Que tengan imágenes o videos también ayuda. Y el karma del que publica la noticia (y de los que menean) también influye. No consiste sólo en el número de meneos.

D

Bueno, Google quiere escucharnos a todos asi que en cierto sentido tienen razón, lo van a conseguir

Barquero_

Si necesita entrada de vídeo ya no me impresiona tanto.

D

En meneame existe desde hace mucho tiempo, lo llaman "ignore".

D

Parece que esto tiene cierto potencial por ejemplo para transcribir videos de youtube.

A menudo los videos de youtube tienen mucho ruido, pero el año pasado Google reveló un sistema para leer los labios, combinado con esto se puede leer los labios de la persona que tenga la voz en el debate.

S

Y leerás solo lo que creas que coincide con tus preferencias. Ah, espera, ya es un filtro que está colocado, no hace falta una ayuda externa...Aunque sería una ayuda extra que se inventase, por si lees sin querer algo que no te guste.

...

Esto se llama Independent Component Analysis (ICA) y tiene más años que el cagar.

Gonzo345

"Háblale a la mano, que tengo las orejas sucias que te cagas"

Willou

Yo ya lo hago, lo llamo "filtro miaumiau".

D

La noticia parece interesante pero, ¿13 meneos y a portada? ¿Alguien sabe que está pasando?

No es la primera vez que lo veo últimamente y estoy empezando a perder la confianza en este sitio, y no soy precisamente novato por estos lares...

D

#9 Los caminos del algoritmo son inescrutables.

D

#9 tinfoil tinfoil tinfoil tinfoil tinfoil

Es tecnología y en tecnología no hay tantas noticias como en actualidad.

Meneame es de código abierto. Si quieres ver cómo funciona no tienes más que mirarlo, o pedirle que lo mire a alguien que sepa leerlo.

D

#12 Lo he pensado, por suerte (o por desgracia) soy dev asi que no necesito ayuda para leer el código

El asunto es que nada me garantiza que lo que hay en github se corresponda con lo que hay publicado... A lo mejor si que soy un poco paranoico

D

#16 Acumulación de karma. Es muy fácil ser populista incluso sin querer y acumular positivos, no tengo muy claro cómo funciona, pero si tienes muchos positivos tus votos valen más, ¿No?
En un sistema el eslabón más débil


W

D

#65 El eslabón más débil son las personas*
Piensa que además a estás noticias nadie les vota negativo.

D

#9 Es de tecnología, según parece hay pocos envios de tecnología y entonces la web lo que hace es discriminar positivamente este envio.

D

#15 Ok, puede ser entonces que no entienda como va el tema de los subs, sin embargo los valores de karma parecían igualmente inflados. No se que pensar la verdad.

Acuantavese

#9 Lo hace una IA, no discutas

zordon

#9 también pasa q cada vez hay menos usuarios y movimiento, Menéame está en decadencia

D

¿Esto es como poner un botón de off al que te parezca? Mola

RespuestasVeganas.Org

Parecido a un "silenciar", pero de audio, aunque indiscriminadamente.

D

Ya escucho a quien yo quiero, no necesito a una puta máquina que decida por mi.

No será que escucharás lo que "YO" quiero, creo que esa es la cuestión, el sueño húmedo de los Goobels...

D

El fin de salvame

J

La bomba ya sería que lo mezclaran con traducción automática de voz en tiempo real. No sé si lo llegaremos a ver ...

j

Hace tiempo pensaba sobre algo parecido. Por qué no existe un audífono que divida los diferentes sonidos existentes y poder seleccionas, aumentar o disminuir el volumen de casa sonido en particular.
Sería muy efectivo para ambientes con personas con demencia que impediría a otros pacientes con la misma enfermedad y que estén en una misma habitación. Igualmente para familiares y de forma concreta reducir los ruidos de cualquier ambiente (poniendo todos los sonidos exteriores a cero). También para trabajos ruidosos (Construcción, salas de maquinas, etc.) sustituiría a los clásicos tapones o auriculares.