Por qué los 1.000 tokens por segundo de Mercury 2 cambian las reglas del juego

Noticias de ciencia y lo que la rodea

Esta es una comunidad para la ciencia y todo lo que la rodea, un rinconcito para encontrar y enviar todo lo relacionado con la ciencia.
Por favor, respete la temática.
No quiero spam aquí, es para ciencia, no para autobombo.
Para cualquier duda respecto a este sub, acuda a @tnt80
No temáis pedir ediciones de vuestras noticias, o lo que sea, estoy sólo a una referencia y no muerdo.
Twitter twitter.com/meneameciencia ( @meneameciencia )
Facebook: www.facebook.com/meneameciencia

Aviso: La primera vez que alguien se confunda de sub/comunidad al enviar algo, editaré y lo pondré en otro, la segunda, le cierro el meneo con penalización. Respetad la temática, si no es por favor, ni por la comunidad, por vuestro karma.
Debido al abuso por parte de algunos de la posibilidad de enviar artículos, enviando artículos que no tienen nada que ver con la temática del sub, ya no se pueden enviar artículos a este sub.

7411 seguidores Seguir

Admin |

16 meneos

271 clics

Por qué los 1.000 tokens por segundo de Mercury 2 cambian las reglas del juego

Y justo cuando pensábamos que la solución era meterle más fuerza bruta al asunto, aparece Inception Labs y decide cambiar las reglas de la física del lenguaje. Han lanzado Mercury 2, y no es otro modelo más. Es el primer dLLM (diffusion LLM) de razonamiento comercial que abandona la “generación de texto” tradicional para escupir más de 1.000 tokens por segundo.

| etiquetas: dllm , llm , ia , ai , mercury 2

14 2 0 K 157

8 comentarios

14 2 0 K 157

#1 Gry

Lo probé el otro día y es entretenido ver cómo va generando todo el texto al mismo tiempo en lugar de palabra por palabra. En teoría se le da bien trabajar con textos estructurados, que no dependan de lo generado antes para cada sección del mismo.

1 26

#2 daphoene

Yo realmente no sé si será mejor o peor, pero en algún momento me pregunté si no se podría hacer algún modelo de difusión estilo a imagen y vídeo, y me ha hecho gracia que haya salido esto.

Realmente no creo que sea tan distinto, a nivel de entrada y salida, el contexto global supongo que sigue siendo el mismo, lo que no sé es si es igual de divisible en partes o agentes.

1 25

#4 Gry *

Probé a pasarle el índice de un informe que hice hace unas semanas y lo "rellenó" escribiendo todas las secciones en paralelo en un par de segundos. Es increíblemente rápido comparado con Chatgpt.

Tiene cierto parecido con los agentes, en lo de dividir tareas, pero tiene la ventaja de que no son procesos/agentes independientes así que tiene en cuenta todo lo que están haciendo "los demás" en tiempo real.

1 26

#5 daphoene

Sí, yo me refería justo a divisiones de tareas fuera de ese contexto, y que sea capaz de integrarlas en el contexto general.

Aunque imagino que un LLM al uso actualmente tendrá los mismos problemas, y seguramente pregunte antes para luego combinar la información o rehacer la información con los ajustes del prompt, así que no será muy distinto. Imagino que será un proceso en tres pasos, pero más rápido en general si cada paso cuenta con esta ventaja de la velocidad.

0 11

#3 Escafurciao

Lo veo muy útil en la traducción automática a tiempo real, antes que tú digas algo ya lo ha traducido.

0 8

#8 daphoene

Pues no lo descartes del todo, no con esta tecnología, pero ya pensé en varias posibilidades hace años, y parece que se están empezando a usar...

Comentario 4, y mi contestación en 10:

www.meneame.net/story/visite-nuestras-clinicas-recomendadas/c04#c-4

0 10

#6 Chinchorro

¿Y esto para que sirve? ¿Qué utilidad práctica tiene? ¿En qué aspecto va a mejorar la vida de quién?
Son preguntas no irónicas.

0 12

#7 daphoene

Como mínimo para reducir dramáticamente el tiempo de proceso de los LLM actuales, ergo la energía utilizada, y por ende, el coste.

Aparte, imagino que abre nuevos caminos a explorar, ya que los modelos actuales están tocando techo en algunos aspectos.

Y supongo que otras cosas que no se nos ocurren ahora mismo.

0 10

comentarios cerrados

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Noticias de ciencia y lo que la rodea

suscripciones por RSS

Por qué los 1.000 tokens por segundo de Mercury 2 cambian las reglas del juego