Hace 2 meses | Por Rivethead a cadenaser.com
Publicado hace 2 meses por Rivethead a cadenaser.com

El presidente del Gobierno, Pedro Sánchez, ha anunciado la creación de un Gran Modelo Fundacional de Lenguaje de inteligencia artificial entrenado "específicamente" en castellano y el resto de lenguas cooficiales de España. Lo ha dicho este domingo durante el discurso que ha realizado en la cena oficial del Mobile World Congress (MWC) --que se celebra entre este lunes y jueves en el recinto Gran Via de Fira de Barcelona--, que se ha hecho en el Museu Nacional d'Art de Catalunya (MNAC).

J

Gastando el tiempo y los recursos en cosas necesarios. Así si pedro Sánchez, así si.

Zetan

¿Y esta chorrada cuanto nos cuesta?

ChatGPT

Buena idea, por fin algo de i+D, espero que no acabe en una cadena de mil subcontratados de una cárnica

ChatGPT

#1 el dinero mejor invertirlo en cursos de camarero.... No?

Peybol

Igual mucho menos que la Iglesia

Marzo2024

#1 y lo guapo que es, mira que mono el nene…

E

#6 Lo pensé, pero aquí una IA entrenada por forocoches va a tener enormes problemas, porque como llegue uno a pedirle un plan de entrenamiento básico igual acaba recomendándole comprar mancuernas de 30kg para el calentamiento. En Reddit la respuesta más útil suele ser la primera, en forocoches tienes que buscar entre página de chorradas para encontrar algo medianamente interesante.

A

Mal redactada. Debería decir “el resto de lenguas oficiales del estado” (que ya tienen bastante con ser el resto para encima ser “co”)

wildseven23

#3 No te molestes, es otro multicuenta.

Peybol

No me acordaba que Zetan me tiene en el ignore. Que alegría me acabo de llevar, otra vez.

M

#14
en forocoches tienes que buscar entre página de chorradas para encontrar algo medianamente interesante.

Y esa es, lamentablemente, la deriva de Menéame. Entrar a leer comentarios de un envío, y encontrarte comentarios graciosetes que no aportan nada.

D

#16 multicuenta, mononeurona

E

#18 Bueno, aquí tienes comentarios destacados si quieres hacer un cribado. Llevo ya bastante tiempo sin mirar nada en forocoches, pero antes perdías bastantes minutos en buscar respuestas útiles, que alguna siempre había, pero entre poles, chistes e insultos.

thorin

#3 #1 Tampoco es tan difícil entrenar los modelos libres LLM actuales en nuevos idiomas.
En menos de una semana y con menos de 50€ en horas de GPU puedes entrenar un modelo 7b para que hable mejor español, quizás un 13b.
Esto gracias a que ya hay bases de datos para entrenar en muchos idiomas.

Entrenar un LLM decente de mas de 100b costará mas coste de GPU y tiempo para afinar el software de entrenamiento. Pero no una barbaridad.


Otra cosa será ver si quieren hacer algo más allá.


De todas maneras, esto va a tardar porque a ver qué hace Meta con Llama 3, que lleva la voz cantante en modelos de código abierto.

Fingolfin

Los feudos más modernos del mundo

wildseven23

#_4 Pues, probablemente, si se lleva bien a cabo, infinitamente menos que los chiringuitos que tanto os gustan. Por ejemplo, la Oficina del Español en Madrid, o las subvenciones a los toros, o a los obispos, o a...

malajaita

O sea que con cuatro idiomas esta IA va a crear el Cacagaes, como les de por poner más ni me imagino el nombre.
Vale sí, el Cacagaravagüaés, incluidos guanche, aragonés y valenciano. ¿Quien da mas?

t

#2 A mi me gustaría que entrenaran una IA con los chistes de chiquito.

m

A ver si es verdad, actualmente se echa en falta un buen modelo llm en español.

Desideratum

#1 La cuñadez, cazurrez, garrulez y miseria casposa esperable en un multicuenta de extremocentro.

E

#21 Quizá técnicamente no resulte tan caro, pero yo de momento en los chatbots más populares todavía no he visto uno que no se líe si intenta hablar gallego (y un amigo catalán me ha dicho que la cosa con su idioma está parecida) y ya he visto respuestas menos detalladas preguntando en español. No veo mal que hagan pruebas entrenando IAs con las lenguas de aquí, porque no creo que sea ideal un futuro en el que saber o no inglés influya en la eficiencia que pueda tener para ti un chatbot, y lo digo sin tener yo ningún problema con el inglés.

neiviMuubs

En este país en el tema de la informática se lleva demasiado el que inventen otros. Todavía no he visto un modelo LLM en 34B o inferior que no hable español con problemas gramaticales dignos de un extranjero que lleve apenas uno o dos años de estudio.

Fijo que si crean un concurso ofreciendo un millón de euros, sacan modelos como churros de gente que súbitamente les de por entrenarlos. Igual es lo que deberian de hacer, pero son capaces de invertir mucho mas que eso y que se malverse por completo.

H

Genial idea; además si la impulsa él la IA nunca generará fake news... sólo cambiará de opinión

sorrillo

#_4 ¿Y esta chorrada cuanto nos cuesta?

Por que el centralismo monolingüe no tiene costes ocultos.

Nota: Este comentario es para responder a @ Zetan que por lo visto me tiene en su lista negra de ignorados. Por alguna razón que se me escapa los@admin demeneamemeneame han decidido que si alguien te pone en su lista negra ya no puedes citarle en respuesta a sus comentarios públicos, dificultando así el uso de herramientas de menéame como es el ver los comentarios en forma de hilo de discusión.

Ludovicio

#5 #30 Joder con los regres.

r

A ver si con estas iniciativas dejan de ser analfabetos del siglo XXI.

manbobi

#9 En toros

manbobi

#33 Retras

g

y la UE mientras tanto limitando a las empresas que puedan entrenar para que se vayan todas a EEUU. Lo dicho estamos dirigidos por "pollos sin cabeza"

y

en la era del streaming, youtubers, AI y demás, se siente, pero a los idiomas regionales inútiles les va a ir muy mal, no van a sobrevivir a medio plazo.

elsnons

#4 nada comparado con lo que se gastan al año en subsidios y paguitas varias para adormecer al votante cautivo .

Larusico

Una pasta para desarrollar una tontería(hay un idioma que hablan todos) y digo una pasta sin saber cuánto costará, pero ya sabemos como funciona:

X€ para la app a una empresa amiga
X€ - el 50% de la empresa amiga a otra empresa amiga
X€ - el 75% de la empresa amiga de la otra empresa amiga para que la haga una tercera empresa amiga.
Vamos, que al final la app sobre una IA la hará una IA con el soporte de un becario mientras postea en meneame.

sillycon

He sido rojo toda mi vida y estoy desesperado por que aparezca un partido de izquierdas de verdad con una neurona operativa, sin reikis ni tonterías contraproducentes de cara a la galería.

troll_hdlgp

#20 ... y respuestas troll, algunas muy evidentes, pero otras sutiles, con lo si no sabes del tema te la pueden colar, así que al final ni las útiles te valen, porque no las puedes distinguir del resto de morralla.

De todos modos eso es el general, fuera de él si que veo mucho mas respeto, o al menos normalidad.

E

#38 No, carezco de los conocimientos técnicos, pero ya he dicho que de momento mi experiencia personal lo que ha visto es que los chatbots más usados hoy en día van bien en inglés, ligeramente peor en español y mal en gallego. Sea más barato o más simple entrenar modelos yo no creo que sea un desperdicio de dinero el invertir en esto.

Bapho

#1 Por que promocionar la cultura de España y hacer que esté más presente en internet y en las nuevas tecnologías es tirar el dinero. Luego vendréis llorando por que está todo en Inglés. Comentario mamarracho.

eldarel

#29 En 2020 la fundación Mozilla pidió voluntarios para un proyecto de voz, en el que pedían diferentes acentos peninsulares.
No sé por qué ninguna universidad ha preparado modelos previos, aunque fuese usando las web de la administración.

ChatGPT

#35 oooleeeee

H

#7 magnífico documental y más magnífico es Shuji Nakamura. Eso es tesón y constancia.

ColaKO

#43 ¿te parece mala idea fomentar que las IA estén ajustadas a nuestro idioma y cultura en lugar de ser un refrito del inglés?

thorin

#43 Esto no es Reiki. En unos años esta tecnología estará en todas partes, cuanto mejor español hablé mejor.

Dentro de unos años tendrás que hablarle a uno de estos para consultar temas de la administración, o lo que dice #44, y vas a querer que sea preciso a la hora de hablar y de entender.

Otra cosa es que pase lo que comenta #42, que haya un mal gasto.

ChatGPT

#51 de ilusión también se vive

Lamantua

Anuncia humo.

sillycon

#53 me parece un interesante proyecto universitario, o un proyecto empresarial a la altura de la mayoría de las tecnologícas españolas, no un asunto nacional. Pero tienes que demostrar tu interés plurinacional en público.

sillycon

#54 no, el Reiki era de otro partido de izquierda ya convenientemente para algunos desaparecido. Estos son los de la neurona.

thorin

#58 Sólo tu te entiendes.

p

#9 no se pelien, mejor en un chatbot para anotar las cañas y las tapas de aceitunas

todos contentos

blid

No es magia, son tus impuestos. Hasta las narices estoy de Españita. Por favor, necesitamos un Milei.

p

#2 reportado por odio, no le deseo yo más "budget" ni al peor de mis enemigos

p

#5 el modelo se va a llamar "MetaKoldoGPT" y será un sistema de recomendaciones automática para acudir a los mejor prostíbulos de tu zona, en función de la distancia, de las puntuaciones de los clientes y de la eficiencia chupapollil

MAD.Max

¿No es de ElMundoToday?

black_spider

#8 más bien lo segundo. Otra pérdida de dinero a punta pala.

haprendiz
thorin

#52 No es excluyente, tu puedes "finetunear" un modelo de LLM para que hable perfecto idioma (Él "¿Para qué?" que preguntabas), y luego "finetunearlo" con legislación, procedimientos o lo que quieras.

p

#56 y lo acólitos los inhalan con mucho gustirrinin

M

#21 Ya, claro, español... ¿Y en vasco? ¿gallego? ¿valenciano? ¿catalán?

Es muy costoso porque se trabaja desde cero.

black_spider

#7 hablas como si no se estuviese investigando sobre la IA lol

C

#3 Pero esto no es algo que deba hacerse con dinero público. A mi me gustan los helados de caramelo y chocolate, debería el gobierno también montar una heladería si no hay cerca de mi localidad?

e

Se llamará charobot.

m

#36: Retretes.

black_spider

#9 que te parece bajar la cuota de autónomos para que montar una empresa en este país no sea tan horror?

O sino te gusta eso puedes también construir 1 millón de viviendas sociales. Dado que la vivienda es el principal problema de los españoles.

Y como último, puedes simplemente reducir la pila gigantesca de deuda que hay actualmente.

C

Lo que hacen en mi equipo de fútbol bien, los que hacen los del otro equipo mal. Esto es una chorrada y fijo que hay mil formas de sacar partido al dinero. Al final lo que determina si es mejor un llm es la calidad de los datos con la que la entrenas.

C

#11 Pero esto no es I+D, es adaptar lo que ya está para hacer paripé nacionalista.

Si quiere hacer I+D que anuncie fondos para la investigación de nuevas tecnologías de IA.

m

#6: Por si usan contenido de Menéame, espero que actualicen las normas del metro para tipificar de forma específica el delito de transbordo, así la AI no se confundirá cuando la pregunten por él.

x

#1 Esta IA será ideal para sustituir a los traductores del congreso

black_spider

#47 es tirar el dinero porque eso no lo va a usar absolutamente nadie.

Caravan_Palace

#64 #63 si, eso he dicho. Que habría críticas de la derecha
No es necesario que vengáis a darme la razón.

x

#65 es del mundo tomorrow

V

Conversación con la IA de you.com (que no se en que versión de chatpt se basan):

---
-tu parles català?

-Sí, parlo català! Com puc ajudar-te avui?

-em podries traduir "tu parles galleg" al galleg?

-Claro, te puedo ayudar con eso. "Tu parles galleg" se traduciría al gallego como "Falas galego". ¿Hay algo más en lo que pueda ayudarte?

-¿Falas galego?

-Sí, falo galego. Estou aquí para axudarte con calquera pregunta ou consulta que teñas. Como podo axudarte hoxe?

-com es diu "tu parles basc?" en basc?

-En basc, "tu parles basc?" es diría "euskaraz hitz egiten duzu?" o "euskaraz ari zara?". Així és com es preguntaria "parles basc?" en basc. Si tens alguna altra pregunta o necessites més ajuda, estic aquí per ajudar-te!

-euskaraz hitz egiten duzu?

-Bai, euskaraz hitz egiten dut. Zer galdetzen nahi duzu? Nirekin nola lagundu dezaket?
---

Si ya hay IAs que hablan en todas las lenguas de España, para que es esto? tiene algún fin especifico (como ayudarte en los tramites de la administración, etc). Pero si ese fuese el caso, entonces no se que pinta la RAE en todo esto.

black_spider

#81 el día que te des cuenta que el mundo no se divide en izquierda o derecha...

Caravan_Palace

#72 no se yo si los helados que a ti te gustan están en la constitución como alimento co oficial del estado y oficial en alguna que otra autonomía

x

#73 ¿nacerá adoctrinada?

thorin

#70 También.
Algunos de los ensayos que he visto eran también en ese idioma.
Teóricamente, no debería ser especialmente difícil.

yoma

#11 Y en la caza, no se te olvide la caza.

thorin

#83 Hostia, ese euskera es horrible.

M

#87 Gracias

thorin

#83 Y veo que se basa en Zephyr 7B alpha, que está derivado de Mistral 7b. Es decir, no es ChatGPT y es un modelo muy limitado por ser solo 7b. Se rumorea que ChatGPT es 80b o más.

https://about.you.com/hc/features-and-services/how-do-i-access-the-zephyr-mistral-llm-model-for-uncensored-chat-on-you-com/

E

#72 Yo sí creo que es algo que deba hacerse con dinero público. Al fin y al cabo es intentar garantizar que las lenguas del Estado sean funcionales con modelos de IA. Es una defensa del español (y del gallego, catalán y euskera) bastante más clara que mandar a un señor de gira por Estados Unidos a decir lo buenas que están aquí las tapas. Ya hay muchos ámbitos hoy en día en que se ha aceptado con naturalidad que el inglés es el referente y el español es muy secundario, como la investigación científica, no creo que se deba dejar un tema como el de las IAs completamente de lado y después aceptar que lo mejor para sacar el 100% de su potencial sea tirar del inglés porque poco a poco se ha ido imponiendo.

No es muy probable que veas un resurgimiento de papers en español, con lo que no creo que debamos dormirnos con esto.

GranTipo

el modelo se llamara TxaPT

Bapho

#80 Falacia de la bola de cristal.

A

#21 Pues suerte con entrenar un modelo con esas bases de datos en muchos idiomas para que 'entienda correctamente' cualquiera de ellos. No se si habrás trabajado con alguna... pero tela...
Si quieres entrenar un modelo nuevo 7B échale un par de semanas con varias A100
Quizás se podría hacer un MOE encargando modelos especializados por cada lengua a las universidades de las diferentes regiones en lugar de hacer un modelo con un numero demasiado bruto de parámetros pero la recogida y clasificación de datos no te la quita nadie, además del jaleo que se va a montar para meterle guardarraíles y controlar los sesgos a lo que salga... Y eso es caro, más que el coste de computación seguro.

alephespoco

La primera versión de LLM de Euskera ya está disponible (basado en Llama), aunque seguro que tiene margen de mejora: https://www.ehu.eus/es/-/hitz-zentroa-desarrolla-mayor-modelo-lenguaje-euskera-latxa

woopi

#2 Esperad a que lo entrenen con los comentarios de menéame y forocoches... el conocimiento de professor combinado con la sutileza de forococheros, implementado todo en una IA. Ya se podría usar directamente sin alineación ni hostias. ¡Una AGI así, con MAYÚSCULAS! Para exportar al mundo. Temblad luditas.

Peybol

#89 La caza, que ¿deporte? más patriótico.

1 2