#3:
Gran injusticia: se usa más frecuentemente "la" que "el". ¡Exijo la dimisión de la ministra de igualdad!
#8:
Se nota descaradamente que han hecho estadísticas con noticias de la prensa o algo parecido. No me puedo creer que en el lenguaje cotidiano se emplee más la palabra gobierno o país que agua, hambre, sueño...
#45:
#9 Curioso que para llegar al 75% en español tengamos 2.557 palabras diferente y en el caso del inglés sólo 360
#39:
Quizas esta lista parezca una tonteria pero puede ser util para aplicaciones de prediccion de texto como los teclados que suelen usar los telefonos mobiles o tambien han sido usados historicamente para descifrar textos ya que algunos cifrados no alteran la frequencia de las palabras http://es.wikipedia.org/wiki/Cifrado_C%C3%A9sar#Descifrado
#22:
#9 no aparecen ni "cojones" ni "joder" pero sin embargo aparece presidente y gobierno. Seguro que lo han sacado de periódicos.
#5:
Pronto se reducirán a "LamAshSsHulAaa" y "KiEEhroohHHUnnACoPpaAAh"
#22#42 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox). Aquí está la lista de frecuencias de las 10000 palabras más frecuentes (obviamente es un corpus de lengua escrita, y la lengua escrita nunca es igual a la oral) http://corpus.rae.es/frec/10000_formas.TXT
#44 Pero una cosa es que la lengua escrita sea diferente a la oral, y otra que la muestra se saque básicamente de periódicos, y especialmente de secciones de política. #42 tiene toda la razón, de otra manera no se entiende la frecuencia de ciertas palabras.
#9#45 Por curiosidad he buscado que en alemán se necesitan unas 30 palabras para obtener una frecuencia del 30%, mientras que en español son 12 y en inglés 16.
Para llegar al 50%, en alemán 207, en español 130 y en inglés 57 (el inglés se estanca en proporción)
Se nota descaradamente que han hecho estadísticas con noticias de la prensa o algo parecido. No me puedo creer que en el lenguaje cotidiano se emplee más la palabra gobierno o país que agua, hambre, sueño...
#10 La mayoría de los corpus están basados en textos, no en lenguaje oral. Si te fijas, Gobierno, economía y otras palabras que aparecen mucho en los periódicos suelen aparecer entre las más "comunes" en estas listas.
Quizas esta lista parezca una tonteria pero puede ser util para aplicaciones de prediccion de texto como los teclados que suelen usar los telefonos mobiles o tambien han sido usados historicamente para descifrar textos ya que algunos cifrados no alteran la frequencia de las palabras http://es.wikipedia.org/wiki/Cifrado_C%C3%A9sar#Descifrado
#39 del enlace de la wikipedia: A modo anecdótico, cabe señalar también que el capo mafioso Bernardo Provenzano, recientemente detenido, utilizaba para comunicarse, en pleno siglo XXI, notas escritas con una máquina de escribir, codificadas mediante este rudimentario algoritmo, renegando de cualquier tecnología nueva como el teléfono móvil o internet. A pesar de lo rudimentario del sistema, ha conseguido tener a la policía despistada durante años.
Un poco de clases de mates y estadística no le vendría mal a la poli
#11 El Carlos Maurer es un máquina, el pavo hacía anuncios en la radio con un acentito inglés súper marcado, y luego me enteré en una entrevista de que es mejicano. ¡Ay caramba!
Se debe haber sacado unicamente de publicaciones como periodicos, y sobre todo en esta epoca de elecciones. De otra forma no se entiende como palabras como "presidente" y "gobierno" están entre el 50% del total.
Por lo tanto no me parece un estudio concluyente ni digno de tener en cuenta.
Claramente el corpus del que se ha extraído esto es sesgado, y esto una chapuza. No puedo creerme que gobierno y presidente estén entre las 130 palabras más usadas. Que sí, que nos preocupa mucho la política, pero vamos a ver, ¿dónde está partido y árbitro?
Porque si sale gobierno y presidente, partido tiene que salir, por la política, por el fútbol y por el participio. ¿O es que no se escribe de deportes?
#48 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox).
En esta noticia se nota de manera brutal la decadencia de la calidad de los comentarios de Menéame. de 28 comentarios sólo 2 han aportado algo a la discusión, el resto son intentos de chistes.
Pues seguro que es erroneo. Segun cita el articulo, su fuente es la web de la Real Academia Española. En concreto este documento: http://goo.gl/h5WkS
Le he echado un vistazo (no os penseis que me he mirado las 10.000 palabras ) y resulta que la palabra número 9.996 es la palabra "for". Me ha llamado la atención porque no sabía que "for" fuera una palabra española, asi que la he buscado en su propio diccionario: http://goo.gl/rB3gL
y dice que no existe.
¿Alguien me lo explica? Si hay una es probable que haya más que no existan en castellano
Ya podrian haberle pasado el diccionario a la lista
#68 Es que el corpus no está pasado sobre palabras que están en el diccionario, sino sobre palabras que se usan (aunque no estén en el diccionario) ;P Sobre qué debería o no debería ir en el diccionario... Uf, eso es otra batalla
#72 Me he picado, la curiosidad me ha podido y le he pasado el diccionario a las 2.000 primeras palabras. Pasando por alto apellidos, ciudades, mayusculas, etc.. me han salido cosas curiosas como letras sueltas, acronimos y alguna tilde de menos:
#76 goto #72 El corpus usado es el CREA, un corpus de la Academia donde se recogen textos escritos (literarios y periodísticos). No es tan raro que "presidente" salga tan arriba y no aparezca "joder"
Si claro, "presidente, gobierno y país" son de las 130 palabras mas usadas, mas que patata. Pues no, estos de la Rae, que han hecho una estadística de una página de algún periódico y ya esta.
Yo diria que la palabra que mas se usa en español de españa es "vale". (en otros paises no)
Todos los extranjeros que viene a españa, aunque hablen español e incluso español nativo (sean hispanoamericanos por ejemplo). Se quedan alucionados con lo que se usa la palabra vale. Es la primiera palabra que aprenden de tanto oirla.
Ademas la palabra "vale" debe ser la palabra con mas significados del mundo. Por que vale para todo.
#62 Me quede flipado cuando descubrí que en argentina no se usaba, y una persona al saber que era español se despedia de mi diciendo "vale" porque sabia que los españoles la usábamos muchísimo
#67 Sí a los extranjeros les hace mucha gracia que tengamos una palabra que sirve para todo. De otros paises no hispanos a mi tambien me han hecho bromas con el "vale". Nosotros no nos damos cuenta pero la muchisimo y la usamos para todo. Realmente el español de españa es el idioma del "vale".
He encontrado seis fallos en el cuadro de las que son el 90% del total. En el siguiente cuadro se corrige, pero creo que sobran dos. No diré cuáles para que os entretengáis un rato
Uno entra esperando ver mierda, cojones, putas y putos por doquier y se encuentra con presidentes y gobiernos... bueno, quitando lo de los cojones, sí que viene a ser más o menos lo mismo.
Eso será en España porque aquí en Zaragoza "CO" lo usa el 15% de la población en el 99% de sus frases. Lo que viene a ser los canis y sus "cos". Así, la conversación tipo de estos zagales vendría a ser: "¿Ke pasa co?", "Nada co".
1: En el gráfico sólo se pueden ver las letras más grandes. De poco sirve si es ilegible en su totalidad.
2: Han incluído preposiciones, artículos, conjunciones... con lo cual las palabras significativas quedan ocultas.
3: No veo la plabra "hijo" ni la palabra "puta". Y en estos tiempos que corren son las más utilizadas. Por ejemplo: los políticos son unos "hijos de puta".
Comentarios
Gran injusticia: se usa más frecuentemente "la" que "el". ¡Exijo la dimisión de la ministra de igualdad!
#3 y de la de sanidad...
#3 Ya no hay ministra de igualdad
#49 ¡Entonces exijo que pongan una y que dimita!
En inglés
#9 no aparecen ni "cojones" ni "joder" pero sin embargo aparece presidente y gobierno. Seguro que lo han sacado de periódicos.
#22 La frecuencia de las palabras en inglés está sacada de subtítulos de películas. Me parece una idea brillante (y simple).
Brysbaert & New compiled a new frequency measure on the basis of American subtitles (51 million words in total)
http://subtlexus.lexique.org/
#22 #42 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox). Aquí está la lista de frecuencias de las 10000 palabras más frecuentes (obviamente es un corpus de lengua escrita, y la lengua escrita nunca es igual a la oral) http://corpus.rae.es/frec/10000_formas.TXT
#44 Pero una cosa es que la lengua escrita sea diferente a la oral, y otra que la muestra se saque básicamente de periódicos, y especialmente de secciones de política. #42 tiene toda la razón, de otra manera no se entiende la frecuencia de ciertas palabras.
#9 Curioso que para llegar al 75% en español tengamos 2.557 palabras diferente y en el caso del inglés sólo 360
#9 #45 Por curiosidad he buscado que en alemán se necesitan unas 30 palabras para obtener una frecuencia del 30%, mientras que en español son 12 y en inglés 16.
Para llegar al 50%, en alemán 207, en español 130 y en inglés 57 (el inglés se estanca en proporción)
http://de.wikipedia.org/wiki/Liste_der_h%C3%A4ufigsten_W%C3%B6rter_der_deutschen_Sprache
¿Cómo será la distribución en chino mandarín?
Se nota descaradamente que han hecho estadísticas con noticias de la prensa o algo parecido. No me puedo creer que en el lenguaje cotidiano se emplee más la palabra gobierno o país que agua, hambre, sueño...
#8 La lista la da la propia RAE, y está creada a partir del corpus CREA http://corpus.rae.es/frec/10000_formas.TXT
#10 La mayoría de los corpus están basados en textos, no en lenguaje oral. Si te fijas, Gobierno, economía y otras palabras que aparecen mucho en los periódicos suelen aparecer entre las más "comunes" en estas listas.
#8 Lo de que se pronuncia mas "gobierno" que "mierda" no se lo cree nadie
¡Hijo de puta!
Hay que decirlo más.
#4 Gilipipas!
Pronto se reducirán a "LamAshSsHulAaa" y "KiEEhroohHHUnnACoPpaAAh"
Parece una de las tarjetas que usó Rajoy en el debate.
Chistes con tacos a partir de... ya!!
#2 ahí va
-Oye Patxi sabes que dicen que los vascos de cada tres palabras que decimos dos son palabrotas
- Hostias, no jodas!
La de infografías erróneas que hay
Quizas esta lista parezca una tonteria pero puede ser util para aplicaciones de prediccion de texto como los teclados que suelen usar los telefonos mobiles o tambien han sido usados historicamente para descifrar textos ya que algunos cifrados no alteran la frequencia de las palabras
http://es.wikipedia.org/wiki/Cifrado_C%C3%A9sar#Descifrado
#39 del enlace de la wikipedia:
A modo anecdótico, cabe señalar también que el capo mafioso Bernardo Provenzano, recientemente detenido, utilizaba para comunicarse, en pleno siglo XXI, notas escritas con una máquina de escribir, codificadas mediante este rudimentario algoritmo, renegando de cualquier tecnología nueva como el teléfono móvil o internet. A pesar de lo rudimentario del sistema, ha conseguido tener a la policía despistada durante años.
Un poco de clases de mates y estadística no le vendría mal a la poli
Pareto attack.
Puf! Pues en inglés con 1000 palabras sobra
#11 El Carlos Maurer es un máquina, el pavo hacía anuncios en la radio con un acentito inglés súper marcado, y luego me enteré en una entrevista de que es mejicano. ¡Ay caramba!
¿Qué? ¿Qué de qué? De la que.
No es aplicable a grananinos, no sale polla por ninguna parte y dicen que estamos to el día "con la polla en la boca", para todo y cualquier situación
Ejemplo de uso: Condenado por apoderarse de un club de alterne de Granada al grito de "esta noche manda mi polla"
Condenado por apoderarse de un club de alterne de ...
ideal.es#51 GOTO #15 aunque donde puse "grananinos" debería poner granainos.. Que la hora del café es mu mala pa dejar comentarios
#70 Ya te vale...
Pues no veo en esa imagen ni a "joder", a "hostia" o a "coño", palabras más que utilizadas a diario por todos nosotros.
Y chiste al canto:
- Dicen que un español, de 4 palabras que dice 3 son palabrotas
- ¡Hostia puta! ¿no jodas?
Y el mundialmente conocido 'Top Ten' de Bender:
#14 "chúpame-mi-brillante-palote" jajaja!! Qué grande
(by the way: siento el spoiler)
of the what??
¡Vivan las stopwords!
Saber ésto viene perfecto para poner las normas en el Ocalimotxo.
¿Fuiste galileo Juanito? ¡Normalización!
Esas son las 4 menos empleadas.
Se debe haber sacado unicamente de publicaciones como periodicos, y sobre todo en esta epoca de elecciones. De otra forma no se entiende como palabras como "presidente" y "gobierno" están entre el 50% del total.
Por lo tanto no me parece un estudio concluyente ni digno de tener en cuenta.
Claramente el corpus del que se ha extraído esto es sesgado, y esto una chapuza. No puedo creerme que gobierno y presidente estén entre las 130 palabras más usadas. Que sí, que nos preocupa mucho la política, pero vamos a ver, ¿dónde está partido y árbitro?
Porque si sale gobierno y presidente, partido tiene que salir, por la política, por el fútbol y por el participio. ¿O es que no se escribe de deportes?
#48 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox).
¿En qué posición esta Inshidia?
En esta noticia se nota de manera brutal la decadencia de la calidad de los comentarios de Menéame. de 28 comentarios sólo 2 han aportado algo a la discusión, el resto son intentos de chistes.
¿Veis? ¿Veis? Hay que decirlo más...
Pues seguro que es erroneo. Segun cita el articulo, su fuente es la web de la Real Academia Española. En concreto este documento:
http://goo.gl/h5WkS
Le he echado un vistazo (no os penseis que me he mirado las 10.000 palabras ) y resulta que la palabra número 9.996 es la palabra "for". Me ha llamado la atención porque no sabía que "for" fuera una palabra española, asi que la he buscado en su propio diccionario:
http://goo.gl/rB3gL
y dice que no existe.
¿Alguien me lo explica? Si hay una es probable que haya más que no existan en castellano
Ya podrian haberle pasado el diccionario a la lista
#68 Es que el corpus no está pasado sobre palabras que están en el diccionario, sino sobre palabras que se usan (aunque no estén en el diccionario) ;P Sobre qué debería o no debería ir en el diccionario... Uf, eso es otra batalla
#72 Me he picado, la curiosidad me ha podido y le he pasado el diccionario a las 2.000 primeras palabras. Pasando por alto apellidos, ciudades, mayusculas, etc.. me han salido cosas curiosas como letras sueltas, acronimos y alguna tilde de menos:
293. luis
364. c
583. b
612. p
700. i
772. psoe
835. g
898. pp
911. ii
971. r
983. j
996. n
1075. york
#73 Oye, ¡qué bueno! Y estoy contigo en lo de eta... no creo que esté ahí por estar en el alfabeto griego =P ¡Buen trabajo, me quito el sombrero!
#76 goto #72 El corpus usado es el CREA, un corpus de la Academia donde se recogen textos escritos (literarios y periodísticos). No es tan raro que "presidente" salga tan arriba y no aparezca "joder"
Yo creo que gobierno y mierda deberían de estar a la par. Rara vez las veo separadas, y cuando están solas la única que veo es mierda.
Si claro, "presidente, gobierno y país" son de las 130 palabras mas usadas, mas que patata. Pues no, estos de la Rae, que han hecho una estadística de una página de algún periódico y ya esta.
Me extraña que no esten palabras como "Sexo" o "dinero"
Y las tres palabras juntas menos usadas en español son "no lo sé"
#41 En los últimos tiempos son "España va bien"
Yo diria que la palabra que mas se usa en español de españa es "vale". (en otros paises no)
Todos los extranjeros que viene a españa, aunque hablen español e incluso español nativo (sean hispanoamericanos por ejemplo). Se quedan alucionados con lo que se usa la palabra vale. Es la primiera palabra que aprenden de tanto oirla.
Ademas la palabra "vale" debe ser la palabra con mas significados del mundo. Por que vale para todo.
Vale?
Pues vale.
#62 Me quede flipado cuando descubrí que en argentina no se usaba, y una persona al saber que era español se despedia de mi diciendo "vale" porque sabia que los españoles la usábamos muchísimo
#67 Sí a los extranjeros les hace mucha gracia que tengamos una palabra que sirve para todo. De otros paises no hispanos a mi tambien me han hecho bromas con el "vale". Nosotros no nos damos cuenta pero la muchisimo y la usamos para todo. Realmente el español de españa es el idioma del "vale".
#69 Y del coño
Aprenda español en 2557 palabras (90% del total)
Y si están por orden podemos observar que se dice más "no" que "sí"
Principalmente de la expresión diaria política "Qué hay de lo mio?"
* arriba la esteban
* hijos de puta
* no les votes
* me la fo...
Consultando la fuente http://corpus.rae.es/frec/10000_formas.TXT podemos comprobar que la RAE no sabe usar sus propias normas, y confunden puntos y comas decimales.
Además, que esa lista está censurada o sesgada. La palabra "joder" no aparece entre las 10000 más usadas!
Muy bueno para los que están aprendiendo español.
y las tres del cani "lavin compae viejo"
Si fuera sólo del español de los argentinos debería aparacer "boludo" dentro del 30% y "che" dentro del 50%
En Granada la palabra "pollas" estaría en el primer nivel de la infografía.
He encontrado seis fallos en el cuadro de las que son el 90% del total. En el siguiente cuadro se corrige, pero creo que sobran dos. No diré cuáles para que os entretengáis un rato
Edit: no he dicho nada, circulen...
¿Desde cuando "años" y "año" son palabras distintas?
gran, país, gobierno, presidente....??? No creo que en la misma frase o párrafo...
Uno entra esperando ver mierda, cojones, putas y putos por doquier y se encuentra con presidentes y gobiernos... bueno, quitando lo de los cojones, sí que viene a ser más o menos lo mismo.
Eso será en España porque aquí en Zaragoza "CO" lo usa el 15% de la población en el 99% de sus frases. Lo que viene a ser los canis y sus "cos". Así, la conversación tipo de estos zagales vendría a ser: "¿Ke pasa co?", "Nada co".
Yo creía que eran "joputa" "cagüentoloquesemenea" "lamadrequeteparió".
en fin, por lo menos tengo la satisfacción de que en España no somos tan malhablados como creía
'¡A tomar por q-lo, joder!'
Perdón, no sé contar.
#7 Tampoco sabes decir culo.
#23 Querrás decir que no se escribirlo...... decirlo si, suena exactamente igual.
Es lo que ahi.
En Valencia hay canís que sólo usan el "nano", en una frase de 10 palabras 8 son nano, y lo asombroso es que se entienden entre ellos...
el español con tres palabras!
en breves saco el curso
Si no aparece "puta" es claramente erroneo.
1: En el gráfico sólo se pueden ver las letras más grandes. De poco sirve si es ilegible en su totalidad.
2: Han incluído preposiciones, artículos, conjunciones... con lo cual las palabras significativas quedan ocultas.
3: No veo la plabra "hijo" ni la palabra "puta". Y en estos tiempos que corren son las más utilizadas. Por ejemplo: los políticos son unos "hijos de puta".