Hace 12 años | Por lirondos a cometario.wordpress.com
Publicado hace 12 años por lirondos a cometario.wordpress.com

Infografía con las palabras más frecuentes en español.

D

of the what??

paumal

Chistes con tacos a partir de... ya!!

p

#3 y de la de sanidad...

Frippertronic

#3 Ya no hay ministra de igualdad

D

#49 ¡Entonces exijo que pongan una y que dimita!

O

#4 Gilipipas!

anxosan

¿Qué? ¿Qué de qué? De la que.

D

'¡A tomar por q-lo, joder!'

Perdón, no sé contar.

D

#7 Tampoco sabes decir culo.

D

#23 Querrás decir que no se escribirlo...... decirlo si, suena exactamente igual.

l

#10 La mayoría de los corpus están basados en textos, no en lenguaje oral. Si te fijas, Gobierno, economía y otras palabras que aparecen mucho en los periódicos suelen aparecer entre las más "comunes" en estas listas.

maximoarmijo

#8 Lo de que se pronuncia mas "gobierno" que "mierda" no se lo cree nadie

Lobazo

En inglés

peredoplo

#22 La frecuencia de las palabras en inglés está sacada de subtítulos de películas. Me parece una idea brillante (y simple).

Brysbaert & New compiled a new frequency measure on the basis of American subtitles (51 million words in total)
http://subtlexus.lexique.org/

l

#22 #42 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox). Aquí está la lista de frecuencias de las 10000 palabras más frecuentes (obviamente es un corpus de lengua escrita, y la lengua escrita nunca es igual a la oral) http://corpus.rae.es/frec/10000_formas.TXT

d

#44 Pero una cosa es que la lengua escrita sea diferente a la oral, y otra que la muestra se saque básicamente de periódicos, y especialmente de secciones de política. #42 tiene toda la razón, de otra manera no se entiende la frecuencia de ciertas palabras.

DeepBlue

#9 #45 Por curiosidad he buscado que en alemán se necesitan unas 30 palabras para obtener una frecuencia del 30%, mientras que en español son 12 y en inglés 16.

Para llegar al 50%, en alemán 207, en español 130 y en inglés 57 (el inglés se estanca en proporción)

http://de.wikipedia.org/wiki/Liste_der_h%C3%A4ufigsten_W%C3%B6rter_der_deutschen_Sprache

¿Cómo será la distribución en chino mandarín?

YeheLasKabras

Puf! Pues en inglés con 1000 palabras sobra

D

#11 El Carlos Maurer es un máquina, el pavo hacía anuncios en la radio con un acentito inglés súper marcado, y luego me enteré en una entrevista de que es mejicano. ¡Ay caramba!

matacca

Parece una de las tarjetas que usó Rajoy en el debate.

D

Pareto attack.

Sandman

Y el mundialmente conocido 'Top Ten' de Bender:

jadcy2k

#14 "chúpame-mi-brillante-palote" jajaja!! Qué grande lol
(by the way: siento el spoiler)

Danm

No es aplicable a grananinos, no sale polla por ninguna parte y dicen que estamos to el día "con la polla en la boca", para todo y cualquier situación
Ejemplo de uso: Condenado por apoderarse de un club de alterne de Granada al grito de "esta noche manda mi polla"

Hace 15 años | Por elisthom a ideal.es

Danm

#51 GOTO #15 aunque donde puse "grananinos" debería poner granainos.. Que la hora del café es mu mala pa dejar comentarios

elverbis

La de infografías erróneas que hay

Vermel

He encontrado seis fallos en el cuadro de las que son el 90% del total. En el siguiente cuadro se corrige, pero creo que sobran dos. No diré cuáles para que os entretengáis un rato

D

¿Veis? ¿Veis? Hay que decirlo más...

alfresneda

¡Vivan las stopwords!

D

¿En qué posición esta Inshidia?

w

Saber ésto viene perfecto para poner las normas en el Ocalimotxo.

J

En Valencia hay canís que sólo usan el "nano", en una frase de 10 palabras 8 son nano, y lo asombroso es que se entienden entre ellos...

D

Pues no veo en esa imagen ni a "joder", a "hostia" o a "coño", palabras más que utilizadas a diario por todos nosotros.

Y chiste al canto:

- Dicen que un español, de 4 palabras que dice 3 son palabrotas
- ¡Hostia puta! ¿no jodas?

D

¿Fuiste galileo Juanito? ¡Normalización!

Esas son las 4 menos empleadas.

Miyata

Es lo que ahi.

chemari

Muy bueno para los que están aprendiendo español.

Zabir

En esta noticia se nota de manera brutal la decadencia de la calidad de los comentarios de Menéame. de 28 comentarios sólo 2 han aportado algo a la discusión, el resto son intentos de chistes.

g

¿Desde cuando "años" y "año" son palabras distintas?

d

Aprenda español en 2557 palabras (90% del total)

Y si están por orden podemos observar que se dice más "no" que "sí"

D

Eso será en España porque aquí en Zaragoza "CO" lo usa el 15% de la población en el 99% de sus frases. Lo que viene a ser los canis y sus "cos". Así, la conversación tipo de estos zagales vendría a ser: "¿Ke pasa co?", "Nada co".

ann_pe

#39 del enlace de la wikipedia:
A modo anecdótico, cabe señalar también que el capo mafioso Bernardo Provenzano, recientemente detenido, utilizaba para comunicarse, en pleno siglo XXI, notas escritas con una máquina de escribir, codificadas mediante este rudimentario algoritmo, renegando de cualquier tecnología nueva como el teléfono móvil o internet. A pesar de lo rudimentario del sistema, ha conseguido tener a la policía despistada durante años.

Un poco de clases de mates y estadística no le vendría mal a la poli

o

Si no aparece "puta" es claramente erroneo.

paranoid_android

Y las tres palabras juntas menos usadas en español son "no lo sé"

a

#41 En los últimos tiempos son "España va bien"

keiko_san

Se debe haber sacado unicamente de publicaciones como periodicos, y sobre todo en esta epoca de elecciones. De otra forma no se entiende como palabras como "presidente" y "gobierno" están entre el 50% del total.
Por lo tanto no me parece un estudio concluyente ni digno de tener en cuenta.

D

Yo creía que eran "joputa" "cagüentoloquesemenea" "lamadrequeteparió".

en fin, por lo menos tengo la satisfacción de que en España no somos tan malhablados como creía

Ragnarok

Claramente el corpus del que se ha extraído esto es sesgado, y esto una chapuza. No puedo creerme que gobierno y presidente estén entre las 130 palabras más usadas. Que sí, que nos preocupa mucho la política, pero vamos a ver, ¿dónde está partido y árbitro?

Porque si sale gobierno y presidente, partido tiene que salir, por la política, por el fútbol y por el participio. ¿O es que no se escribe de deportes?

l

#48 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox).

Pepf

Edit: no he dicho nada, circulen...

miguelpedregosa

En Granada la palabra "pollas" estaría en el primer nivel de la infografía.

albo

Si fuera sólo del español de los argentinos debería aparacer "boludo" dentro del 30% y "che" dentro del 50%

D

el español con tres palabras!
en breves saco el curso

RaiderDK

y las tres del cani "lavin compae viejo"

dagavi

Yo creo que gobierno y mierda deberían de estar a la par. Rara vez las veo separadas, y cuando están solas la única que veo es mierda.

ptm56

Uno entra esperando ver mierda, cojones, putas y putos por doquier y se encuentra con presidentes y gobiernos... bueno, quitando lo de los cojones, sí que viene a ser más o menos lo mismo.

Jiraiya

Principalmente de la expresión diaria política "Qué hay de lo mio?"

D

Yo diria que la palabra que mas se usa en español de españa es "vale". (en otros paises no)

Todos los extranjeros que viene a españa, aunque hablen español e incluso español nativo (sean hispanoamericanos por ejemplo). Se quedan alucionados con lo que se usa la palabra vale. Es la primiera palabra que aprenden de tanto oirla.

Ademas la palabra "vale" debe ser la palabra con mas significados del mundo. Por que vale para todo.

Vale?

Pues vale.

P

#62 Me quede flipado cuando descubrí que en argentina no se usaba, y una persona al saber que era español se despedia de mi diciendo "vale" porque sabia que los españoles la usábamos muchísimo lol

D

#67 Sí a los extranjeros les hace mucha gracia que tengamos una palabra que sirve para todo. De otros paises no hispanos a mi tambien me han hecho bromas con el "vale". Nosotros no nos damos cuenta pero la muchisimo y la usamos para todo. Realmente el español de españa es el idioma del "vale".

P

#69 Y del coño

D

#70 Ya te vale...

ann_pe

Si claro, "presidente, gobierno y país" son de las 130 palabras mas usadas, mas que patata. Pues no, estos de la Rae, que han hecho una estadística de una página de algún periódico y ya esta.

ElCascarrabias

gran, país, gobierno, presidente....??? No creo que en la misma frase o párrafo...

N

Pues seguro que es erroneo. Segun cita el articulo, su fuente es la web de la Real Academia Española. En concreto este documento:
http://goo.gl/h5WkS
Le he echado un vistazo (no os penseis que me he mirado las 10.000 palabras ) y resulta que la palabra número 9.996 es la palabra "for". Me ha llamado la atención porque no sabía que "for" fuera una palabra española, asi que la he buscado en su propio diccionario:
http://goo.gl/rB3gL
y dice que no existe.
¿Alguien me lo explica? Si hay una es probable que haya más que no existan en castellano
Ya podrian haberle pasado el diccionario a la lista

H

#68 Es que el corpus no está pasado sobre palabras que están en el diccionario, sino sobre palabras que se usan (aunque no estén en el diccionario) ;P Sobre qué debería o no debería ir en el diccionario... Uf, eso es otra batalla lol

N

#72 Me he picado, la curiosidad me ha podido y le he pasado el diccionario a las 2.000 primeras palabras. Pasando por alto apellidos, ciudades, mayusculas, etc.. me han salido cosas curiosas como letras sueltas, acronimos y alguna tilde de menos:

293. luis

364. c

583. b

612. p

700. i

772. psoe

835. g

898. pp

911. ii

971. r

983. j

996. n

1075. york

H

#73 Oye, ¡qué bueno! Y estoy contigo en lo de eta... no creo que esté ahí por estar en el alfabeto griego =P ¡Buen trabajo, me quito el sombrero!

H

#76 goto #72 El corpus usado es el CREA, un corpus de la Academia donde se recogen textos escritos (literarios y periodísticos). No es tan raro que "presidente" salga tan arriba y no aparezca "joder"

faelomx

* arriba la esteban
* hijos de puta
* no les votes
* me la fo... lol

v

Consultando la fuente http://corpus.rae.es/frec/10000_formas.TXT podemos comprobar que la RAE no sabe usar sus propias normas, y confunden puntos y comas decimales.

Además, que esa lista está censurada o sesgada. La palabra "joder" no aparece entre las 10000 más usadas!

D

1: En el gráfico sólo se pueden ver las letras más grandes. De poco sirve si es ilegible en su totalidad.
2: Han incluído preposiciones, artículos, conjunciones... con lo cual las palabras significativas quedan ocultas.
3: No veo la plabra "hijo" ni la palabra "puta". Y en estos tiempos que corren son las más utilizadas. Por ejemplo: los políticos son unos "hijos de puta".

j

Me extraña que no esten palabras como "Sexo" o "dinero"