Hace 4 años | Por Feindesland a xkcd.com
Publicado hace 4 años por Feindesland a xkcd.com

Gráfico sobre lo que ocurre con los números imprecisos.

Comentarios

BodyOfCrime

#7 Pues sí que lees despacio...

fantomax

#1 Ya está #2
En xkcd conviene dejar unos segundos el ratón quieto sobre la imagen.

D

La importancia de la precisión en modelos es algo muy a recordar estos días.

ElPerroDeLosCinco

A veces, el propio exceso de precisión produce "garbage". Cuando no se necesita mucha exactitud, es mejor un dato impreciso pero comprensible que uno preciso pero que aporta información de dificulta la comprensión. Por ejemplo, es mejor decir: "en Bilbao llueve un tercio de los días", que: "la probabilidad de lluvia en Bilbao es de un 33.291904%".

Inviegno

Pues es una guerra que yo siempre tengo en el trabajo. Por lo visto soy el tocapelotas que usa decimales en los cálculos.

D

#7, ojalá la gente como tú sea un grupo muy minoritario

Que se puede ser un ignorante, pero alardear de ello es más grave.

m

#24 #30

Ehm, mirad la ecuación 7 de la viñeta. Puedes tener datos con precisión de 1 decimal y ser capaz de estimar la media con más decimales si tienes un tamaño muestral N suficiente. De hecho, si la población es normal (y por tanto simétrica), estos efectos de truncamiento se cancelan en promedio y la esperanza de la media muestral sigue siendo el verdadero valor a estimar, solo que con más varianza (que se podría reducir con N mayor).

D

#7 ¿y el tiempo que hemos desperdiciado nosotros leyendo tu genial aporte, que?

c

Los cuentamuertos deberían estudiarse esta viñeta.

fantomax

#47 ok, gracias.

prejudice

#24 la forma estándar es poner regla por encima y apretar hasta llegar al hueso. De otra forma la grasa abdominal hará que la gente con sobrepeso arroje valores mas bajos de lo que corresponde.
Lo normal sería poner un decimal que es la precisión que aporta una regla milimetrada. Aunque supongo que la mayoría redondeará hacía arriba.

heffeque

#4 Como estoy desde el móvil y no puedo poner el ratón sobre la imagen para ver el texto alternativo, he abierto el código fuente de la página web y me he llevado una graciosa sorpresa con el footnote (que se ve desde la propia web, pero como está tan pequeño nunca me había fijado).

#1 Muy interesante. ¡Gracias!

ElPerroDeLosCinco

#26 Exacto. Otro ejemplo es cuando en una carrera ciclista dicen por la tele que "los corredores van a una velocidad media de 28.325 km/h". Tanta precisión es innecesaria, por no decir que realmente en ningún momento van exactamente a esa velocidad.

D

#24 Es un ejemplo de 'spureous accuracy'. La cifra presentada como resultado debe tener como máximo el mismo número de cifras significativas que el dato con menos cifras significativas utilizado para lograr el resultado, y no más.

D

#22 También hay otro concepto interesante que es precisión vs exactitud. En finanzas es necesaria la exactitud para evitar errores gruesos al concatenar operaciones. En machine learning la precisión es importante pero no la exactitud.

D

#4 #39 https://m.xkcd.com directamente.

m

#0 y #Admin: Si podéis añadid "matemáticas basura" y "garbage maths" para localizar mejor este envío, que es muy bueno.

silencer

#24 En un examen de termodinamica, hace añitos, el profesor me bajó 1 punto por poner la solucion de Tª con 3 decimales.
Con la explicacion pertinente

LeDYoM

Como programador en C++ que tiene que usar muchas funciones numericas, doy fe.
Pero a veces a los matematicos les cuesta enteder como funciona el ordenador.

BodyOfCrime

#c-2" class="content-link" style="color: rgb(227, 86, 20)" data-toggle="popover" data-popover-type="comment" data-popover-url="/tooltip/comment/3292731/order/2">#2 A veces es difícil encontrar cosas en xkcd. A ver si algún admin te lo cambia porque merece la pena incluso la explicación que puso # 1

Inviegno

#24 Ese .12 no es particularmente relevante, pero sí es relevante que todos los datos que hacen componer esa media sean válidos y precisos.

D

Para quien no entienda la importancia del tema aquí hay algunas consecuencias de utilizar datos basura: https://web.ma.utexas.edu/users/arbogast/misc/disasters.html

Cancudrilo

#27 Darboux está llorando por tu comentario

m

#65 No, el promedio son 34,23 mesas por clase. 34 es un truncamiento. Ese 0,23 te da la información de que si tienes 4 clases, el promedio de mesas en ellas es casi 137, en vez de 136 como obtendrías si eliminases el 0,23 y te quedases con 34 porque es un número que te parece más bonito.

Estoy de acuerdo en que la ley de los grandes números no la puedes aplicar a algo que no existe, esperemos que no les hayan cortado el pene a los hombres de tu ejemplo original

N

#22 en este caso el intervalo de confianza debe ser como mínimo del 1%, o sea que todos los números por detrás del 33 no sirven para nada.

D

#8, pues yo no lo interpreto así. Lo que hace es explicar con cada operación lo que pasa cuando los datos no son precisos, cuándo el error aumenta más.

Por cierto, si te vas a la explicación que enlaza #1:

This comic is not related to the 2020 pandemic of the coronavirus SARS-CoV-2

Arkhan

#7 Pues viendo que la publicación es de XKCD te puedes esperar ya lo que hay dentro... No entiendo tanta pataleta.

fantomax

CarmeCarme, he cambiado el link en el envío pero sigue llevando al antiguo, ¿qué pasa?

Feindesland

#69 Gracias

guaperas

#15 lo importante no es usar decimales sino saber por qué los usas y hasta donde coges.

Por poner un ejemplo de lo estúpido e irrelevantes que a veces so los datos. Me acuerdo un "estudio" que salió hace unos años que la medida del pene medio era del 13,12 cm. Lo curioso son esos decimales, ¿12? Esos números no tienen sentido, son inventados. Eso me plantea dos preguntas, ¿como diantres se mide el tamaño de un pene hasta hasta la diezmilésima de metro? y otra ¿donde empieza y donde acaba como sabes donde poner la regla?

b

#8 recordando a Babbage:
"Al menos en un par de ocasiones se me preguntó: Sr. Babbage, si ingresa cifras incorrectas en la máquina, ¿saldrán las respuestas correctas?' No puedo percibir correctamente el tipo de confusión de ideas que podría provocar tal pregunta"

guaperas

#28 pero tu asumes que todos están bien medidos, el problema de esa medida es que han hecho la media de datos que no llegan a esa precisión

Carme

#37 será cosa de la caché de tu navegador, yo lo veo bien

Black_Diamond

#47 debo decir que a mí también me pasa, incluso recargando la página. El enlace

https://www.meneame.net/go?id=3292731

Me lleva al antiguo enlace:

https://pbs.twimg.com/media/EV0jlgfUMAAClSe?format=png&name=small

guaperas

#59 sí, lo que dices es verdad en segundo lugar, pero no lo que dices en primer lugar (que sí se puede ir mas alla de la precisión).

Como nivel matemático si teórico y abstracto si....., te puede dar una idea de como se distribuye, pero ese dato no te lo cogería ningún científico, no tiene validez.

No puedes aplicar esa formula 7 de la viñeta con datos más allá de la precisión más desfavorable que tengas en tu muestra. Por una muestra muy grande que tengas no puedes dar como resultados datos de algo que no se puede medir, ¿cómo mides la décima parte de un milimetro en un pene? .

guaperas

#64 pero la ley de los grandes números no la puedes aplicar a algo que no existe.

Te voy a poner otro en un instituto hay de promedio 34,23 mesas por clase. ¿Qué es 0,23 mesas ? Es un constructo matemático que te puede dar... ¿qué información?, la mesa o bien es mesa o no es mesa, no es una variable continua. Por lo tanto lo correcto seria decir que el promedio es de 34 mesas por clase.

Se que es tentador decir que esos decimales te dicen que en general la tendencia es de que esté mas cerca de 34 que de 35.... pero para eso truncas, el promedio es de 34 mesas por clase. Que luego abstractemente se pueda decir más cosas si...

Pero la ciencia va a lo seguro, hablo del a buena ciencia. Luego te encuentran papers por ahí que tienen menos validez y fiabilidad que un panfleto publicitario....

guaperas

#66 ains la estadistica inferencial.... lol

Feindesland

#4 Muchas gracias

Feindesland

#13

Esa es buena también.

Feindesland

#15 Estoy por pedirte matrimonio...

lol lol lol

D

#36 Y la falta de precisión o error de redondeo te genera datos basura.

A

Muy útil la explicación, especialmente en estos días.

frg

#36 ¿Como era aquella nave que se estrelló contra marte por una mimiedad en una no conversión de Millas Kilómetros?

D

#19 No necesariamente

r

No lo pillo

r

#8 ahh yo no lo relacionaba con estadística si no con informática — precise: 0.25 non precise 0.333333

Idomeneo

#19 Ninguna de las fórmulas dice GARBAGE + GARBAGE.

D

#10 Yo la estadística solo la entiendo mediante explicaciones geométrico-algebraicas con vectores. Quiero entender el por qué de las fórmulas.

Una vez lo reduces a distancias, todo en estadística es mucho más intuitivo.

Lo mismo que integrar y derivar. Es medir y sumar intervalos de distancia/tiempo sobre el tiempo. Medir el movimiento, vamos.

D

#60 Exacto, aunque yo estaba pensando en los coeficientes del modelo, no en la salida. Da igual tener coeficientes de tipo base-10 con 16 decimales, el precio que vas a pagar por la exactitud es que el tiempo de entrenamiento se va a alargar innecesariamente. Sin embargo se requiere cierto grado de precisión para mantener la coherencia. El dibujo que puse la verdad está más relacionado con el concepto de error que mencionas.

a

#0 añadidas a etiquetas "matemáticas basura" y "garbage maths".

C

#29 No me sonaba de nada Darboux, pensaba que tbn era de boltzano al ser casi igual el de los valores intermedios.

avalancha971

Me ha costado entender GARBAGE - GARBAGE después de GARBAGE + GARBAGE.

Pero he entendido que hay que asumir que en ambos casos son números de igual magnitud.

g

!!Protesto señoría!! Los logarítmos.... ¿Dónde están los logaritmos en ese juego?...

J

#15 Te crees que tus vecinos no lo saben? Luego cuando te pongan un cartel en el portal diciendo que te marches hasta que acabe la cuarentena porque saben que eres el de los decimales dirás en las redes sociales que eres una víctima de odio.

avalancha971

#45 Tienes razón, es PRECISE NUMBER + GARBAGE.

Niltsiar

#8 Nadie las puede dar, por que no existen.
La ciencia es algo serio, la opinión publica solo pide y recibe "periodismo" para poder insultarse entre sí.

b

¿Librerías decimal? .toFixed(2) y arreando!

Monsieur-J

#34 Pero ahí no habla de datos basura, son problemas de cálculo por la precisión.

m

#44 Expresado en otros términos tal vez más sencillos de recordar:

exactitud => poco sesgo
precisión => poca varianza

Y tanto el sesgo como la varianza son muy importantes en machine learning, no solo la varianza (1/precisión). El error cuadrático medio, que es como se suele cuantificar el desempeño de un modelo o estimador, es sesgo^2 + varianza.

m

#63 El dato lo cogería cualquier científico que supiese lo que es la ley de los grandes números; afortunadamente hay unos cuantos. La clave es que promediando datos, eliminas ruido.

Dos minutos de mi vida desperdiciados leyendo estupideces como estas...