Comentarios

BodyOfCrime

#c-2" class="content-link" style="color: rgb(227, 86, 20)" data-toggle="popover" data-popover-type="comment" data-popover-url="/tooltip/comment/3292731/order/2">#2 A veces es difícil encontrar cosas en xkcd. A ver si algún admin te lo cambia porque merece la pena incluso la explicación que puso # 1

fantomax

#1 Ya está #2
En xkcd conviene dejar unos segundos el ratón quieto sobre la imagen.

Feindesland

#4 Muchas gracias

heffeque

#4 Como estoy desde el móvil y no puedo poner el ratón sobre la imagen para ver el texto alternativo, he abierto el código fuente de la página web y me he llevado una graciosa sorpresa con el footnote (que se ve desde la propia web, pero como está tan pequeño nunca me había fijado).

#1 Muy interesante. ¡Gracias!

D

#4 #39 https://m.xkcd.com directamente.

D

#8, pues yo no lo interpreto así. Lo que hace es explicar con cada operación lo que pasa cuando los datos no son precisos, cuándo el error aumenta más.

Por cierto, si te vas a la explicación que enlaza #1:

This comic is not related to the 2020 pandemic of the coronavirus SARS-CoV-2

D

La importancia de la precisión en modelos es algo muy a recordar estos días.

ElPerroDeLosCinco

A veces, el propio exceso de precisión produce "garbage". Cuando no se necesita mucha exactitud, es mejor un dato impreciso pero comprensible que uno preciso pero que aporta información de dificulta la comprensión. Por ejemplo, es mejor decir: "en Bilbao llueve un tercio de los días", que: "la probabilidad de lluvia en Bilbao es de un 33.291904%".

N

#22 en este caso el intervalo de confianza debe ser como mínimo del 1%, o sea que todos los números por detrás del 33 no sirven para nada.

ElPerroDeLosCinco

#26 Exacto. Otro ejemplo es cuando en una carrera ciclista dicen por la tele que "los corredores van a una velocidad media de 28.325 km/h". Tanta precisión es innecesaria, por no decir que realmente en ningún momento van exactamente a esa velocidad.

Cancudrilo

#27 Darboux está llorando por tu comentario

C

#29 No me sonaba de nada Darboux, pensaba que tbn era de boltzano al ser casi igual el de los valores intermedios.

D

#22 También hay otro concepto interesante que es precisión vs exactitud. En finanzas es necesaria la exactitud para evitar errores gruesos al concatenar operaciones. En machine learning la precisión es importante pero no la exactitud.

m

#44 Expresado en otros términos tal vez más sencillos de recordar:

exactitud => poco sesgo
precisión => poca varianza

Y tanto el sesgo como la varianza son muy importantes en machine learning, no solo la varianza (1/precisión). El error cuadrático medio, que es como se suele cuantificar el desempeño de un modelo o estimador, es sesgo^2 + varianza.

D

#60 Exacto, aunque yo estaba pensando en los coeficientes del modelo, no en la salida. Da igual tener coeficientes de tipo base-10 con 16 decimales, el precio que vas a pagar por la exactitud es que el tiempo de entrenamiento se va a alargar innecesariamente. Sin embargo se requiere cierto grado de precisión para mantener la coherencia. El dibujo que puse la verdad está más relacionado con el concepto de error que mencionas.

Inviegno

Pues es una guerra que yo siempre tengo en el trabajo. Por lo visto soy el tocapelotas que usa decimales en los cálculos.

Feindesland

#15 Estoy por pedirte matrimonio...

lol lol lol

guaperas

#15 lo importante no es usar decimales sino saber por qué los usas y hasta donde coges.

Por poner un ejemplo de lo estúpido e irrelevantes que a veces so los datos. Me acuerdo un "estudio" que salió hace unos años que la medida del pene medio era del 13,12 cm. Lo curioso son esos decimales, ¿12? Esos números no tienen sentido, son inventados. Eso me plantea dos preguntas, ¿como diantres se mide el tamaño de un pene hasta hasta la diezmilésima de metro? y otra ¿donde empieza y donde acaba como sabes donde poner la regla?

Inviegno

#24 Ese .12 no es particularmente relevante, pero sí es relevante que todos los datos que hacen componer esa media sean válidos y precisos.

guaperas

#28 pero tu asumes que todos están bien medidos, el problema de esa medida es que han hecho la media de datos que no llegan a esa precisión

prejudice

#24 la forma estándar es poner regla por encima y apretar hasta llegar al hueso. De otra forma la grasa abdominal hará que la gente con sobrepeso arroje valores mas bajos de lo que corresponde.
Lo normal sería poner un decimal que es la precisión que aporta una regla milimetrada. Aunque supongo que la mayoría redondeará hacía arriba.

m

#24 #30

Ehm, mirad la ecuación 7 de la viñeta. Puedes tener datos con precisión de 1 decimal y ser capaz de estimar la media con más decimales si tienes un tamaño muestral N suficiente. De hecho, si la población es normal (y por tanto simétrica), estos efectos de truncamiento se cancelan en promedio y la esperanza de la media muestral sigue siendo el verdadero valor a estimar, solo que con más varianza (que se podría reducir con N mayor).

guaperas

#59 sí, lo que dices es verdad en segundo lugar, pero no lo que dices en primer lugar (que sí se puede ir mas alla de la precisión).

Como nivel matemático si teórico y abstracto si....., te puede dar una idea de como se distribuye, pero ese dato no te lo cogería ningún científico, no tiene validez.

No puedes aplicar esa formula 7 de la viñeta con datos más allá de la precisión más desfavorable que tengas en tu muestra. Por una muestra muy grande que tengas no puedes dar como resultados datos de algo que no se puede medir, ¿cómo mides la décima parte de un milimetro en un pene? .

m

#63 El dato lo cogería cualquier científico que supiese lo que es la ley de los grandes números; afortunadamente hay unos cuantos. La clave es que promediando datos, eliminas ruido.

guaperas

#64 pero la ley de los grandes números no la puedes aplicar a algo que no existe.

Te voy a poner otro en un instituto hay de promedio 34,23 mesas por clase. ¿Qué es 0,23 mesas ? Es un constructo matemático que te puede dar... ¿qué información?, la mesa o bien es mesa o no es mesa, no es una variable continua. Por lo tanto lo correcto seria decir que el promedio es de 34 mesas por clase.

Se que es tentador decir que esos decimales te dicen que en general la tendencia es de que esté mas cerca de 34 que de 35.... pero para eso truncas, el promedio es de 34 mesas por clase. Que luego abstractemente se pueda decir más cosas si...

Pero la ciencia va a lo seguro, hablo del a buena ciencia. Luego te encuentran papers por ahí que tienen menos validez y fiabilidad que un panfleto publicitario....

m

#65 No, el promedio son 34,23 mesas por clase. 34 es un truncamiento. Ese 0,23 te da la información de que si tienes 4 clases, el promedio de mesas en ellas es casi 137, en vez de 136 como obtendrías si eliminases el 0,23 y te quedases con 34 porque es un número que te parece más bonito.

Estoy de acuerdo en que la ley de los grandes números no la puedes aplicar a algo que no existe, esperemos que no les hayan cortado el pene a los hombres de tu ejemplo original

guaperas

#66 ains la estadistica inferencial.... lol

D

#24 Es un ejemplo de 'spureous accuracy'. La cifra presentada como resultado debe tener como máximo el mismo número de cifras significativas que el dato con menos cifras significativas utilizado para lograr el resultado, y no más.

silencer

#24 En un examen de termodinamica, hace añitos, el profesor me bajó 1 punto por poner la solucion de Tª con 3 decimales.
Con la explicacion pertinente

J

#15 Te crees que tus vecinos no lo saben? Luego cuando te pongan un cartel en el portal diciendo que te marches hasta que acabe la cuarentena porque saben que eres el de los decimales dirás en las redes sociales que eres una víctima de odio.

c

Los cuentamuertos deberían estudiarse esta viñeta.

fantomax

#47 ok, gracias.

m

#0 y #Admin: Si podéis añadid "matemáticas basura" y "garbage maths" para localizar mejor este envío, que es muy bueno.

LeDYoM

Como programador en C++ que tiene que usar muchas funciones numericas, doy fe.
Pero a veces a los matematicos les cuesta enteder como funciona el ordenador.

D

Para quien no entienda la importancia del tema aquí hay algunas consecuencias de utilizar datos basura: https://web.ma.utexas.edu/users/arbogast/misc/disasters.html

Monsieur-J

#34 Pero ahí no habla de datos basura, son problemas de cálculo por la precisión.

D

#36 Y la falta de precisión o error de redondeo te genera datos basura.

frg

#36 ¿Como era aquella nave que se estrelló contra marte por una mimiedad en una no conversión de Millas Kilómetros?

fantomax

CarmeCarme, he cambiado el link en el envío pero sigue llevando al antiguo, ¿qué pasa?

Carme

#37 será cosa de la caché de tu navegador, yo lo veo bien

Black_Diamond

#47 debo decir que a mí también me pasa, incluso recargando la página. El enlace

https://www.meneame.net/go?id=3292731

Me lleva al antiguo enlace:

https://pbs.twimg.com/media/EV0jlgfUMAAClSe?format=png&name=small

Feindesland

#69 Gracias

Feindesland

#13

Esa es buena también.

A

Muy útil la explicación, especialmente en estos días.

a

#0 añadidas a etiquetas "matemáticas basura" y "garbage maths".

r

No lo pillo

r

#8 ahh yo no lo relacionaba con estadística si no con informática — precise: 0.25 non precise 0.333333

b

#8 recordando a Babbage:
"Al menos en un par de ocasiones se me preguntó: Sr. Babbage, si ingresa cifras incorrectas en la máquina, ¿saldrán las respuestas correctas?' No puedo percibir correctamente el tipo de confusión de ideas que podría provocar tal pregunta"

Niltsiar

#8 Nadie las puede dar, por que no existen.
La ciencia es algo serio, la opinión publica solo pide y recibe "periodismo" para poder insultarse entre sí.

g

!!Protesto señoría!! Los logarítmos.... ¿Dónde están los logaritmos en ese juego?...

avalancha971

Me ha costado entender GARBAGE - GARBAGE después de GARBAGE + GARBAGE.

Pero he entendido que hay que asumir que en ambos casos son números de igual magnitud.

Idomeneo

#19 Ninguna de las fórmulas dice GARBAGE + GARBAGE.

avalancha971

#45 Tienes razón, es PRECISE NUMBER + GARBAGE.

D

#19 No necesariamente

b

¿Librerías decimal? .toFixed(2) y arreando!

Dos minutos de mi vida desperdiciados leyendo estupideces como estas...

BodyOfCrime

#7 Pues sí que lees despacio...

D

#10 Yo la estadística solo la entiendo mediante explicaciones geométrico-algebraicas con vectores. Quiero entender el por qué de las fórmulas.

Una vez lo reduces a distancias, todo en estadística es mucho más intuitivo.

Lo mismo que integrar y derivar. Es medir y sumar intervalos de distancia/tiempo sobre el tiempo. Medir el movimiento, vamos.

Arkhan

#7 Pues viendo que la publicación es de XKCD te puedes esperar ya lo que hay dentro... No entiendo tanta pataleta.

D

#7, ojalá la gente como tú sea un grupo muy minoritario

Que se puede ser un ignorante, pero alardear de ello es más grave.

D

#7 ¿y el tiempo que hemos desperdiciado nosotros leyendo tu genial aporte, que?