Artículos
79 meneos
1871 clics
Falacias de datos a evitar

Falacias de datos a evitar

  1. Cherry-picking: seleccionar los resultados que se ajustan a tus afirmaciones, y excluir aquellos que no lo hacen.
  2. Dragado de datos: testear repetidamente nuevas hipótesis contra el mismo conjunto de datos, no reconociendo que la mayoría de correlaciones son fruto de la casualidad.
  3. Sesgo del superviviente: extraer conclusiones de un conjunto incompleto de datos, únicamente porque esos datos han "sobrevivido" un determinado criterio de selección.
  4. Efecto Cobra: establecer un incentivo que accidentalmente produce el resultado opuesto a aquel que se pretendía. Popularmente conocido como "Incentivo Perverso".
  5. Falsa causalidad: asumir falsamente que, cuando dos eventos aparecen relacionados, es porque uno debe haber causado el otro.
  6. Gerrymandering: manipular los límites geográficos usados para agrupar datos con la intención de modificar los resultados.
  7. Sesgo de muestreo: extraer conclusiones de un conjunto de datos que no son representativos de la población que estás tratando de investigar.
  8. Falacia del jugador: creer erróneamente que porque algo ha sucedido más frecuentemente de lo usual, es ahora menos probable que suceda en un futuro (y viceversa).
  9. Efecto Hawthorne: el acto de monitorizar a alguien puede afectar su comportamiento, llevando a conclusiones espúreas. Popularmente conocido como "el Efecto Observador".
  10. Regresión a la media: cuando sucede algo que es inusualmente bueno o malo, se revertirá de nuevo hacia la media a lo largo del tiempo.
  11. Paradoja de Simpson: cuando aparece una tendencia en diferentes subconjuntos de datos, pero desaparece o se revierte cuando se combinan dichos grupos.
  12. Falacia de McNamara: confiar únicamente en las métricas en situaciones complejas y perder de vista el panorama general.
  13. Sobreajuste: crear un modelo que está excesivamente ajustado a los datos que tú tienes y que no es representativo de las tencencias generales.
  14. Sesgo de publicación: los resultados de investigaciones que son especialmente curiosos tienen más posibilidades de ser publicados, distorsionando nuestra impresión de la realidad.
  15. Peligro de las métricas de resumen: observar únicamente las métricas de resumen, pasando por alto grandes diferencias en los datos brutos.
54 25 0 K 108
54 25 0 K 108
31 meneos
2153 clics

¿Qué piensas en relación a la portada de Menéame?

De cara a como vamos a abordar los próximos cambios en Menéame nos ayudaría bastante que respondieráis a una serie de encuestas. Esta es la primera.

31 0 0 K 178
31 0 0 K 178
31 meneos
1076 clics

Menéame va a pasar de una plaza pública a un redil con algoritmos

Menéame nació como un Barrapunto abierto y permeable, un agregador generalista cuya clave fue ser una plaza ruidosa e influyente, capaz de tumbar webs por puro aluvión de tráfico cada vez que una noticia llegaba a portada, el llamado efecto Menéame. No se trata de idealizar los excesos del pasado, sino de reconocer que en esa apertura residía su valor.

Pero ese espacio, construido sobre la fricción y la participación, lleva años reconvirtiéndose. La administración ha pasado de sostener el debate a gestionar el comportamiento, una deriva evidente cuando se tildó de "rancios" a los usuarios que preferían la versión funcional frente a los cambios impuestos. Es la crónica de una degradación de manual: un proceso exponencial para transformar un servicio comunitario en un activo de extracción. Como resume carademalo en su artículo, llevan tiempo intentando “limpiar la paja del polvo”: una forma bastante precisa de describir años de ajustes orientados no tanto a mejorar el debate como a corregir, filtrar y reconducir el tipo de comunidad que lo sostiene.

El problema no es la monetización, pues los servidores tienen costes, sino rentabilizar una comunidad cada vez más dócil. En su popularización, Menéame ya empezó a devaluarse: menos pluralidad y más control para crear un espacio administrable donde el conflicto no desaparece, pero se clasifica, y el disenso se reconduce.

Ahí encajan los movimientos recientes: un consejo consultivo de legitimidad inocua, un rediseño que diluye la identidad y el uso de las comunidades como mecanismo de segmentación más que de pluralidad. A esto se suma una navegación hostil, saturada de publicidad invasiva y redirecciones forzadas. Al promocionar plataformas como Housers, la administración demostró anteponer la rentabilidad a la seguridad del usuario. Ahora, las suscripciones premium formalizan la jerarquización: la calidad del debate ya no depende de cómo se participa, sino de quién paga. Eso no es moderar; es pastorear.

Los episodios más reveladores no son los escandalosos, sino los sintomáticos. Si un perfil encaja en el modelo de tráfico de la plataforma, deja de ser un problema. No molesta el usuario tóxico, sino el improductivo. Lo vimos tanto con Housers como con JoseElFinanzas: la mala educación es tolerable si viene con billetera.

Lo más inquietante, sin embargo, es el modelo de interacción que representaban perfiles como ReyMambo23. Fuera un primer ensayo con IA guiada o simple deriva humana, la administración validó un patrón impermeable orientado a imponer el marco. Es un precedente peligroso: el uso del ruido y la saturación, venga de cuentas reales o automatizadas, como mecanismo de imposición discursiva. Si el eco de una opinión puede ahogar el diálogo real, están construyendo una máquina de asfixia del debate.

Menéame no intenta salvar una comunidad valiosa, sino rentabilizar su degradación bajo la excusa de la supervivencia económica. No se están muriendo; se están reconvirtiendo en un redil donde, además, pretenden que los pastoreados paguen la cuenta de la cerca.

26 5 0 K 166
26 5 0 K 166
11 meneos
933 clics

Dato mata a relato. Lo que de veras significa

Sigo leyendo de vez en cuando la afiirmación de que dato mata a relato, y casi recuerdo con ternura los tiempos en que se discutía si esto era así o no.

Quien escribe semejante cosa suele ser una persona de entre cincuenta y sesenta años que quiere decir que la verdad se comprueba mediante fuentes, aportando datos, y dejando a un lado la palabrería, porque las palabras mienten pero los números no. Esta idea, de un infantilismo y una ingenuidad conmovedoras, se ha ido desechando progresivamente a medida que todos hemos aprendido, en nuestras carnes, que la única manera solvente de mentir es con datos, que debatir sobre las fuentes es tan inútil y sesgado como debatir sobre las consecuencias de algo, y que los números son tan venenosos o más que las palabras, y más fáciles de adulterar, además.

Y encima, para colmo, la era de la inteligencia artificial aporta un nuevo significado negativo a esa frase. Porque si para los viejos "dato mata relato" apuntaba a una tontería humanista, para los más jóvenes señala a una amenaza totalitaria.

Hoy, "dato mata relato" indica la evidencia de que ya no vale la pena debatir nada, porque el imperio del big data y la inteligencia artificial toma las decisiones, también las políticas, al margen del debate público. Hoy, el dato mata al relato cada vez que una gran compañía como Palantir reúne datos sobre nuestras vidas para abular nuestros relatos sobre ellas. Hoy dejan de importar los relatos en cuanto ineficientes, incapaces de moldear la realidad, para dejar este poder a los datos, los que reúnen sobre nosotros, los que sobre nosotros modelizan, en un acto de control y desocializacion.

El dato mató al relato, sí. Pero el relato era nuestro y el dato no lo es. Hemos pasado de granjeros a ganado. Un detalle insignificante, vaya.

menéame