Hace 10 años | Por Locnar a agenciasinc.es
Publicado hace 10 años por Locnar a agenciasinc.es

Los intervalos de tiempo en los que se emiten mensajes en Twitter dan pistas sobre si quien lo hace es un programa informático, una empresa o una persona, independientemente del contenido o el lenguaje del tuit. Así lo asegura un equipo de investigadores del Imperial College de Londres que ha utilizado algoritmos basados en neurociencia para desenmascarar a los emisores con una precisión del 83%.

Comentarios

ColaKO

Una precisión del 83% es una basura. O me das un p menor de 0,05 o es caca.

Robus

#1

¿Tu sabes lo difícil que es hacer eso?!

una precisión superior a 4 quintas partes!

Me faltan datos para hacer un análisis correcto, però imaginate conseguir eliminar un 83% del spam que corre por el mundo... no te parecería fantástico?!

ES UNA VIRGUERÍA! No lo desprecies porque no sabes lo que han hecho!

ColaKO

#4 Yo solo digo, tal como amplía #7 que un 83% no es suficiente para saberlo con seguridad pues aún hay casi un 20% de posibilidad de error, y eso es mucho. ¿te jugarías 100 € por un tuit con ese porcentaje de error?

Robus

#9 En sistemas de inteligencia artificial no cognitiva suele darse un factor de aproximación del 80% al 90% como correcto...

y sobre la apuesta, creo que aquí tenemos un problema de saber que se pretende obtener, cuando he dicho que faltaban más datos me referia a eso.

Si tenemos:

Twits correctos según el bot | Twitts incorrectos según el bot | Twitts correctos | Twits incorrectos

Así:

__ TCSB TICSB
TC ___A___B__
TI ___C___D__

A = % de TC que el bot ha considerado correctos (acierto)
B = % de TC que el bot ha considerado erroneos (fallo)
C = % de TI que el bot ha considerado correctos (fallo)
D = % de TI que el bot ha considerado erroneos (acierto)

Según la relación de ABCD tenemos diferentes paradigmas de trabajo.

Uno de los paradigmas sería, por ejemplo, que C fuese 0%, o sea que el bot NUNCA dijese que un twit incorrecto és correcto, y todo el error del 83% estuviese en el B, o sea que el bot se equivoca marcando como erroneos twits correctos.

En esta circunstancia, por supuesto que me jugaría 100€ a que un twit marcado como correcto es correcto.

Sí, es un poco liado, pero es el sistema en que se trabaja con redes nueuronales.

Si te interesa el tema, te aconsejo dos cursos de coursera.org:

Machine Learning
Neural Networks for Machine Learning.

Veras que, en ciertos paradigmas, un acierto del 63% es un exito total!

Robus

#9 Ah! me olvidado de decir algo.

Supongamos que queremos analizar todos los twits para dejar pasar solo los correctos.

Si ajustamos los parametros para conseguir el C = 0%, solamente tendremos que mirar un 17%, por lo tanto, tardaremos una quinta parte del tiempo que habriamos tardado antes en hacer el trabajo!

O sea, el bot es una virguería de las buenas!

Scruzcampillo

#1 creo que confundes precisión con significación (o significancia estadística)...

ColaKO

#5 Tienes razón, mejor decir significación

Scruzcampillo

#6 en #7 he hecho una aclaración, sin acritud ninguna, de verdad, que solo quiero echar una mano

Ka0

Estos investigadores son unos lumbreras: "Además, el estudio ha encontrado que las cuentas corporativas tuitean más durante las horas de trabajo"

ValaCiencias

Mi algoritmo consigue un 50% de efectividad y no salgo a presumir.

Scruzcampillo

Añado, para los curiosos: Significación https://es.wikipedia.org/wiki/Significación_estad%C3%ADstica (lo de la p