Hace 5 años | Por lithium777 a foropolicia.es

Publicado hace 5 años por lithium777 a foropolicia.es

Así sabe la policía si tu denuncia es falsa (y acierta un 91% de veces)

foropolicia.es

El inspector Miguel Camacho, licenciado en Matemáticas y Estadística, leía en 2012 en una comisaría del centro de Granada las declaraciones de robos con violencia en la calle. Era su primer destino como policía después de la academia. Algunas denuncias le parecían falsas, sobre todo las vinculadas a teléfonos móviles caros. "Pero yo entonces era muy ingenuo", dice. Camacho no concebía que alguien acudiera a la policía a denunciar algo que no había ocurrido para cobrar, por ejemplo, un seguro.

comentarios destacados

#3: #0 Inteligencia artificial para detectar denuncias falsas a la policía

Publicado hace 5 años por bonobo
a rtve.es

Inteligencia artificial para detectar denuncias falsas a la policía

rtve.es

Un equipo investigador ha desarrollado Veripol, que determina la veracidad de las declaraciones de r [...]

Creo que es lo mismo.

Bottle

hace 5 años

#4: #1 De hecho, el envío es copia/plagio de tu enlace.

maria1988

hace 5 años

Comentarios

Mejores hilos

Bottle

hace 5 años

#0 Inteligencia artificial para detectar denuncias falsas a la policía

Publicado hace 5 años por bonobo a rtve.es

Inteligencia artificial para detectar denuncias fa...

rtve.es

Creo que es lo mismo.

V 8

K 120

#18

ElPerroDeLosCinco

hace 5 años

#12 Es una parte de la IA. Como pueden serlo también el reconocimiento de imágenes, o la lógica difusa... No hay una definición estricta de lo que es "inteligencia artificial", porque ni siquiera la hay sobre lo que es "inteligencia". Por ejemplo, hay quien dice que los robots androides forman parte de la IA, cosa que yo no considero rigurosa.

V 1

K 28

#21

Desactivado

hace 5 años

#18 gracias

V 0

K 16

#25

Desactivado

hace 5 años

#22 supongo que sabe usted que aquí quienes se saltan las normas de mnm son los boicoteros

V 1

K 28

#28

Desactivado

hace 5 años

#25 Citation required
Datos, please.

V 0

K 8

#37

Desactivado

hace 5 años

#28 las opciones de voto negativo son las que son y no hay ninguna que sea aede.
De ello se infiere que cuando se vota negativo un envío por el solo hecho de ser aede se esta haciendo un uso fraudulento del voto negativo, ya que el envío no sera copia, irrelevante o spam.

V 0

K 10

Desactivado

hace 5 años

editado

A portada con 8 votos y 12 meneos...

V 1

K 27

Desactivado

hace 5 años

#5 Es de Tecnología, y cada vez esto está más de capa caída.

V 1

K 25

Desactivado

hace 5 años

#6 Ya no tiene ni capa. Aunque rancia, al menos eso denotaría elegancia.

V 0

K 9

#10

Magankie

hace 5 años

#5 Será que no hay nada con más karma entre las nuevas...

Me ha parecido interesante. El caso es que estamos hablando de un texto, en el cual no se plasma el estado de la víctima ni cualquier otro dato. ¿Tal vez es algo irrelevante?

V 0

K 9

#14

Misth

hace 5 años

#5 Es importante saber como colar una denuncia falsa como verdadera para algunos admins.... ya sabes, cuestiones de ideologias y estadisticas

Sorprendete de que no la incluyan como asignatura de esas que querian imponer con la coletilla (de genero)....es material de primera para algunas futuras denunciantes.

V 1

K 16

#29

squanchy

hace 5 años

editado

#12 Grosso modo (no me crucifiquéis, que esto es un simple comentario para dar algo de cultura general), hay tres clases programas que se consideran IA:

- algoritmos de búsqueda de estados con heurístico (minimax, poda alfa-beta, A*,...). Se usan p.e. en el ajedrez. A un estado fijo (una foto del problema) asigna un valor mediante una función (heurístico), y se busca el estado que tiene mayor o menor valor de todos los posibles.

- redes neuronales. Es un instrumento matemático donde hay un grafo con pesos (valores) en los nodos (las neuronas). Nuevos valores de entrada se corresponden con una nueva salida, y eso altera los pesos de los nodos. Entrenas a la IA. Ahí entra el machine learning. Al final la red neuronal tiene una configuración determinada por su entrenamiento, pero que ningún humano sabe interpretar específicamente.

- algoritmos basados en pesos y reglas. Se define un objetivo, se parte de un estado inicial, y se van aplicando un conjunto de reglas que se van aproximando a la solución, hasta dar con ella. Lo usan los sistemas expertos. Por ejemplo, das los datos de un pájaro que has visto (color, tamaño, entorno,...) y el sistema es capaz de decirte qué especie es. Para cada dato que aportas, premia unas especies y penaliza otras, hasta dejarte una como más probable.

V 1

K 26

#30

Desactivado

hace 5 años

#29 si esperas que entienda algo de lo que has escrito te equivocas. Pero gracias por intentarlo

V 0

K 16

#31

squanchy

hace 5 años

#30 Quédate con que hay más algoritmos de IA además de las redes neuronales y su machine learning.

V 1

K 26

#32

Desactivado

hace 5 años

#31 gracias!! Es un mundo apasionante y lamentablemente hay demasiada literatura para saber siquiera por donde empezar

V 0

K 16

#35

squanchy

hace 5 años

#32 Te dejo un enlace sencillito por si quieres echarle un ojo este fin de semana, para que aprendas cómo funciona una IA de búsqueda en estados. Los juegos de ajedrez funcionan así (más o menos). Básicamente, genera todos los movimientos posibles tuyos, y de tu contrincante, les asigna un valor, y sigue el camino que le asegura el éxito. https://devcode.la/tutoriales/algoritmo-minimax/

V 1

K 26

#36

Desactivado

hace 5 años

#35 mil gracias lo leeré con gran interés.

V 1

K 26

lithium777

hace 5 años

autor

Artículo completo (AEDE): https://elpais.com/tecnologia/2018/09/16/actualidad/1537135174_883514.html

V 1

K 25

maria1988

hace 5 años

#1 De hecho, el envío es copia/plagio de tu enlace.

V 5

K 63

avalancha971

hace 5 años

#4 Para evitar enlazar a AEDE, copia pegada en un foro... Pues no sé qué es peor.

V 3

K 43

#22

chu

hace 5 años

editado

#9 Peor es enlazar a aede directamente, si en ese foro son unos radicales que se saltan las normas o deseos de elpaís allá ellos.
El artículo es el mismo y está referenciado, yo prefiero leerlo en el foro.

V 0

K 7

#13

keiko_san

hace 5 años

Gracias.
Ya se como me tengo que inventar mi proxima denuncia falsa para que sea mas creible.

V 2

K 24

#20

rafran

hace 5 años

#13 Correcto, ya tienes el material para preparar la declaración

V 0

K 6

#11

ElPerroDeLosCinco

hace 5 años

No me queda claro dónde interviene la inteligencia artificial en este proyecto. Si se trata de identificar y contar palabras clave, eso no es IA. Ahora bien, si el sistema va aprendiendo de sus errores y aciertos, y es capaz de identificar por su cuenta nuevos patrones y después aplicar y hacer un seguimiento de estas hipótesis, sí que estaríamos hablando de IA.

V 2

K 18

#12

Desactivado

hace 5 años

#11 machine learning es lo mismo que IA?

V 0

K 16

#17

Desactivado

hace 5 años

#12 si

V 0

K 10

#19

Thony

hace 5 años

#11 Exacto. Ya en una parte del artículo hace mención al "algoritmo" que usa. Pero hoy en día, la palabra "IA" vende muchísimo, y a cualquier aplicación o programa que desarrolles, si le incluyes ese término, tiene más capacidad de marketing.

Por otro lado, dice que un policía experto detecta un 75%, el programa un 91%. Es un avance, pero todo y así, el margen de un 9% de error es muy alto para que los policías (o los seguros) se amparen en el uso de este programa para descartar automáticamente denuncias. Espero que no sea así.

V 1

K 26

#23

Gilbebo

hace 5 años

editado

#19 Lo importante es discriminar qué % de las falsas declara como verdaderas (y el seguro acabaría teóricamente pagando por cometer un error estadístico de tipo 1) y qué % de las verdaderas declara como falsas (y encima de que te han robado va y la policía te denuncia, en el peor de los casos, por falsedad a un juez.e intento de estafa a una aseguradora: error 2). En estos casos creo que es mejor solo declarar como falsa aquella sobre la que no haya casi ningún género de duda y llevarlas al juez (nivel de confianza 99%) aunque se nos cuelen unas cuantas muy dudosas que ya pillaremos en la siguiente ocasión.

V 2

K 33

#26

fluffy

hace 5 años

#11 No conozco VeriPol, pero sí sé cómo lo implementaría yo, y sí implica IA.
El problema es un clasificador binario de libro, como los que deciden si un mensaje es spam o no. Para hacer clasificadores en lenguaje natural hay muchas aproximaciones, una de ellas es que la IA se lee montones de textos (corpus) para calcular vectores que representan a las palabras, de esa manera puedes hacer operaciones con las palabras como Rey - hombre + mujer = reina. Pero esto no me aportaría mucho para clasificar así que mi aproximación serían los siguientes pasos:
- Tokenizar: dada un texto saber partirlo en frases y cada frase en palabras. No es tan trivial como parece porque en muchos idiomas hay contracciones y similares y tokenizar significa romperlas en palabras, por ejemplo "don't" debe tokenizarse a ["do", "not"]
- Eliminación de palabras que no aportan significado (stopwords). El problema de tener muchas palabras es que la eficiencia y el tiempo de entreno crecen mucho con la cantidad de palabraa diferentes.
- Cálculo de la raíz o lema de cada palabra. Se puede elegir la primera (stemming) y nos devolverá la raíz, por ejemplo de "viajando" nos dará "viaj", o la segunda (lemmatizing) para obtener el lema, "viajando" nos debería dar "viaje". Los stemmers son más sencillos, y puedes encontrar Porter stemmers para los lenguajes más comunes.
- El siguiente paso es tener denuncias, muchas, y clasificadas a si eran falsas o no. Para cada una haremos los pasos anteriores obteniendo un vectoe de palabras, y obtendremos una lista completa de todas las raíces diferentes usadas entre todos los textos y la cantidad de veces que aparecen en global y por texto.
- Parte de los documentos (un 70% por poner un ejemplo de cifra) se usará para entrenar y el otro 30% para comprobar el entrenamiento. Esto se hace pars comprobar no solamente que nuestra IA aprende sino para evitar algo llamado "overfitting" y que consiste en que la IA no generalice el patrón sino que se ajusta exactamente a los datos de entrenamiento, no funcionando correctamente fuera de esos datos.
- Y aquí ya es escoger algoritmo. Al ser solamente dos clases (es falsa o no) hay muchísimas opciones, Naive Bayes, logistic regression, CNN, RNN, two-class boosted decission tree,... Pero el texto nos da una pista de que no es solamente por palabras sueltas sino que identifica combinaciones de palabras así que apostaría por LSTM RNN. Una vez entrenado obtienes un modelo, que no es más que un montón de numeritos, y obtenerlos es lo que lleva tiempo (entrenar) y GPU.
- Ya tienes tu entreno, te llega una frase, haces los pasos de tokenizar, quitar stopwords y stemming, calculas un vector de features, lo pasas por tu modelo y te devuelve un valor y la probabilidad de qie sea ese valor.
- Queda evaluarlo. Lo binario es bonito, así que puedes evaluar verdaderos positivos, falsos positivos, verdaderos negativos, falsos negativos y calcular medidas de lo bien que funciona. La gente se suele fijar en el accuracy, lo bien que acierta los positivos, pero eso da el problema de idenficar una denuncia como falsa y que sea verdadera, y para medir eso está el recall. Teniendo en cuenta accuracy y recall se calcula una tercera llamada f1-score que suele ser la que se usa para decir si tu modelo es bueno o no. También se usa bastante el AUC (Area under the curve), que básicamente es un número de 0 a 1 dónde 0.5 es lo que te daría el azar.

V 3

K 22

#33

squanchy

hace 5 años

#26 Mira, te voy a votar positivo sólo por la pechá de escribir que te has dado.

V 1

K 14

#34

fluffy

hace 5 años

#33 Pues... fue desde el móvil, iba en el metro camino al trabajo. No tengo una tendinitis de milagro

V 0

K 6

#15

aauivozcrx

hace 5 años

y los montajes policiales también los sabe detectar o eso ya tal?

V 1

K 13

#16

Desactivado

hace 5 años

Para evitar el AEDE nos envían a ForoPolicía. En la buena dirección.

V 0

K 9

#24

Hysbald

hace 5 años

Me sorprende la cantidad de denuncias falsas que se presentan por robos. Aún así, no veo a nadie pidiendo que cambien la ley...

V 0

K 9

thoro

hace 5 años

Se centra en las palabras más usadas.
Obviamente la primera es iPhone.
Si la repites 3 veces eres culpable.

V 0

K 9

parabola

hace 5 años

Da igual. #Yosítecreo

V 0

K 8

#27

Desactivado

hace 5 años

Creo que con la moda de la IA, estamos empezando a llamar IA a software "normal"

V 0

K 6

Así sabe la policía si tu denuncia es falsa (y acierta un 91% de veces)

Etiquetas

comentarios destacados

Inteligencia artificial para detectar denuncias falsas a la policía

Un equipo investigador ha desarrollado Veripol, que determina la veracidad de las declaraciones de r [...]

Comentarios

Inteligencia artificial para detectar denuncias fa...