Presentación usada en la EastMadHack por Jorge Coronado fundador de la empresa QuantiKa14 hablando sobre OSINT, SOCMINT y la nueva herramienta que han creado llamado Dante's Gates.
3. Quién soy yo
• Fundador y CEO de QuantiKa14
• Colaborador de Canal Sur Radio desde 2015
• Profesor en el curso de detectives de la Universidad Pablo Olavide de Sevilla
• Colaborador del primer “Protocolo institucional en España ante la violencia
de género en las redes sociales”
• Formación a cuerpos de seguridad en investigación a través de Internet
desde la ESPA y otros cursos
• Creador del protocolo de actuación para la búsqueda de personas
desaparecidas a través de las tecnologías de la información y
comunicación
• Vocal de la asociación de peritos tecnológicos de Andalucía (APTAN)
• Dinamizador del Hack&Beers Sevilla
• Creador de aplicaciones como: Guasap Forensic, Shodita, EO-Ripper, Dante
Gates, Killo.io, etc
23/05/2018 WWW.QUANTIKA14.COM 3
4. Objetivo de la charla
• Enseñar lo fácil que es
montarse un sistema de
bots que recojan
información de fuentes
abiertas
• Crear un bot de telegram
que muestre la información
23/05/2018 WWW.QUANTIKA14.COM 4
5. ¿Qué vamos a
ver?
• Conceptos básicos
• OSINT
• SOCMINT
• LSONT
• DOXING
• BIG DATA
• Crear perfiles
• Obtener datos
• Analizar datos
• Exponer datos
• Demostración
• Conclusión
23/05/2018
WWW.QUANTIKA14.COM
5
7. Recogida de datos
• Usamos Python para hacer Web scraping
• BeautifulSoup
• Mechanize
• Selenium
• Requests
• Dryscape
(https://dryscrape.readthedocs.io/en/latest/)
23/05/2018 WWW.QUANTIKA14.COM 7
9. Tipos de datos
• Plataformas dinámicas (recursivo)
• BOE y BORME
• Redes sociales
• Twitter
• Facebook
• LinkedIn
• Pastebin
• Adjudicaciones y licitaciones
• Inmobiliarias
• Comentarios en foros y blogs
• Deep Web
• Chats (WhatsApp y Telegram)
• Plataformas datos estáticos (recogida una vez)
• Universidades de España
• Colegios profesionales
• Buscadores
• Google
• Bing
• DuckDuckGo
• Pastebin
• Páginas amarillas y blancas
23/05/2018
WWW.QUANTIKA14.COM 9
10. Web scraping
• Nos permite seleccionar, analizar y almacenar el dato
concreto de una web que queramos.
• BeautifulSoup
• Mechanize
• Selenium
• Requests
• Dryscape (https://dryscrape.readthedocs.io/en/latest
23/05/2018 WWW.QUANTIKA14.COM 10
13. ¿Qué podemos saber solo de un
teléfono?
• http://blog.quantika14.com/blog/2018/04/23/antes-se-podia-
obtener-todas-las-cuentas-asociadas-a-un-telefono-en-
facebook/
• https://github.com/Quantika14/facebook-phone-search-bot
23/05/2018 WWW.QUANTIKA14.COM 13
14. ¿Qué podemos saber solo de un
teléfono?
23/05/2018 WWW.QUANTIKA14.COM 14
• Su compañía de
teléfono:
https://www.infotelefo
nica.es
15. ¿Qué podemos saber solo de un
teléfono?
23/05/2018 WWW.QUANTIKA14.COM 15
- Páginas blancas
16. Cómo descargar todo Pastebin
• Creación de URL
• Descarga del contenido
• http://blog.quantika14.co
m/blog/2017/12/05/como-
descargar-todo-pastebin-
en-menos-de-100-lineas-
de-codigo/
• https://github.com/JWScr3
3d/crawler-downloader-
pastebin
23/05/2018 WWW.QUANTIKA14.COM 16
17. Esquema de datos desde un nº de
teléfono
Phone
Compañia
Localización
Wifi Map
Familiares
Nombres y
apellidos
BOE
DNI
Multas
Empresas
(BORME)
Adjudicaciones
Redes Sociales
Orientación
política
NICK
Foros
Telegram
Papercall.io
Familiares
23/05/2018 WWW.QUANTIKA14.COM 17
18. Análisis
• Expresiones regulares
• Investigación automática
de información de forma
recursiva (cruce de datos)
• Análisis de orientación
política
• Análisis de sentimiento
(NLTK, palabras claves)
23/05/2018 WWW.QUANTIKA14.COM 18
20. Esquema análisis político en Twitter
Username,cuenta,
biografía
Cuentas a las que
sigues
Análisis de
sentimiento y
menciones
políticas en Tweets
Orientación
política
23/05/2018 WWW.QUANTIKA14.COM 20
22. Preguntas
• ¿No te banean los bots?
• ¿Qué pasa si el html de la
web cambia?
• ¿Y la LOPD, GPD….?
• ¿Te puedo invitar a una
cerveza cruzcampo?
23/05/2018 WWW.QUANTIKA14.COM 22