With this project we won the Data Science National Contest organized by the Presidential Office in Mexico to improve Public Policy in 2014. The updated presentation can be found in http://bit.ly/datata-dataton. The code can be found in http://www.github.com/datata/dataton.
The presentation is in spanish.
55. Algoritmo — AdaBoost
Dados donde
Inicializar
Freund y Schapire, 1997
Datata www.datata.mx
56. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
Freund y Schapire, 1997
Datata www.datata.mx
57. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución
Freund y Schapire, 1997
Datata www.datata.mx
58. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución
● Obtener la hipótesis débil
Freund y Schapire, 1997
Datata www.datata.mx
59. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución
● Obtener la hipótesis débil con error .
Freund y Schapire, 1997
Datata www.datata.mx
60. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución
● Obtener la hipótesis débil con error .
● Escoger
Freund y Schapire, 1997
Datata www.datata.mx
61. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución
● Obtener la hipótesis débil con error .
● Escoger
● Actualizar
Freund y Schapire, 1997
Datata www.datata.mx
62. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución
● Obtener la hipótesis débil con error .
● Escoger
● Actualizar
Freund y Schapire, 1997
Datata www.datata.mx
63. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución
● Obtener la hipótesis débil con error .
● Escoger
● Actualizar
Hipótesis final: .
Freund y Schapire, 1997
Datata www.datata.mx
64. Algoritmo — AdaBoost
Dados donde
Inicializar
Para :
● Entrenar al predictor débil usando la distribución .
● Obtener la hipótesis débil con error .
● Escoger
● Actualizar
Freund y Schapire, 1997
Hipótesis final: . es un factor de normalización para
.
Datata www.datata.mx
94. Suponiendo que cada es mejor que adivinar al azar
, donde es el peso de la predicción .
Datata www.datata.mx
95. Suponiendo que cada es mejor que adivinar al azar
, donde es el peso de la predicción .
Si es el error de clasificación de un predictor:
Datata www.datata.mx
96. Suponiendo que cada es mejor que adivinar al azar
, donde es el peso de la predicción .
Si es el error de clasificación de un predictor:
Freund y Schapire, 1997
Datata www.datata.mx
97. En boosting el error de
entrenamiento puede hacerse
arbitrariamente pequeño.
Datata www.datata.mx
167. API de Twitter
tweets <- searchTwitter(
keyword = keyword,
geocode = geozone,
since = since.date,
n = number.tweets)
Datata www.datata.mx
168. API de Twitter
tweets <- searchTwitter(
keyword = keyword,
geocode = geozone,
since = since.date,
n = number.tweets)
twitteR
Datata www.datata.mx
169. API de Twitter API de Google
tweets <- searchTwitter(
keyword = keyword,
geocode = geozone,
since = since.date,
n = number.tweets)
twitteR
Datata www.datata.mx
170. API de Twitter API de Google
url <- paste(“http://maps.google
apis.com/maps/api/directions/json?”,
“origin=”, from.coord,
“&destination=”, to.coord,
“&language=”, lang.code,
sep = “”)
tweets <- searchTwitter(
keyword = keyword,
geocode = geozone,
since = since.date,
n = number.tweets)
twitteR
Datata www.datata.mx
171. API de Twitter API de Google
tweets <- searchTwitter(
keyword = keyword,
geocode = geozone,
since = since.date,
n = number.tweets)
twitteR
url <- paste(“http://maps.google
apis.com/maps/api/directions/json?”,
“origin=”, from.coord,
“&destination=”, to.coord,
“&language=”, lang.code,
sep = “”)
route <- fromJSON(
paste(readLines(url),
collapse = “”))
Datata www.datata.mx
186. Referencias
[1] Enrique García Tejeda, Análisis Económico del Derecho Penal,
Clase de licenciatura en la Universidad Panamericana
[2] Gary Becker, Crime and Punishment, An Economic Approach
http://www.nber.org/chapters/c3625.pdf
[3] Yoav Freund and Robert Schapire, A Short Introduction to Boosting
http://cseweb.ucsd.edu/~yfreund/papers/IntroToBoosting.pdf
[4] Twitter, REST API v1.1 Resources,
https://dev.twitter.com/docs/api/1.1
[5] Google, The Google Directions API,
https://developers.google.com/maps/documentation/directions/
Datata www.datata.mx