O documento discute como técnicas estatísticas e análises de dados, como regressão, testes randômicos e redes neurais, podem ser usadas para prever resultados e tomar decisões de forma mais precisa do que especialistas humanos. Essas técnicas podem ser usadas para fins positivos, como melhorar escolas rurais, ou negativos, como cobrar taxas de juros mais altas de certos clientes.
2. Quem concorda?
• A terra gira em torno do sol
• O ser humano evoluiu do macaco
• Um programa é melhor que um sommelier
3.
4. Qualidade do vinho
12,145
+ 0,00117 . chuva no inverno
+ 0,0614 . temperatura média
no crescimento
- 0,00386 . chuva na colheira
5. • Doutor MIT
• Professor de Yale
• Editor do Journal of
Economics, Law and
Organization
6. especialistas vs. analistas
• Estatística como um “telescópio” social
• Especialistas se tornam obsoletos
• Déficits cognitivos
• Nos agarramos a verdades
• Não lidamos bem com múltiplas
informações
8. Armazenamento de
dados
• Aumento de 100 milhões desde 1956
• 1 terabyte
• 1.000 gigabytes
• US$ 400
9. Parâmetro comparativo
• Biblioteca do Congresso
• Maior do mundo em espaço em prateleiras
• 30 milhões de livros
• 58 milhões de manuscritos
• 20 tera de texto
• Walmart - 540 tera
• Google - 4 petabytes
14. 1. Regressão
• Reúne dados históricos
• Estima fatores causais que influenciam uma
variável
• Usa dados passados para prever o futuro
15. Regressão “do mal
• Serve empresas
engajadas em
“concorrência analítica”
• 65% dos maiores
estabelecimentos
comerciais do mundo
• 70% cias aéreas, 40%
bancos
• Walmart, Cassino Harrat
16. Regressão “do bem”
• •
Forecast.com Zillow.com
• •
Comprou 50 bilhões Dusknetwork
de preços
• Acelerador web do
• Definiu 115 Google
indicadores
• Olha padrões
históricos
• Seguro de US$ 10
17. 2. Testes randômicos
• Funcionamento
• Depende do tamanho da mostra
• Certeza que os grupos são
estatisticamente iguais
• Intervenção, tratamento diferenciado
18. Testes randômicos
“do mal”
• Credit Indemnity
• 50 mil solicitações a ex-clientes
• Variação de taxas de juros: 3,25% a
11,75%
• Descobertas:
• Foto de mulher ou telefonema +4,5%
19. Testes randômicos
“do bem”
• Seva Mandir
• Escolas rurais com 50% de faltas
• 120 comunidades, 2 grupos
• Máquina fotográfica
• Redução de faltas para quase 0%
20. 3. Redes neurais
• Computador programado para atualizar
respostas com base em dados novos
• Busca padrões mudando o peso de
variáveis
• Problemas:
• Não explica como estabeleceu pesos
• Sobreadequação
21. Redes neurais e
Epagogix
• Trabalhando em silêncio
• Prever rendimento bruto de filmes baseado
em roteiro
• Resultado: 6 de 9 rendimentos precisos
• Mesmo dinheiro, sem estrelas
• Máquina vs. artistas: margem para
experimentar