SlideShare una empresa de Scribd logo
1 de 10
Rastreador de vagas disponíveis na Web 
Davi Amaral (CEO) 
Felipe Pinto 
Bruno Pedrosa 
Francke Peixoto 
Thiago Dias 
Ricardo Gomes
Rastreador de vagas disponíveis na Web 
Cenário 
Um analista de sistemas da JOIN US, em seu momento de ócio, desenvolveu um 
rastreador que procura por publicação de vagas na web. Como analisar esses dados 
de forma simples, barata é rápida? 
O WebCrawler desenvolvido por Felipe Pinto, gera por mês em média 50 milhões de 
linhas. 
Dados oriundos de navegação em redes sociais, grupos de e-mails e fóruns.
Rastreador de vagas disponíveis na Web 
Solução proposta 
O que é ? 
É uma solução em nuvem (cloud) para entregar Big Data SaaS. Pague pelo que usar. 
O Google BigQuery é uma solução Big Data, como o Hadoop, com a vantagem de não se precisar contratar e/ou comprar uma 
série de servidores, nem, contar com mão-de-obra, altamente, especializada.
Rastreador de vagas disponíveis na Web 
Porque o Google BigQuery? 
Demonstração 1gb grátis para armazenamento 5Gb grátis por 12 meses Ferramenta é Livre 
Preço $ 0,025/mês por Gb 
+ $5,00 por Tb processado 
$84/mês por Tb Desvantagem de se precisar contratar 
e/ou comprar uma série de servidores, 
contar com mão-de-obra, altamente, 
especializada. 
Deixando seus custos menos 
controláveis. 
Manutenção $0 $0
Rastreador de vagas disponíveis na Web 
Comparativo 
Por que o BigQuery é muito mais 
rápido do que o Hadoop? 
Muito difícil. Para ganhar performance escalar, o Hadoop depende de caixas (servidores). 
Enquanto a maioria dos clusters de Hadoop que tenho visto no Brasil, vão de 4 a 10 servidores (alguns 
casos com até 40 servidores, mas, a maioria fica abaixo de 10) e isso é muito custo $$$. 
No BigQuery as aplicações já nascem grande. Seus dados são replicados para dezenas de servidores. 
Assim como, uma andorinha não faz verão, meia dúzia de servidores Hadoop também não. 
Então, comparar a performance do BigQuery com um “clusterzinho” de Hadoop não é uma comparação das mais justas.
Rastreador de vagas disponíveis na Web 
Comparativo 
Obter informações a respeito da performance de processamento com 
TPCTransaction Processing Performance Council 
O TPC é uma organização sem fins lucrativos, tendo como objetivo principal estabelecer critérios para se obter informações a respeito 
da performance de processamento de transações e de banco de dados através de benchmarks. 
Baseia-se em testes padronizados tais como o TPC-C, o TPC-W e o TPC-H para obter tais resultados e só assim divulgar os dados reais dessa 
performance. Estes testes do TPC seguem normas extremamente rigorosas que testam diversos pontos do sistema - principalmente 
nos quesitos confiabilidade e durabilidade. 
TPC-H Simulam um ambiente de Data Warehouse, sincronizado com bancos 
de dados de produção online. 
Este benchmark se utiliza de consultas aleatórias de alto grau de 
complexidade, projetadas para responder a algumas questões de 
negócios do mundo real, como: perguntas sobre pré e 
promoções, oferta e demanda, lucro e receita e 
participação de mercado.
Rastreador de vagas disponíveis na Web 
Comparativo 
Tempo de execução de consulta por segundos.
Rastreador de vagas disponíveis na Web 
Conclusão da Analise 
Para TPC-H Query (massively parallelizable) 
Vemos que BigQuery supera claramente RedShift (com um nó, bem como 8 nós). 
Mesmo o desempenho do cache hot do RedShift é inferior ao BigQuery. 
Este é provavelmente porque o BigQuery utiliza servidores proporcionais para resolver a consulta massivas com um alto grau de 
paralelismo mediante ao tamanho do DataSet. 
Para esse projeto a solução mais viável é o 
Entre as soluções apresentadas ela é mais economicamente viável, e não apresenta 
custo de mão de obra para manutenção dos servidores.
Rastreador de vagas disponíveis na Web 
Nem tudo são flores... 
O BigQuery não é um banco de dados relacional tradicional! 
Ele continua sendo um Big Data, em toda sua amplitude: 
Dados não estruturados (embora apresente-os como tabelas), NoSQL (embora tenha uma linguagem, 
própria, SQL “like”), não é possível criar índices, não é possível modificar os dados 
(updates or deletes). 
Ele é um sistema, puramente, OLAP. 
A importação e/ou cópia dos dados para a nuvem é uma tarefa árdua, demorada, chata e nada inteligente. Se algo dá errado em 
algum arquivo, as coisas ficam, realmente, pretas.
Rastreador de vagas disponíveis na Web 
Fontes 
http://bighadoop.wordpress.com/2012/05/13/google-bigquery/ 
https://cloud.google.com/developers/articles/getting-started-with-google-bigquery?hl=pt-br 
http://computerworld.com.br/tecnologia/2013/01/25/os-10-melhores-provedores-de-armazenamento-na-nuvem-segundo-o-gartner/ 
http://www.fam2011.com.br/site/revista/pdf/ed10/art04.pdf 
http://bighadoop.wordpress.com/2012/05/13/google-bigquery/ 
http://news.dice.com/2013/04/15/googles-bigquery-vs-hadoop-a-matchup-2/ 
http://gavinbadcock.wordpress.com/2013/02/06/googles-bigquery-vs-hadoop-complimentors-or-competitors/ 
http://googlecloudplatform.blogspot.com.br/2014/04/google-bigquery-and-datastore-connectors-for-hadoop.html 
http://gigaom.com/2012/07/07/why-the-days-are-numbered-for-hadoop-as-we-know-it/ 
http://cloudacademy.com/blog/when-to-use-google-bigquery/ 
http://www.megapivot.com/blog/posts/redshift-vs-bigquery-vs-hadoop.html 
http://courses.cs.washington.edu/courses/cse544/13sp/final-projects/p18-lijl.pdf

Más contenido relacionado

Destacado

Projeto silvano. versao 13
Projeto silvano. versao 13Projeto silvano. versao 13
Projeto silvano. versao 13Siouxiesiouxie
 
Morphex Praesentation Fertig Laeuft Automatisch
Morphex Praesentation Fertig Laeuft AutomatischMorphex Praesentation Fertig Laeuft Automatisch
Morphex Praesentation Fertig Laeuft Automatischguest8bc220a
 
Carta aberta do Seminário "As Mulheres e a Reforma Política"
Carta aberta do Seminário "As Mulheres e a Reforma Política"Carta aberta do Seminário "As Mulheres e a Reforma Política"
Carta aberta do Seminário "As Mulheres e a Reforma Política"Luiza Erundina
 
Rough video plan
Rough video planRough video plan
Rough video planlaurensj12
 
Google BigQuery - Introdução
Google BigQuery - IntroduçãoGoogle BigQuery - Introdução
Google BigQuery - IntroduçãoJose Papo, MSc
 

Destacado (7)

Projeto silvano. versao 13
Projeto silvano. versao 13Projeto silvano. versao 13
Projeto silvano. versao 13
 
Morphex Praesentation Fertig Laeuft Automatisch
Morphex Praesentation Fertig Laeuft AutomatischMorphex Praesentation Fertig Laeuft Automatisch
Morphex Praesentation Fertig Laeuft Automatisch
 
Carta aberta do Seminário "As Mulheres e a Reforma Política"
Carta aberta do Seminário "As Mulheres e a Reforma Política"Carta aberta do Seminário "As Mulheres e a Reforma Política"
Carta aberta do Seminário "As Mulheres e a Reforma Política"
 
VEBIMOBE
VEBIMOBEVEBIMOBE
VEBIMOBE
 
Rough video plan
Rough video planRough video plan
Rough video plan
 
Slid soud
Slid soudSlid soud
Slid soud
 
Google BigQuery - Introdução
Google BigQuery - IntroduçãoGoogle BigQuery - Introdução
Google BigQuery - Introdução
 

Similar a Rastreador de vagas - Solução BigQuery

TDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataTDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataEduardo Hahn
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCRenan Moreira de Oliveira
 
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigDataDataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigDataEduardo Hahn
 
Big Data, Performance, Posix, RTB no mercado de publicidade online
Big Data, Performance, Posix, RTB no mercado de publicidade onlineBig Data, Performance, Posix, RTB no mercado de publicidade online
Big Data, Performance, Posix, RTB no mercado de publicidade onlineTiago Peczenyj
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 
Matando web forms e modernizando um grande varejista
Matando web forms e modernizando um grande varejistaMatando web forms e modernizando um grande varejista
Matando web forms e modernizando um grande varejistaJosé Roberto Araújo
 
Pangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformPangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformAndré Paulovich
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...
CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...
CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...PGDay Campinas
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 
Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Raul Oliveira
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroMarco Garcia
 
Visão Geral De Desenvolvimento Web Sre 2012
Visão Geral De Desenvolvimento Web   Sre 2012Visão Geral De Desenvolvimento Web   Sre 2012
Visão Geral De Desenvolvimento Web Sre 2012Carlos Casalicchio
 
Map reduce novas abordagens para o processo de datamining em grandes volumn...
Map reduce   novas abordagens para o processo de datamining em grandes volumn...Map reduce   novas abordagens para o processo de datamining em grandes volumn...
Map reduce novas abordagens para o processo de datamining em grandes volumn...João Gabriel Lima
 
O framework de big data para inteligência de marketing dinâmica
O framework de big data para inteligência de marketing dinâmicaO framework de big data para inteligência de marketing dinâmica
O framework de big data para inteligência de marketing dinâmicaGabriel Peixe
 

Similar a Rastreador de vagas - Solução BigQuery (20)

TDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataTDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big Data
 
BigData MapReduce
BigData MapReduceBigData MapReduce
BigData MapReduce
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDC
 
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigDataDataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
 
Big Data, Performance, Posix, RTB no mercado de publicidade online
Big Data, Performance, Posix, RTB no mercado de publicidade onlineBig Data, Performance, Posix, RTB no mercado de publicidade online
Big Data, Performance, Posix, RTB no mercado de publicidade online
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 
Matando web forms e modernizando um grande varejista
Matando web forms e modernizando um grande varejistaMatando web forms e modernizando um grande varejista
Matando web forms e modernizando um grande varejista
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
Pangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformPangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud Platform
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...
CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...
CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near...
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado Financeiro
 
Visão Geral De Desenvolvimento Web Sre 2012
Visão Geral De Desenvolvimento Web   Sre 2012Visão Geral De Desenvolvimento Web   Sre 2012
Visão Geral De Desenvolvimento Web Sre 2012
 
Inquesti - Plataformas de BI
Inquesti - Plataformas de BIInquesti - Plataformas de BI
Inquesti - Plataformas de BI
 
Map reduce novas abordagens para o processo de datamining em grandes volumn...
Map reduce   novas abordagens para o processo de datamining em grandes volumn...Map reduce   novas abordagens para o processo de datamining em grandes volumn...
Map reduce novas abordagens para o processo de datamining em grandes volumn...
 
O framework de big data para inteligência de marketing dinâmica
O framework de big data para inteligência de marketing dinâmicaO framework de big data para inteligência de marketing dinâmica
O framework de big data para inteligência de marketing dinâmica
 

Más de Francke Peixoto

RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII
RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII
RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII Francke Peixoto
 
Resultado da pesquisa: O uso de informações para análise Fundos Imobiliários
Resultado da pesquisa: O uso de informações para análise  Fundos ImobiliáriosResultado da pesquisa: O uso de informações para análise  Fundos Imobiliários
Resultado da pesquisa: O uso de informações para análise Fundos ImobiliáriosFrancke Peixoto
 
Smp sistema de manutenção planejada
Smp sistema de manutenção planejadaSmp sistema de manutenção planejada
Smp sistema de manutenção planejadaFrancke Peixoto
 
Desenvolvimento Ágil de Software
Desenvolvimento Ágil de SoftwareDesenvolvimento Ágil de Software
Desenvolvimento Ágil de SoftwareFrancke Peixoto
 
Mapeamento Objeto-Relacional com LINQ
Mapeamento Objeto-Relacional com LINQ Mapeamento Objeto-Relacional com LINQ
Mapeamento Objeto-Relacional com LINQ Francke Peixoto
 
Javascript - boas práticas
Javascript - boas práticasJavascript - boas práticas
Javascript - boas práticasFrancke Peixoto
 

Más de Francke Peixoto (8)

RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII
RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII
RESULTADO DA PESQUISA SOBRE OS FIIS FAVORITOS DOS USUÁRIOS DO GRUPO FALA FII
 
Resultado da pesquisa: O uso de informações para análise Fundos Imobiliários
Resultado da pesquisa: O uso de informações para análise  Fundos ImobiliáriosResultado da pesquisa: O uso de informações para análise  Fundos Imobiliários
Resultado da pesquisa: O uso de informações para análise Fundos Imobiliários
 
Smp sistema de manutenção planejada
Smp sistema de manutenção planejadaSmp sistema de manutenção planejada
Smp sistema de manutenção planejada
 
Desenvolvimento Ágil de Software
Desenvolvimento Ágil de SoftwareDesenvolvimento Ágil de Software
Desenvolvimento Ágil de Software
 
Groupware
GroupwareGroupware
Groupware
 
Rede Social
Rede SocialRede Social
Rede Social
 
Mapeamento Objeto-Relacional com LINQ
Mapeamento Objeto-Relacional com LINQ Mapeamento Objeto-Relacional com LINQ
Mapeamento Objeto-Relacional com LINQ
 
Javascript - boas práticas
Javascript - boas práticasJavascript - boas práticas
Javascript - boas práticas
 

Rastreador de vagas - Solução BigQuery

  • 1. Rastreador de vagas disponíveis na Web Davi Amaral (CEO) Felipe Pinto Bruno Pedrosa Francke Peixoto Thiago Dias Ricardo Gomes
  • 2. Rastreador de vagas disponíveis na Web Cenário Um analista de sistemas da JOIN US, em seu momento de ócio, desenvolveu um rastreador que procura por publicação de vagas na web. Como analisar esses dados de forma simples, barata é rápida? O WebCrawler desenvolvido por Felipe Pinto, gera por mês em média 50 milhões de linhas. Dados oriundos de navegação em redes sociais, grupos de e-mails e fóruns.
  • 3. Rastreador de vagas disponíveis na Web Solução proposta O que é ? É uma solução em nuvem (cloud) para entregar Big Data SaaS. Pague pelo que usar. O Google BigQuery é uma solução Big Data, como o Hadoop, com a vantagem de não se precisar contratar e/ou comprar uma série de servidores, nem, contar com mão-de-obra, altamente, especializada.
  • 4. Rastreador de vagas disponíveis na Web Porque o Google BigQuery? Demonstração 1gb grátis para armazenamento 5Gb grátis por 12 meses Ferramenta é Livre Preço $ 0,025/mês por Gb + $5,00 por Tb processado $84/mês por Tb Desvantagem de se precisar contratar e/ou comprar uma série de servidores, contar com mão-de-obra, altamente, especializada. Deixando seus custos menos controláveis. Manutenção $0 $0
  • 5. Rastreador de vagas disponíveis na Web Comparativo Por que o BigQuery é muito mais rápido do que o Hadoop? Muito difícil. Para ganhar performance escalar, o Hadoop depende de caixas (servidores). Enquanto a maioria dos clusters de Hadoop que tenho visto no Brasil, vão de 4 a 10 servidores (alguns casos com até 40 servidores, mas, a maioria fica abaixo de 10) e isso é muito custo $$$. No BigQuery as aplicações já nascem grande. Seus dados são replicados para dezenas de servidores. Assim como, uma andorinha não faz verão, meia dúzia de servidores Hadoop também não. Então, comparar a performance do BigQuery com um “clusterzinho” de Hadoop não é uma comparação das mais justas.
  • 6. Rastreador de vagas disponíveis na Web Comparativo Obter informações a respeito da performance de processamento com TPCTransaction Processing Performance Council O TPC é uma organização sem fins lucrativos, tendo como objetivo principal estabelecer critérios para se obter informações a respeito da performance de processamento de transações e de banco de dados através de benchmarks. Baseia-se em testes padronizados tais como o TPC-C, o TPC-W e o TPC-H para obter tais resultados e só assim divulgar os dados reais dessa performance. Estes testes do TPC seguem normas extremamente rigorosas que testam diversos pontos do sistema - principalmente nos quesitos confiabilidade e durabilidade. TPC-H Simulam um ambiente de Data Warehouse, sincronizado com bancos de dados de produção online. Este benchmark se utiliza de consultas aleatórias de alto grau de complexidade, projetadas para responder a algumas questões de negócios do mundo real, como: perguntas sobre pré e promoções, oferta e demanda, lucro e receita e participação de mercado.
  • 7. Rastreador de vagas disponíveis na Web Comparativo Tempo de execução de consulta por segundos.
  • 8. Rastreador de vagas disponíveis na Web Conclusão da Analise Para TPC-H Query (massively parallelizable) Vemos que BigQuery supera claramente RedShift (com um nó, bem como 8 nós). Mesmo o desempenho do cache hot do RedShift é inferior ao BigQuery. Este é provavelmente porque o BigQuery utiliza servidores proporcionais para resolver a consulta massivas com um alto grau de paralelismo mediante ao tamanho do DataSet. Para esse projeto a solução mais viável é o Entre as soluções apresentadas ela é mais economicamente viável, e não apresenta custo de mão de obra para manutenção dos servidores.
  • 9. Rastreador de vagas disponíveis na Web Nem tudo são flores... O BigQuery não é um banco de dados relacional tradicional! Ele continua sendo um Big Data, em toda sua amplitude: Dados não estruturados (embora apresente-os como tabelas), NoSQL (embora tenha uma linguagem, própria, SQL “like”), não é possível criar índices, não é possível modificar os dados (updates or deletes). Ele é um sistema, puramente, OLAP. A importação e/ou cópia dos dados para a nuvem é uma tarefa árdua, demorada, chata e nada inteligente. Se algo dá errado em algum arquivo, as coisas ficam, realmente, pretas.
  • 10. Rastreador de vagas disponíveis na Web Fontes http://bighadoop.wordpress.com/2012/05/13/google-bigquery/ https://cloud.google.com/developers/articles/getting-started-with-google-bigquery?hl=pt-br http://computerworld.com.br/tecnologia/2013/01/25/os-10-melhores-provedores-de-armazenamento-na-nuvem-segundo-o-gartner/ http://www.fam2011.com.br/site/revista/pdf/ed10/art04.pdf http://bighadoop.wordpress.com/2012/05/13/google-bigquery/ http://news.dice.com/2013/04/15/googles-bigquery-vs-hadoop-a-matchup-2/ http://gavinbadcock.wordpress.com/2013/02/06/googles-bigquery-vs-hadoop-complimentors-or-competitors/ http://googlecloudplatform.blogspot.com.br/2014/04/google-bigquery-and-datastore-connectors-for-hadoop.html http://gigaom.com/2012/07/07/why-the-days-are-numbered-for-hadoop-as-we-know-it/ http://cloudacademy.com/blog/when-to-use-google-bigquery/ http://www.megapivot.com/blog/posts/redshift-vs-bigquery-vs-hadoop.html http://courses.cs.washington.edu/courses/cse544/13sp/final-projects/p18-lijl.pdf