SlideShare una empresa de Scribd logo
1 de 2
Artículo: Introduciendo el Big Data.                                                       15/3/2013
                                       walterfarah@yahoo.com

                                           El “Big Data”

                                                                             Walter Farah Calderón


Las primeras décadas del siglo XXI muestran que una de sus características dominantes es la
generación, procesamiento y disponibilidad de grandes volúmenes de datos y, en consecuencia,
de las Supercomputadoras que, a diferencia de una red que incluye servidores dispersos en
distintos lugares, los concentra en un solo lugar. Watson, una de las más reconocidas, agrupa no
menos de 90 de ellos.

Pero además, supercomputadoras, porque por sus características físicas y lógicas superan en
mucho las tecnologías actuales, “anticuadas y arraigadas en los sistemas informáticos y
tecnologías desarrolladas en la década de 1970”, como la caracteriza Sam Madden, profesor de
The Computer Science and Artificial Intelligence Laboratory (CSAIL) del MIT.

Para representar fácil y rápidamente el rendimiento de una supercomputadora los expertos
recurren a su particular notación científica, los FLOPS (“floating point operations per second”), es
decir, la cantidad de operaciones que procesa por segundo, por lo que hablamos de teras y petas,
es decir, respectivamente, de al menos un billón y mil billones de operaciones por segundo. El
siguiente paso, el grail santo de la supercomputación actual, al decir de Clay Dillow, sería una
máquina con capacidad exaflop, es decir, que pueda ejecutar un trillón de operaciones por
segundo, 100 veces más que la mayor velocidad actual. INTEL anunció que llegará a esa meta en el
2018, con el desarrollo de su familia de chips, IXeon Phi.

En función de la capacidad de procesamiento, se genera el TOP500, una lista que incluye a las 500
supercomputadoras más veloces, actualizada dos veces al año. A noviembre de 2012, última
disponible, 5 de los 10 primeros puestos de la lista son ocupados por supercomputadoras de
Estados Unidos, Alemania con 2 y una cada uno, Japón, China e Italia. Domina IBM con 6 de las 10
primeras, con presencia en tres países diferentes: Estados Unidos, Alemania e Italia.

Sin embargo, a pesar del énfasis en la capacidad de procesamiento, hoy día las
supercomputadoras empiezan a ser valoradas con mayor complejidad y el término empieza a ser
sustituido por el de “Computación de Alto Rendimiento” (HPC); “Cluster de Computadoras de Alto
Rendimiento” (HPCC); “Computación Acelerada” como la llama Cray Inc. o el “Big Data”, como le
gusta utilizar a la mayoría, conceptos mucho más comprensivos que la identificación tradicional de
la supercomputación con la súper velocidad de procesamiento.

La National Science Foundation caracteriza el Big Data como “large, diverse, complex, longitudinal,
and/or distributed data sets”. El IBM Institute for Business Value y la Saïd Business School de
University of Oxford, introducen el concepto de las “4 V del BD”: volumen, velocidad, variedad, y
veracidad. Variedad, es decir, la complejidad de integrar la gestión de diferentes fuentes y tipos de
datos, incluyendo estructurados, semiestructurados y no estructurados, para su disposición en
múltiples formatos. Veracidad, que refiere al nivel de fiabilidad asociado con los datos y la
disminución de la incertidumbre.




                                                 1
Artículo: Introduciendo el Big Data.                                                     15/3/2013
                                       walterfarah@yahoo.com

Otros empiezan a fijarse en el costo energético asociado a su uso y por ello, frente al TOP500, se
consolida la lista Green500, que reordena los datos de aquella, de acuerdo a cuántos cálculos
obtiene por vatio de electricidad.

Para noviembre de 2012, los tres primeros en el TOP500 lo son Titán, de Cray Inc.; Sequoia Blue
Geen de IBM y la K Computer de la japonesa Fujitsu. Para igualar lo que procesan los 16.3 petas de
Sequoia, en un día se necesitarían 120 billones de personas con 120 billones de calculadoras,
durante 50 años. Titán, del U.S. Department of Energy’s (DOE), en manos del Oak Ridge National
Laboratory (ORNL), el supercomputador de mayor rendimiento, inaugurado en octubre de 2012,
llega a 17.89 petas. En el Green500, por el contrario, figuran Beacon de Appro, SANAM de ADtech
y Titán de Cray Inc., quien no solo es primera en procesamiento sino tercera en eficiencia
energética.

Una mayor cantidad de fuentes de datos y el desarrollo de fuentes digitales que permiten su
recolección en tiempo real, como instrumentos, sensores, transacciones de internet, entre otras
muchas, impulsan al sector del Big Data. De acuerdo a cifras de IBM, el 90% de los datos en el
mundo se ha creado en los últimos dos años y hoy, todos los días, se crean 2.5 quintillones de
bytes de datos.

Más de 900 millones de usuarios de Facebook registrados generan más de 1500 actualizaciones de
estado cada segundo de sus intereses y su paradero. En 2011, la plataforma de comercio
electrónico eBay, recolectó datos sobre más de 100 millones de usuarios activos, incluyendo los 6
millones de nuevos bienes que se ofrecen todos los días. Cuando el 14 de febrero del 2013, cerró
sus puertas tras tres años de operación para una etapa de mantenimiento y renovación de
equipos, el Large Hadron Collider (LHC), que hizo posible el descubrimiento de la Partícula de
Higgs, entre la frontera de Suiza y Francia, había logrado acumular 100 petaflops de datos, dos
veces una biblioteca colectiva que incluiría cada palabra escrita de todas las lenguas, más o menos
el equivalente a 700 años de películas HD de plena calidad o mil veces todo el texto disponible en
la Biblioteca del Congreso de los Estados Unidos. El “Correlator”, la supercomputadora del Radio
Telescopio ALMA que en pleno funcionamiento capturará señales del radioespectro espacial,
actuará como un único receptor diseñado para correlacionar las señales débiles de múltiples
fuentes (de ahí el nombre con que es conocida), capaz de realizar 17 petas de operaciones por
segundo.

Pero su generación no es exclusiva de internet o la investigación científica; baste pensar en
empresas de exploración geológica, aeroportuarias, transacciones financieras o de
telecomunicaciones, entre otras. Y su crecimiento no se detiene, porque las posibilidades son
infinitas, impulsadas por dispositivos móviles como teléfonos y autos. En 2011, había 780 millones
teléfonos inteligentes en todo el mundo capaces de recoger y transmitir datos de geo-localización,
lo que generó más de 600 petas de datos cada mes. Se estima que el tráfico global de datos
generados por las comunicaciones móviles se duplicará cada año hasta llegar a 11 exabytes por
mes en 2016.

Y con ello una Nube que se expande, una Computación Cuántica que sigue madurando y,
esperando, lo que llaman, Google entre otros, el “Deep Learning”, el “Aprendizaje Profundo”.




                                                2

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

tecnologia
tecnologiatecnologia
tecnologia
 
La web en 2014. Algunas tendencias de futuro
La web en 2014. Algunas tendencias de futuroLa web en 2014. Algunas tendencias de futuro
La web en 2014. Algunas tendencias de futuro
 
Las nuevas fronteras
Las nuevas fronterasLas nuevas fronteras
Las nuevas fronteras
 
Caso Google
Caso GoogleCaso Google
Caso Google
 
Big data
Big data Big data
Big data
 
1048
10481048
1048
 
Ensayo de la platica de Jobs y Gates
Ensayo de la platica de Jobs y GatesEnsayo de la platica de Jobs y Gates
Ensayo de la platica de Jobs y Gates
 
La internet
La internetLa internet
La internet
 
Internet de las cosas
Internet de las cosasInternet de las cosas
Internet de las cosas
 
Centros de datos co2
Centros de datos co2Centros de datos co2
Centros de datos co2
 
10 tecnologías que van a cambiar el mundo
10 tecnologías que van a cambiar el mundo 10 tecnologías que van a cambiar el mundo
10 tecnologías que van a cambiar el mundo
 
Generaciones de la computadora
Generaciones de la computadoraGeneraciones de la computadora
Generaciones de la computadora
 
Ensayo
EnsayoEnsayo
Ensayo
 
Generaciones de la computadora 1 (1)
Generaciones de la computadora 1 (1)Generaciones de la computadora 1 (1)
Generaciones de la computadora 1 (1)
 
Gloria Ambas
Gloria AmbasGloria Ambas
Gloria Ambas
 
GENERACION DE LA COMPUTADORAS
GENERACION DE LA COMPUTADORASGENERACION DE LA COMPUTADORAS
GENERACION DE LA COMPUTADORAS
 
Camino al futuro-Bill gates diapositivas
Camino al futuro-Bill gates diapositivasCamino al futuro-Bill gates diapositivas
Camino al futuro-Bill gates diapositivas
 
Generacion de computadoras
Generacion de computadorasGeneracion de computadoras
Generacion de computadoras
 
Personajes de la informatica
Personajes de la informaticaPersonajes de la informatica
Personajes de la informatica
 
El impacto de la economía digital en la profesión contable
El impacto de la economía digital en la profesión contableEl impacto de la economía digital en la profesión contable
El impacto de la economía digital en la profesión contable
 

Destacado

Fisher frey -_text_dependent_questions_-_april_2012
Fisher frey -_text_dependent_questions_-_april_2012Fisher frey -_text_dependent_questions_-_april_2012
Fisher frey -_text_dependent_questions_-_april_2012groningerk
 
Ciencia y sociedad los problemas de la comunicación
Ciencia y sociedad los problemas de la comunicaciónCiencia y sociedad los problemas de la comunicación
Ciencia y sociedad los problemas de la comunicaciónwalterfarah
 

Destacado (6)

90 Minute MBA
90 Minute MBA90 Minute MBA
90 Minute MBA
 
μουσικη
μουσικημουσικη
μουσικη
 
Fisher frey -_text_dependent_questions_-_april_2012
Fisher frey -_text_dependent_questions_-_april_2012Fisher frey -_text_dependent_questions_-_april_2012
Fisher frey -_text_dependent_questions_-_april_2012
 
2 aula eleit tecn
2 aula eleit tecn2 aula eleit tecn
2 aula eleit tecn
 
Ciencia y sociedad los problemas de la comunicación
Ciencia y sociedad los problemas de la comunicaciónCiencia y sociedad los problemas de la comunicación
Ciencia y sociedad los problemas de la comunicación
 
WhenThe Going Gets Tough
WhenThe Going Gets ToughWhenThe Going Gets Tough
WhenThe Going Gets Tough
 

Similar a Introduciéndose en el sector del Big Data

Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsghramirez290
 
Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsgvbalaguera
 
Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsgJorge M. Gil
 
Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsgmantruvic
 
La super computadora luisa bernal
La super computadora luisa bernalLa super computadora luisa bernal
La super computadora luisa bernalEmil Ojeda Vergara
 
La revolución de los datos: sensores e Internet de las Cosas
La revolución de los datos: sensores e Internet de las CosasLa revolución de los datos: sensores e Internet de las Cosas
La revolución de los datos: sensores e Internet de las CosasSoraya Paniagua
 
25 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 2015
25 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 201525 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 2015
25 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 2015AURORA1968
 
Internet of things
Internet of thingsInternet of things
Internet of thingsjoshdan06
 
Avances tecnologicos del Mundo
Avances tecnologicos del MundoAvances tecnologicos del Mundo
Avances tecnologicos del MundoSimon Quispe Sosa
 
Evolucion de la informatica y
Evolucion de la informatica yEvolucion de la informatica y
Evolucion de la informatica yjesisacris
 
Documentos
DocumentosDocumentos
Documentos190482
 
Generación del computador
Generación del computadorGeneración del computador
Generación del computadorrafaelgif
 

Similar a Introduciéndose en el sector del Big Data (20)

Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsg
 
Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsg
 
Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsg
 
Internet of-things-iot-ibsg
Internet of-things-iot-ibsgInternet of-things-iot-ibsg
Internet of-things-iot-ibsg
 
La super computadora luisa bernal
La super computadora luisa bernalLa super computadora luisa bernal
La super computadora luisa bernal
 
La revolución de los datos: sensores e Internet de las Cosas
La revolución de los datos: sensores e Internet de las CosasLa revolución de los datos: sensores e Internet de las Cosas
La revolución de los datos: sensores e Internet de las Cosas
 
Reseña Historica.pptx
Reseña Historica.pptxReseña Historica.pptx
Reseña Historica.pptx
 
Linea de Tiempo Big Data
Linea de Tiempo Big DataLinea de Tiempo Big Data
Linea de Tiempo Big Data
 
25 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 2015
25 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 201525 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 2015
25 NUEVAS TECNOLOGIAS QUE TRIUNFARAN EN EL 2015
 
Internet of things
Internet of thingsInternet of things
Internet of things
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Avances tecnologicos del Mundo
Avances tecnologicos del MundoAvances tecnologicos del Mundo
Avances tecnologicos del Mundo
 
Sebastian
SebastianSebastian
Sebastian
 
Evolucion de la informatica y
Evolucion de la informatica yEvolucion de la informatica y
Evolucion de la informatica y
 
Documentos
DocumentosDocumentos
Documentos
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
La linea del tiempo.
La linea del tiempo.La linea del tiempo.
La linea del tiempo.
 
Proyecto informativo
Proyecto informativoProyecto informativo
Proyecto informativo
 
Proyecto informativo
Proyecto informativoProyecto informativo
Proyecto informativo
 
Generación del computador
Generación del computadorGeneración del computador
Generación del computador
 

Último

Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 

Último (13)

Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 

Introduciéndose en el sector del Big Data

  • 1. Artículo: Introduciendo el Big Data. 15/3/2013 walterfarah@yahoo.com El “Big Data” Walter Farah Calderón Las primeras décadas del siglo XXI muestran que una de sus características dominantes es la generación, procesamiento y disponibilidad de grandes volúmenes de datos y, en consecuencia, de las Supercomputadoras que, a diferencia de una red que incluye servidores dispersos en distintos lugares, los concentra en un solo lugar. Watson, una de las más reconocidas, agrupa no menos de 90 de ellos. Pero además, supercomputadoras, porque por sus características físicas y lógicas superan en mucho las tecnologías actuales, “anticuadas y arraigadas en los sistemas informáticos y tecnologías desarrolladas en la década de 1970”, como la caracteriza Sam Madden, profesor de The Computer Science and Artificial Intelligence Laboratory (CSAIL) del MIT. Para representar fácil y rápidamente el rendimiento de una supercomputadora los expertos recurren a su particular notación científica, los FLOPS (“floating point operations per second”), es decir, la cantidad de operaciones que procesa por segundo, por lo que hablamos de teras y petas, es decir, respectivamente, de al menos un billón y mil billones de operaciones por segundo. El siguiente paso, el grail santo de la supercomputación actual, al decir de Clay Dillow, sería una máquina con capacidad exaflop, es decir, que pueda ejecutar un trillón de operaciones por segundo, 100 veces más que la mayor velocidad actual. INTEL anunció que llegará a esa meta en el 2018, con el desarrollo de su familia de chips, IXeon Phi. En función de la capacidad de procesamiento, se genera el TOP500, una lista que incluye a las 500 supercomputadoras más veloces, actualizada dos veces al año. A noviembre de 2012, última disponible, 5 de los 10 primeros puestos de la lista son ocupados por supercomputadoras de Estados Unidos, Alemania con 2 y una cada uno, Japón, China e Italia. Domina IBM con 6 de las 10 primeras, con presencia en tres países diferentes: Estados Unidos, Alemania e Italia. Sin embargo, a pesar del énfasis en la capacidad de procesamiento, hoy día las supercomputadoras empiezan a ser valoradas con mayor complejidad y el término empieza a ser sustituido por el de “Computación de Alto Rendimiento” (HPC); “Cluster de Computadoras de Alto Rendimiento” (HPCC); “Computación Acelerada” como la llama Cray Inc. o el “Big Data”, como le gusta utilizar a la mayoría, conceptos mucho más comprensivos que la identificación tradicional de la supercomputación con la súper velocidad de procesamiento. La National Science Foundation caracteriza el Big Data como “large, diverse, complex, longitudinal, and/or distributed data sets”. El IBM Institute for Business Value y la Saïd Business School de University of Oxford, introducen el concepto de las “4 V del BD”: volumen, velocidad, variedad, y veracidad. Variedad, es decir, la complejidad de integrar la gestión de diferentes fuentes y tipos de datos, incluyendo estructurados, semiestructurados y no estructurados, para su disposición en múltiples formatos. Veracidad, que refiere al nivel de fiabilidad asociado con los datos y la disminución de la incertidumbre. 1
  • 2. Artículo: Introduciendo el Big Data. 15/3/2013 walterfarah@yahoo.com Otros empiezan a fijarse en el costo energético asociado a su uso y por ello, frente al TOP500, se consolida la lista Green500, que reordena los datos de aquella, de acuerdo a cuántos cálculos obtiene por vatio de electricidad. Para noviembre de 2012, los tres primeros en el TOP500 lo son Titán, de Cray Inc.; Sequoia Blue Geen de IBM y la K Computer de la japonesa Fujitsu. Para igualar lo que procesan los 16.3 petas de Sequoia, en un día se necesitarían 120 billones de personas con 120 billones de calculadoras, durante 50 años. Titán, del U.S. Department of Energy’s (DOE), en manos del Oak Ridge National Laboratory (ORNL), el supercomputador de mayor rendimiento, inaugurado en octubre de 2012, llega a 17.89 petas. En el Green500, por el contrario, figuran Beacon de Appro, SANAM de ADtech y Titán de Cray Inc., quien no solo es primera en procesamiento sino tercera en eficiencia energética. Una mayor cantidad de fuentes de datos y el desarrollo de fuentes digitales que permiten su recolección en tiempo real, como instrumentos, sensores, transacciones de internet, entre otras muchas, impulsan al sector del Big Data. De acuerdo a cifras de IBM, el 90% de los datos en el mundo se ha creado en los últimos dos años y hoy, todos los días, se crean 2.5 quintillones de bytes de datos. Más de 900 millones de usuarios de Facebook registrados generan más de 1500 actualizaciones de estado cada segundo de sus intereses y su paradero. En 2011, la plataforma de comercio electrónico eBay, recolectó datos sobre más de 100 millones de usuarios activos, incluyendo los 6 millones de nuevos bienes que se ofrecen todos los días. Cuando el 14 de febrero del 2013, cerró sus puertas tras tres años de operación para una etapa de mantenimiento y renovación de equipos, el Large Hadron Collider (LHC), que hizo posible el descubrimiento de la Partícula de Higgs, entre la frontera de Suiza y Francia, había logrado acumular 100 petaflops de datos, dos veces una biblioteca colectiva que incluiría cada palabra escrita de todas las lenguas, más o menos el equivalente a 700 años de películas HD de plena calidad o mil veces todo el texto disponible en la Biblioteca del Congreso de los Estados Unidos. El “Correlator”, la supercomputadora del Radio Telescopio ALMA que en pleno funcionamiento capturará señales del radioespectro espacial, actuará como un único receptor diseñado para correlacionar las señales débiles de múltiples fuentes (de ahí el nombre con que es conocida), capaz de realizar 17 petas de operaciones por segundo. Pero su generación no es exclusiva de internet o la investigación científica; baste pensar en empresas de exploración geológica, aeroportuarias, transacciones financieras o de telecomunicaciones, entre otras. Y su crecimiento no se detiene, porque las posibilidades son infinitas, impulsadas por dispositivos móviles como teléfonos y autos. En 2011, había 780 millones teléfonos inteligentes en todo el mundo capaces de recoger y transmitir datos de geo-localización, lo que generó más de 600 petas de datos cada mes. Se estima que el tráfico global de datos generados por las comunicaciones móviles se duplicará cada año hasta llegar a 11 exabytes por mes en 2016. Y con ello una Nube que se expande, una Computación Cuántica que sigue madurando y, esperando, lo que llaman, Google entre otros, el “Deep Learning”, el “Aprendizaje Profundo”. 2