1. Tecnológico De Estudios Superiores De
Jocotitlán
Ingeniería En Sistemas Computacionales
Materia: Sistemas Distribuidos
Docente: M. En T.C Juan Alberto Antonio
Velázquez
Integrantes:
Dulce Banelly Becerril Jiménez
Alejandra Galindo Serrano
Suriday García Cardoso
Grisel Miranda Piña
Susana Sotelo Vázquez
Grupo: ISC-802
Turno: Discontinuo
2. Es un servicio de consultas interactivo que
facilita el análisis de datos en Amazon S3 con
SQL estándar, no tiene servidor, de manera que
no es necesario administrar infraestructura y
solo paga por las consultas que ejecuta. Se
integra con el catálogo de datos de AWS Glue,
lo que le permite crear un repositorio de
metadatos unificado en diversos servicios,
rastrear orígenes de datos para descubrir
esquemas y completar su catálogo con
definiciones de particiones y tablas nuevas y
modificadas, y mantener el control de las
versiones de los esquemas.
Realiza consultas al instante: las
realiza con rapidez sin tener que
configurar ni administrar servidores ni
almacenes de datos.
Pago por consulta: solo paga por las
consultas que se ejecuten.
Abierto, potente, estándar: admite una
variedad de formatos de datos estándar,
incluidos CSV, JSON, ORC, Avro y Parquet.
Rápido.
Características
❖ Sin servidor, sin infraestructura, sin administrador.
❖ Fácil de comenzar.
❖ Consultas sencillas con SQL estándar.
❖ Pago por consulta, rendimiento ágil.
❖ Alta disponibilidad y durabilidad.
❖ Seguridad, integración.
❖ Aprendizaje automático.
Es un servicio administrado en la nube de AWS que facilita la configuración, la
administración y el escalado rentables de una solución de búsqueda para su sitio web
o aplicación. Soporta 34 idiomas y características de búsqueda populares, como
resaltar, autocompletar y la búsqueda geoespacial.
• Simplicidad: Puede configurar y administrar un dominio de Amazon CloudSearch por
medio de la consola de administración de AWS.
• Escalabilidad: puede aumentar o reducir los recursos de su dominio de búsqueda
según sea necesario.
• Fiabilidad: ofrece características de monitoreo y recuperación automáticas de
sus dominios de búsqueda.
• Seguridad: utiliza sólidos métodos criptográficos para autenticar a los usuarios
e impedir el acceso no autorizado a los dominios.
• Alto rendimiento.
• Completamente administrado.
• Rentabilidad.
3. Es un servicio administrado que facilita la
implementación, la protección y la ejecución
de Elasticsearch. Puede crear y monitorear las
aplicaciones proporciona compatibilidad con
las API de código abierto de Elasticsearch.
Beneficios
• Implementación y administración
sencilla: El servicio simplifica las
tareas de administración.
• Nivel alto de escalabilidad y
disponibilidad: es posible almacenar
hasta 3 PB de datos en un solo clúster,
lo que le permite ejecutar grandes cargas
de trabajo de análisis de registros.
• Alto nivel de seguridad.
• Rentabilidad.
Casos de uso
• Monitoreo de aplicaciones: Almacena y analiza
los datos de registro de las aplicaciones y de la
infraestructura a fin de detectar y solucionar los
problemas en menos tiempo.
• Información de seguridad y administración de
eventos: Centraliza y analiza los registros
provenientes de aplicaciones y sistemas diferentes
de su red con el fin de detectar las amenazas y de
administrar los incidentes en tiempo real.
• Búsqueda: Brinda una experiencia de búsqueda
rápida y personalizada para sus aplicaciones.
• Monitoreo de Infraestructura: Recopile
registros y métricas de los servidores, los
enrutadores, los conmutadores y las máquinas
virtualizadas.
Es la plataforma para big data en la nube líder en
la industria destinada al procesamiento de grandes
volúmenes de datos mediante el uso de herramientas
de código abierto. Puede ejecutar análisis a escala
de petabytes a menos de la mitad del costo de las
soluciones locales tradicionales y con una
velocidad 3 veces superior, puede iniciar y
finalizar clústeres y pagar por segundo en función
de las instancias utilizadas.
Facilidad de uso: Simplifica la
creación y la operación de entornos y
aplicaciones de big data.
Elasticidad: Permite aprovisionar con
rapidez y facilidad toda la capacidad
que se necesite, agregarla o eliminarla
de forma automática o manual.
Bajo Costo.
Almacenes de datos Flexibles.
Características
Aprendizaje automático: Use las herramientas de aprendizaje automático integradas de EMR, como
Apache Spark MLlib, TensorFlow y Apache MXNet.
Extracción, transformación y carga (ETL): Se puede utilizar para realizar de forma rápida y rentable
cargas de trabajo de transformación de datos.
Análisis de secuencias de clics: Con Apache Spark y Apache Hive para segmentar a los usuarios.
Análisis interactivo: ofrece un entorno analítico de administración basado en Jupyter de código
abierto que permite que los científicos de datos, los analistas y los desarrolladores preparen y
visualicen los datos.
Casos de Uso
4. Facilita la recopilación, el procesamiento y el análisis de datos de streaming en tiempo
real para obtener datos de manera oportuna y reaccionar rápidamente ante información
nueva. Ofrece capacidades clave para procesar de manera rentable datos de streaming a
cualquier escala, además de la flexibilidad para elegir las herramientas más adecuadas
para los requisitos de su aplicación. Puede incorporar datos en tiempo real, permite
procesar y analizar datos a medida que se reciben y responder instantáneamente en vez de
tener que esperar a que los datos se recopilen antes de que el procesamiento pueda
comenzar.
Tiempo Real.
Completamente Administrado.
Escalabilidad.
Capacidades
Kinesis Video Streams: facilita la transmisión segura
de videos desde dispositivos conectados a AWS.
Kinesis Data Streams: es un servicio de streaming de
datos en tiempo real puede registrar de manera continua
gigabytes de datos por segundo de cientos de miles de
orígenes.
Kinesis Data Firehose: es la manera de registrar,
transformar y cargar transmisiones de datos en almacenes
de datos de AWS para realizar análisis casi en tiempo
real.
Kinesis Data Analytics: ofrece la manera más sencilla
de procesar transmisiones de datos en tiempo real con
SQL o Java sin tener que aprender a usar lenguajes de
programación.
Casos de uso
Cree aplicaciones de análisis de
videos: para transmitir videos de manera
segura desde dispositivos equipados.
Evolucione y pase del análisis en
lotes al análisis en tiempo real.
Cree aplicaciones de tiempo real.
Analizar datos de dispositivos IoT.
Es un servicio completamente administrado que
facilita la tarea de crear y ejecutar aplicaciones
que utilizan Apache Kafka para procesar datos de
streaming.
Apache Kafka es una plataforma de código abierto
para crear aplicaciones y canalizaciones de datos de
streaming con funcionamiento en tiempo real.
Amazon MSK facilita la creación y ejecución de
aplicaciones de producción en Apache Kafka sin que
sea necesario contar con experiencia en
administración de la infraestructura de dicha
plataforma.
Funcionamiento
➢ Totalmente compatible.
➢ Completamente administrado.
➢ Procesamiento elástico de
transmisiones.
➢ Alta disponibilidad.
➢ Alto nivel de seguridad.
Beneficios
5. Redshift respalda cargas de trabajo de
análisis de empresas emergentes, compañías
que conforman la lista Fortune 500 y todo
tipo de compañías intermedias. Compañías
como Lyft lograron crecer con Redshift y
pasar de ser empresas emergentes a empresas
valuadas en miles de millones de dólares.
Características
Nivel de integración máximo con lagos de
datos y servicios de AWS: permite trabajar de
forma rápida y simple con los datos en formatos
abiertos.
Mejor rendimiento: ofrece rendimiento ágil y
líder en el sector combinado con flexibilidad.
Escalabilidad máxima: es prácticamente
ilimitado.
Máximos beneficios: costos predecibles en
controles y opciones para pagar por consumo.
Fácil de administrar: automatiza tareas de
mantenimiento comunes para que pueda enfocarse
en la obtención de información a partir de sus
datos.
Seguridad y conformidad máximas: ofrece
seguridad para datos sin costo adicional.
Inteligencia Artificial: es posible
ejecutar consultas de alto rendimiento
en petabytes de datos estructurados de
forma simple y rentable.
Análisis operativo en eventos
empresariales: combine datos
estructurados de su almacén de datos y
datos semiestructurados para obtener
información operativa en tiempo real.
Es un servicio de inteligencia empresarial
rápido y basado en la nube que permite
proporcionar información a todos los integrantes
de su organización fácilmente.
Permite crear y publicar fácilmente paneles
interactivos que incluye información de
aprendizaje automático. Puede acceder a los
paneles desde cualquier dispositivo, e
integrarlos en las aplicaciones, portales y
sitios web.
Funcionamiento
Paga solo por lo que usas.
Precios de pago por sesión.
Escala a decenas de miles de usuarios.
Crea paneles predictivos.
Analítica embebida.
Soluciones de BI de extremo a extremo.
Quicksight mobile.
Casos de uso
Proporcione paneles interactivos:
permite proporcionar información a
todas las personas de su organización,
puede compartir paneles integrales e
interactivos con todos los usuarios.
Obtenga información de forma
instantánea y sin esfuerzo: ayuda a
los usuarios a descubrir tendencias
ocultas y valores atípicos,
identificar los impulsores clave de
negocio, proporcionar alertas
oportunas y realizar potentes análisis
y pronósticos hipotéticos, ahorrándole
días de investigación y análisis
manuales.
Mejore sus aplicaciones con los paneles de QuickSight:
permite integrar visualizaciones y paneles interactivos en
sus aplicaciones y portales web fácilmente.
La información se entregó a su bandeja de entrada:
puede generar y programar de forma automática informes que
se envían a su bandeja de entrada en función de una
programación establecida, permite desglosar los datos
subyacentes para explorarlos.
6. Facilita encontrar, suscribirse y usar datos de
terceros en la nube.
Para los proveedores de datos, AWS Data Exchange
hace que sea fácil llegar a los millones de
clientes de AWS que migran a la nube al eliminar
la necesidad de construir y mantener la
infraestructura para el almacenamiento de datos,
la entrega, la facturación y los derechos.
Encuentre rápidamente diversos
datos en un solo lugar: tiene
cientos de productos de datos como
servicios financieros, atención
médica, venta minorista, medios y
entretenimiento, y más.
Acceda eficientemente a los datos
en la nube: elimina la fricción de
encontrar, licenciar y usar conjuntos
de datos.
Analiza fácilmente nuevos datos:
permite usar de inmediato los datos
a los que se suscribe con la cartera
completa de servicios de análisis de
AWS, puede copiar rápidamente datos a
Amazon S3 e inmediatamente
transformarlos y procesarlos,
analizarlos o construir modelos de
aprendizaje automático en ellos.
Casos de uso
Servicios financieros: los bancos, las aseguradoras
y los administradores de activos pueden usar AWS Data
Exchange para suscribirse a productos que contienen
datos de mercado, archivos de noticias, puntos de
referencia de compensación, perfiles de la industria,
sentimientos de la empresa y más.
Consumidor y minorista: empresas de consumo y
minoristas pueden usar AWS Data Exchange para buscar
y suscribirse a una variedad de datos de ubicación,
movimiento, clima y perfiles de la industria.
Salud y ciencias de la vida: las compañías
farmacéuticas, los proveedores de atención médica y
las aseguradoras de salud pueden planificar mejor los
ensayos clínicos, crear planes de seguro, investigar
nuevos medicamentos y mejorar la vida de los pacientes
combinando sus propios datos con productos a los que
se suscriben en AWS Data Exchange.
Es un servicio web diseñado para
ayudarlo a procesar datos y a
transferirlos, de manera fiable y a
intervalos definidos, entre diferentes
servicios de almacenamiento y cómputo
de AWS.
Puede obtener acceso con regularidad a
las ubicaciones en las que están
almacenados los datos, transformarlos
y procesarlos a escala, además de
poder transferir los resultados con
eficacia a los servicios de AWS.
Ayuda a crear con facilidad cargas de
trabajo de procesamiento de datos
complejas que sean tolerantes a
errores, replicables y de alta
disponibilidad. No tiene que
preocuparse por garantizar la
disponibilidad de los recursos ni de
los tiempos de espera en tareas
individuales o la creación de un
sistema de notificación de errores,
también le permite transferir y
procesar datos que se hayan guardado
con anterioridad en almacenamientos de
información locales aislados.
Beneficios
Fiabilidad: se basa en una infraestructura
distribuida y de alta disponibilidad diseñada para
ejecutar las actividades con tolerancia a errores.
Facilidad de uso: la creación de una canalización
resulta una tarea rápida y sencilla a través de
nuestra consola basada en la tecnología de
arrastrar y soltar.
Flexibilidad: permite beneficiarse de una serie de
características como la programación, el seguimiento
de dependencias y la gestión de errores.
Escalabilidad: enviar trabajo a una o varias
máquinas en serie o en paralelo es igual de sencillo.
Transparencia: tiene pleno control sobre los
recursos informáticos que ejecutan su lógica de
negocio, lo que facilita la optimización o depuración
de la lógica.
Bajo costo.
7. Es un servicio de extracción, transformación y carga (ETL)
completamente administrado que ayuda a los clientes a preparar
y cargar los datos para su análisis. Puede crear y ejecutar
un trabajo de ETL con tan solo unos clics en la consola de
administración de AWS.
Puede realizar búsquedas y consultas inmediatamente en sus
datos, que están disponibles para operaciones de ETL.
Funcionamiento
Menos complicaciones: se
integra en una amplia
variedad de servicios de
AWS, lo que simplifica el
proceso de incorporación.
Rentabilidad: es un
servicio sin servidor. No
es necesario aprovisionar
ni administrar
infraestructura.
Mayor eficiencia:
automatiza gran parte del
proceso de creación,
mantenimiento y ejecución
de trabajos de ETL.
1:Cree su catálogo de
datos.
2:Genere y edite
transformaciones.
3:Programe y ejecute los
trabajos.
Consultas en un lago de
datos de Amazon S3:
almacenar y analizar datos
estructurados y sin
estructurar.
Analice datos de
registros en su almacén
de datos.
Vista unificada de sus
datos en numerosos
almacenes de datos.
Canalizaciones de ETL
determinadas por
eventos: puede ejecutar
sus trabajos de ETL en
función de un evento.
Es un servicio que facilita la
configuración de un lago de datos seguro
en cuestión de días.
Un lago de datos es un repositorio
centralizado, seleccionado y seguro que
almacena todos sus datos, tanto en su
forma original como preparados para
análisis. Los lagos de datos le permiten
desglosar los silos de datos y combinar
diferentes tipos de análisis para obtener
información y tomar mejores decisiones
empresariales. Incluye cargar datos de
diversas fuentes, monitorizar esos flujos
de datos, configurar particiones, activar
el cifrado y la administración de claves,
definir trabajos de transformación y
monitorizar su operación, reorganizar los
datos en un formato de columnas,
configurar los ajustes de control de
acceso, desduplicar datos redundantes,
relacionar registros vinculados, obtener
acceso a conjuntos de datos y auditar el
acceso a lo largo del tiempo.
Funcionamiento
Crear lagos de datos rápidamente: puede
trasladar, almacenar, catalogar y limpiar los
datos más rápido.
Simplificar la administración de la
seguridad: define la seguridad, el gobierno y
las políticas de auditoría en un solo lugar.
Proporcionar acceso de autoservicio a los
datos: rea un catálogo de datos que describe los
distintos conjuntos de datos que están
disponibles junto a los grupos de usuarios que
tienen acceso a cada uno.