SlideShare una empresa de Scribd logo
1 de 38
Descargar para leer sin conexión
Tendencias en el
Diseño de
Procesadores con
Arquitectura ARM
Javier Diaz Bruguera
Senior Principal Microarchitect, Contractor
Arm Cambridge, UK
UCM, Noviembre 2022
¡El Procesador ha cumplido 50 años!
“Microprocessors are getting into everything. We
won’t be able to pick up a single piece of
equipment in the near future, except maybe a
broom that hasn’t got a microprocessor in it.”
Arthur Clarke, 1979
Electronics News Weekly, Noviembre 1971
Una evolución vertiginosa
• Posible debido a los avances en
• Arquitectura
• Microarquitectura
• Tecnología
• Fabricación de CIs
Intel 4004
(1971)
Apple M1
(2022)
Frecuencia 750 KHz 3.3 GHz
Transistores 2.250 16.000 millones
Tecnología 10 𝜇m 5 nm
Area 12 mm2 120 mm2
Datos 4 bits 64 bits
• Límite en la frecuencia (GHz) debido a la enorme
cantidad de calor que se genera en el procesador
y al consumo de potencia
Los procesadores han cambiado
Bus de 4 bits multiplexado
direcciones de 12 bits
datos de 4 bits
instrucciones de 8 bits
Chip del Intel 4004 de
National Semiconductor
Los procesadores han cambiado
Bus de 4 bits multiplexado
direcciones de 12 bits
datos de 4 bits
instrucciones de 8 bits
Chip del Intel 4004 de
National Semiconductor
El número de pines
de I/O es > 1000
Sistemas heterogéneos en un chip (SoC)
Arquitectura vs.
microarquitectura
• Imagen abstracta del sistema como sería visto
por un programador en lenguaje
ensamblador
• Es muy difícil introducir cambios rompedores
en la arquitectura de un procesador
• Se debe mantener la compatibilidad con versiones
anteriores de la arquitectura
• Las arquitecturas suelen evolucionar de
forma suave
• Transición de 32 a 64 bits
• Extensiones vectoriales
• Protección y seguridad
• …
La arquitectura del procesador
• Implementación de una arquitectura en un procesador
• Una arquitectura dada puede ser implementada con diferentes microarquitecturas
• Las implementaciones pueden variar debido a diferentes objetivos de diseño
• La microarquitectura ha evolucionado (radicalmente) para mejorar las
prestaciones
• Evolución posible gracias a los avances tecnológicos y de fabricación de
circuitos integrados
• Mayor densidad: más transistores en el mismo área de silicio
Microarquitectura del procesador
• Tres modelos de uso diferentes
• x86
• Procesadores de Intel y AMD
• ARM
• Se licencia a los partners para que la
implementen en sus procesadores
• Qualcomm, Apple, Samsung, MediaTek, NXP,
Nvidia, AWS, Google, …
• RISC-V
• Open source
• SiFive, MIPS, Imagination, …
Las arquitecturas más destacadas
• El núcleo del negocio es la venta (licencia) de IPs y los royalties de los chips producidos
• Arquitectura: El partner diseña su propio procesador con arquitectura Arm
• Microarquitectura: el core ARM se integra en el diseño del partner
• Cortex CPU
• Neoverse: HPC, Cloud, Infraestructura
• Cortex-X, Cortex-A: De aplicaciones para sistemas computacionalmente complejos
• Cortex-X: Alto rendimiento
• Cortex-A: Eficiencia energética (big, little)
• Cortex-M: Procesadores de bajo consumo de potencia para microcontroladores y IOT
• Cortex-R: Procesadores de tiempo real para aplicaciones críticas
• Flexible Access: acceso ilimitado a un número elevado de IPs, herramientas y formación de
Arm para desarrollo de productos
Licencias ARM
Licencias ARM
En Octubre de 2021 se
alcanzaron los
200.000 millones de
chips con tecnología
Arm acumulados en
30 años
Computación cloud-edge-endpoint
• Plataformas muy diferentes
• La arquitectura ARM es central en la tecnología
Computación cloud-edge-endpoint
When we look today, I think the trend is that everything is moving to Arm.
Cristiano Amon, CEO of Qualcomm, 2022
La Arquitectura
ARM
Armv9: Machine learning, SVE y seguridad
• Tres pilares: Inteligencia artificial (Machine Learning), mejoras en
extensiones vectoriales, y seguridad
Armv9: Machine learning (ML)
• Las cargas de ML son cada vez más importantes
• Cientos de miles de gigabytes de datos se generan cada día con aplicaciones de IA
• Electrónica de consumo, salud, logística, fabricación inteligente, automoción, …
• Aceleradores de ML, pero algunas tareas de ML se ejecutan en CPU
• Instrucciones de multiplicación de matrices 2x2, dot product (8 y 16 bits)
• Nuevos formatos de datos: bfloat
• En desarrollo
• Punto flotante de 8 bits
• Nuevas extensions de multiplicación
de matrices
Sign Exponent Fraction
11 bits 52 bits 64 bits
DP
Sign Exponent Fraction
8 bits 23 bits 32 bits
SP
Sign Exponent Fraction
5 bits 10 bits 16 bits
HP
Sign Exponent Fraction
8 bits 7 bits 16 bits
Bfloat
Sign Exp Fract
5,4 2,3 8 bits
new 8-bit
formats
Armv9: scalable vector extensions (SVE/SVE2)
• Sucesor de NEON
• Anunciado en 2016 e implementado por primera vez en Fujitsu A64FX
CPU (2018)
• La primera version SVE muy orientada a HPC
• Menos eficiente que NEON en otras cargas
• SVE2 anunciado en 2019
• Se añadieron instrucciones para DSP, vision por computador,
criptografía, comunicaciones, etc.
Scalable vector extensions (SVE/SVE2)
• Vectores de longitud variable: de 128 a 2048 bits,
en incrementos de 128 bits
• Foco en la arquitectura
• Independiente de la longitud de vector del hardware
• El partner elige la implementación hardware
• Vector-length agnostic (VLA) programming model:
El programador no necesita saber la longitud del
vector
• Código de operación único para cada instrucción
• Longitud del vector en un registro de la arquitectura
• El código solo necesita compilarse una vez
• El mismo binario puede ejecutarse en diferentes
núcleos, con diferentes SIMD pipelines
• Vectores con elementos de 64, 32, 16 y 8 bits
SVE: vector-length agnostic (VLA)
• Predicación por elementos: La operación se
hace en elementos individuales bajo control
del registro de predicado
• Control de lazos con predicación: eliminación
de control del lazo
• Partición de vectores
Seguridad: confidential compute architecture (CCA)
• Varias brechas de seguridad en los últimos años (Spectre, Meltdown)
• Rediseño de mecanismos de seguridad
• Modelo tradicional de seguridad:
• Las aplicaciones confían en el SO y el hipervisor
• Software con mayores privilegios pueden
intervenir en la ejecución de software con
menores privilegios
• Brecha de seguridad
• Arm Confidencial Compute (CCA)
• Introduce los “reinos” (realms)
• Contenedores seguros de entornos de ejecución
• Opacos al SO y el hipervisor
• Se crean de forma dinámica
• Area de memoria con protección hardware
• Aislados del resto del sistema
• Los reinos reducen la interferencia de otros
elementos del SO
• Aplicaciones críticas en seguridad no requieren
dispositivos específicos
Seguridad: memory tagging extension (MTE)
• Protección contra la corrupción de la memoria
• MTE: añadir un conjunto de bits a grupos de
posiciones de memoria para identificarlas como
seguras
• Address tagging (key): 4 bits en cada puntero
• Memory tagging (lock): 4 bits en cada región de 16 bytes de
la memoria de aplicaciones
• Comparación de key y lock
• Las etiquetas de bloques de memoria contiguos son
diferentes
• Gestionado en hardware: modificación de las
instrucciones de load y store
• Implementado en la cache
La microarquitectura
de los procesadores
ARM Cortex CPU
ARM Cortex CPU
• Neoverse: HPC, Cloud,
Infraestructura
• Cortex-X, Cortex-A: De
aplicaciones para sistemas
computacionalmente
complejos
• Cortex-X: Alto rendimiento
• Cortex-A: Eficiencia
energética
• Procesadores multinúcleo
heterogéneos
• Combinación de núcleos de diferentes
características para mejorar la
eficiencia energética
• Configuración Arm big.LITTLE
• Dos tipos de núcleos en el chip
• Big para maximizar rendimiento
• Little para reducir el consumo de
potencia
• Configuracion Tri-cluster
Cortex-A y Cortex-X en smartphones y tablets
Evolución de los cores Cortex-A y Cortex-X
Cortex-X
Cortex-A
Big
Cortex-A
Little
• Varios núcleos de diferentes características
• Graphics processing Unit (GPU)
• Ray-tracing
• Neural networks processing unit (DLA)
• Otros aceleradores (ISP, 5G, …)
Cortex-A, Cortex-X: system-on-chip (SoC)
Tri-cluster: Cortex-X2, Cortex-A710, Cortex-A510
• Evolución de big.LITTLE
• Diferentes puntos en la curva de PPA
(power, performance, area)
• Cortex-X2: “performance first”, a costa
de mayor área y potencia
• Cortex-A710: optimizado para eficiencia
y performance, PPA balanceado
• Cortex-A510: power efficiency
• Soporte para aplicaciones de 32 bits solo
en el Cortex A710
• In-order
• Microarquitectura merged core: dos
núcleos que comparten L2, FP,
NEON/SVE2
• Cada núcleo es un núcleo completo con
front-end, integer back-end y L1
• Las cargas de trabajo más frecuentes para
este núcleo son de enteros
• Mejora en área y rendimiento
• 2x64-bit o 2x128-bit pipelines
• Menos unidades que en los big cores
Cortex-A510: energéticamente eficiente
Samsung Exynos 2200
Comparación del rendimiento de CPUs Arm y x86
1 núcleo
Multinúcleo
Edge-cloud computing: ARM Neoverse
• Neoverse V: Máximo
rendimiento
• Neoverse N: rendimiento/W
• Neoverse E: Eficiencia
• Neoverse V: supercomputadores (HPC) y servidores high-end
• Neoverse N: servidores main-stream, DPUs y 5G
• Neoverse E: sistemas empotrados
Edge-cloud computing: cliente e infraestructura
Cortex-A710
Cortex-X2
Cortex-A715 Cortex-X3
Neoverse E1
Neoverse V2
HPC con ARM Neoverse: Fujistu Fugaku
• A64FX: 1 nodo -> 4 CMGs con
• 13 núcleos
• 8 MB L2 compartida
• Núcleos Neoverse V1
• SVE de 512 bits en cada núcleo
• Frecuencia de operación baja para
limitar el consumo de potencia
(~2.2𝐺𝐻𝑧)
• Número 1 en el TOP500: junio 2020 - junio 2022
• 156.976 nodos NUMA A64FX, 52 núcleos por nodo, 7.630.848 núcleos
• Tofu NOC: topología de red en forma de torus desarrollado por Fujitsu
CMG:
HPC y cloud con ARM Neoverse
• Otros supercomputadores y cloud con Arm
• ETRI
• Ampere computing
• Nvidia A100
• Google Cloud
• Microsoft Azure Cloud
• Tencent Cloud
• Oracle Cloud
• Alibaba Cloud
• Sandia National Laboratories
• Amazon Web Services (AWS)
• SiPearl (European Processor Initiative)
• Marvell
• …
Procesadores ARM
en automoción
Procesadores en automoción
• Toma de autónoma de decisiones y terminación segura de las tareas
• En algunos entornos cualquier fallo o malfunción puede ser una amenaza vital
• Vehículos autónomos (AV) y ayudas a la conducción (Advanced Driver – Assistance
Systems, ADAS)
• Automatización industrial
• Se requiere alta potencia computacional
• Captura y análisis de grandes cantidades de datos
• Numerosos sensores (cámaras, LIDAR, GPS, …)
• Respuesta en tiempo real para predecir situaciones y posibilitar una respuesta o reacción
• Se necesitan soluciones unificadas
• La seguridad demanda redundancia a todos los niveles
Procesadores en automoción
• La industria del automóvil utiliza decenas de ordenadores
empotrados en los vehículos
• Cambio tecnológico sin parangón en ninguna otra industria
• Muy afectada por la carencia de chips y la fragilidad de sus cadenas
de suministros
• Electrónica y software son esenciales en los vehículos
• 100-150 unidades de control electrónico (ECUs)
• > 100 millones de líneas de código
• 3000 chips de todo tipo
• Cerca del 40% del coste es atribuible a electrónica y software
(Deloitte)
IEEE MIcro
DELOITTE TOUCHE TOHMATSU LIMITED
• Esfuerzo de integración de sistemas de
diferentes OEMs
• El test es un reto
Muchas gracias por
vuestra atención

Más contenido relacionado

La actualidad más candente

1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptx
1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptx1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptx
1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptxDiegoAvalos32
 
Modulación por desplazamiento de frecuencia
Modulación por desplazamiento de frecuenciaModulación por desplazamiento de frecuencia
Modulación por desplazamiento de frecuenciaCarmen Ea
 
Sesión 3 introduccion a microcontroladores
Sesión 3 introduccion a microcontroladoresSesión 3 introduccion a microcontroladores
Sesión 3 introduccion a microcontroladoresDidier Tec
 
Guía rápida tmr0 e interrupciones
Guía rápida tmr0 e interrupcionesGuía rápida tmr0 e interrupciones
Guía rápida tmr0 e interrupcionesLuis Zurita
 
Resumen microcontroladores
Resumen microcontroladoresResumen microcontroladores
Resumen microcontroladoresXavier Solis
 
Latches y flip flops
Latches y flip flopsLatches y flip flops
Latches y flip flopsJimmy Osores
 
Memoria EEPROM
Memoria EEPROMMemoria EEPROM
Memoria EEPROMelizagara
 
Diagrama en bloques_de_un_tv
Diagrama en bloques_de_un_tvDiagrama en bloques_de_un_tv
Diagrama en bloques_de_un_tvAlex Chancúsig
 
REGISTRO DE BANDERAS
REGISTRO DE BANDERASREGISTRO DE BANDERAS
REGISTRO DE BANDERASFabian Rojas
 
Receptores De AM
Receptores De AMReceptores De AM
Receptores De AMMao Mos!
 
Microprocesador
MicroprocesadorMicroprocesador
MicroprocesadorSuarezJhon
 
Compresion de Audio - Telecomunicaciones III
Compresion de Audio - Telecomunicaciones IIICompresion de Audio - Telecomunicaciones III
Compresion de Audio - Telecomunicaciones IIIAndy Juan Sarango Veliz
 
135127015 microcontroladores-1-1-ppt
135127015 microcontroladores-1-1-ppt135127015 microcontroladores-1-1-ppt
135127015 microcontroladores-1-1-pptCarlos Martir
 
Modulación por desplazamiento de fase (psk) exposicion
Modulación por desplazamiento de fase (psk) exposicionModulación por desplazamiento de fase (psk) exposicion
Modulación por desplazamiento de fase (psk) exposicionAlieth Guevara
 

La actualidad más candente (20)

Investigación técnicas de modulación
Investigación técnicas de modulaciónInvestigación técnicas de modulación
Investigación técnicas de modulación
 
1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptx
1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptx1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptx
1.1-Diferencias entre microprocesador, microcomputadora y microcontrolador.pptx
 
Reporte de Practica Arduino
Reporte de Practica ArduinoReporte de Practica Arduino
Reporte de Practica Arduino
 
Señales analogicas
Señales analogicasSeñales analogicas
Señales analogicas
 
Modulación por desplazamiento de frecuencia
Modulación por desplazamiento de frecuenciaModulación por desplazamiento de frecuencia
Modulación por desplazamiento de frecuencia
 
Sesión 3 introduccion a microcontroladores
Sesión 3 introduccion a microcontroladoresSesión 3 introduccion a microcontroladores
Sesión 3 introduccion a microcontroladores
 
Guía rápida tmr0 e interrupciones
Guía rápida tmr0 e interrupcionesGuía rápida tmr0 e interrupciones
Guía rápida tmr0 e interrupciones
 
Resumen microcontroladores
Resumen microcontroladoresResumen microcontroladores
Resumen microcontroladores
 
Latches y flip flops
Latches y flip flopsLatches y flip flops
Latches y flip flops
 
Memoria EEPROM
Memoria EEPROMMemoria EEPROM
Memoria EEPROM
 
Diagrama en bloques_de_un_tv
Diagrama en bloques_de_un_tvDiagrama en bloques_de_un_tv
Diagrama en bloques_de_un_tv
 
REGISTRO DE BANDERAS
REGISTRO DE BANDERASREGISTRO DE BANDERAS
REGISTRO DE BANDERAS
 
Receptores De AM
Receptores De AMReceptores De AM
Receptores De AM
 
Microprocesador
MicroprocesadorMicroprocesador
Microprocesador
 
Rufus
RufusRufus
Rufus
 
Codigo manchester
Codigo manchesterCodigo manchester
Codigo manchester
 
Intel 80286 80386 y 80486
Intel 80286 80386 y 80486Intel 80286 80386 y 80486
Intel 80286 80386 y 80486
 
Compresion de Audio - Telecomunicaciones III
Compresion de Audio - Telecomunicaciones IIICompresion de Audio - Telecomunicaciones III
Compresion de Audio - Telecomunicaciones III
 
135127015 microcontroladores-1-1-ppt
135127015 microcontroladores-1-1-ppt135127015 microcontroladores-1-1-ppt
135127015 microcontroladores-1-1-ppt
 
Modulación por desplazamiento de fase (psk) exposicion
Modulación por desplazamiento de fase (psk) exposicionModulación por desplazamiento de fase (psk) exposicion
Modulación por desplazamiento de fase (psk) exposicion
 

Similar a Tendencias en el diseño de procesadores con arquitectura Arm

microprocesadores evolucion a lo largo de los años
microprocesadores evolucion a lo largo de los añosmicroprocesadores evolucion a lo largo de los años
microprocesadores evolucion a lo largo de los añosBrianAlva3
 
Diapositiva de estudio PPT Derivados-del-8051.pdf
Diapositiva de estudio PPT Derivados-del-8051.pdfDiapositiva de estudio PPT Derivados-del-8051.pdf
Diapositiva de estudio PPT Derivados-del-8051.pdfjorgejvc777
 
Procesadores de ultima generacion.pptx
Procesadores de ultima generacion.pptxProcesadores de ultima generacion.pptx
Procesadores de ultima generacion.pptxYessica502665
 
Equipo 1 exposicion micro`procesadores
Equipo 1   exposicion micro`procesadoresEquipo 1   exposicion micro`procesadores
Equipo 1 exposicion micro`procesadoresElvis Hernadez
 
microprocesadores.pptx
microprocesadores.pptxmicroprocesadores.pptx
microprocesadores.pptxSireneDnx
 
Exposicion de procesadores
Exposicion de procesadoresExposicion de procesadores
Exposicion de procesadoresAgustinMateo2
 
Procesador 1 complemento[1]
Procesador 1 complemento[1]Procesador 1 complemento[1]
Procesador 1 complemento[1]kariosp
 
Evoluciondelosprocesadoresamd 100910191925-phpapp02
Evoluciondelosprocesadoresamd 100910191925-phpapp02Evoluciondelosprocesadoresamd 100910191925-phpapp02
Evoluciondelosprocesadoresamd 100910191925-phpapp02zauzedo
 
Diapositiva de Estudio: ppt -procesadores-arm_compress.pdf
Diapositiva de Estudio: ppt -procesadores-arm_compress.pdfDiapositiva de Estudio: ppt -procesadores-arm_compress.pdf
Diapositiva de Estudio: ppt -procesadores-arm_compress.pdfjorgejvc777
 
PROCESADORES ULTIMA GENERACIÓN
PROCESADORES ULTIMA GENERACIÓNPROCESADORES ULTIMA GENERACIÓN
PROCESADORES ULTIMA GENERACIÓNDairaCarolina
 
23 microprocesadores
23 microprocesadores23 microprocesadores
23 microprocesadoresconrado perea
 

Similar a Tendencias en el diseño de procesadores con arquitectura Arm (20)

Microprocesadores
MicroprocesadoresMicroprocesadores
Microprocesadores
 
microprocesadores evolucion a lo largo de los años
microprocesadores evolucion a lo largo de los añosmicroprocesadores evolucion a lo largo de los años
microprocesadores evolucion a lo largo de los años
 
#avanttic_webinar: SPARC/Solaris, una plataforma con futuro
#avanttic_webinar: SPARC/Solaris, una plataforma con futuro#avanttic_webinar: SPARC/Solaris, una plataforma con futuro
#avanttic_webinar: SPARC/Solaris, una plataforma con futuro
 
Diapositiva de estudio PPT Derivados-del-8051.pdf
Diapositiva de estudio PPT Derivados-del-8051.pdfDiapositiva de estudio PPT Derivados-del-8051.pdf
Diapositiva de estudio PPT Derivados-del-8051.pdf
 
Tema 4. microprocesadores
Tema 4. microprocesadoresTema 4. microprocesadores
Tema 4. microprocesadores
 
informatica
informaticainformatica
informatica
 
Procesadores de ultima generacion.pptx
Procesadores de ultima generacion.pptxProcesadores de ultima generacion.pptx
Procesadores de ultima generacion.pptx
 
Equipo 1 exposicion micro`procesadores
Equipo 1   exposicion micro`procesadoresEquipo 1   exposicion micro`procesadores
Equipo 1 exposicion micro`procesadores
 
microprocesadores.pptx
microprocesadores.pptxmicroprocesadores.pptx
microprocesadores.pptx
 
MICROPROCESADOR 1.ppt
MICROPROCESADOR 1.pptMICROPROCESADOR 1.ppt
MICROPROCESADOR 1.ppt
 
Procesador1
Procesador1Procesador1
Procesador1
 
Exposicion de procesadores
Exposicion de procesadoresExposicion de procesadores
Exposicion de procesadores
 
Procesador 1 complemento[1]
Procesador 1 complemento[1]Procesador 1 complemento[1]
Procesador 1 complemento[1]
 
Evoluciondelosprocesadoresamd 100910191925-phpapp02
Evoluciondelosprocesadoresamd 100910191925-phpapp02Evoluciondelosprocesadoresamd 100910191925-phpapp02
Evoluciondelosprocesadoresamd 100910191925-phpapp02
 
Diapositiva de Estudio: ppt -procesadores-arm_compress.pdf
Diapositiva de Estudio: ppt -procesadores-arm_compress.pdfDiapositiva de Estudio: ppt -procesadores-arm_compress.pdf
Diapositiva de Estudio: ppt -procesadores-arm_compress.pdf
 
Procesadores
ProcesadoresProcesadores
Procesadores
 
PROCESADORES ULTIMA GENERACIÓN
PROCESADORES ULTIMA GENERACIÓNPROCESADORES ULTIMA GENERACIÓN
PROCESADORES ULTIMA GENERACIÓN
 
Microprocesador
MicroprocesadorMicroprocesador
Microprocesador
 
23 microprocesadores
23 microprocesadores23 microprocesadores
23 microprocesadores
 
PROCESADOR
PROCESADORPROCESADOR
PROCESADOR
 

Más de Facultad de Informática UCM

¿Por qué debemos seguir trabajando en álgebra lineal?
¿Por qué debemos seguir trabajando en álgebra lineal?¿Por qué debemos seguir trabajando en álgebra lineal?
¿Por qué debemos seguir trabajando en álgebra lineal?Facultad de Informática UCM
 
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...Facultad de Informática UCM
 
DRAC: Designing RISC-V-based Accelerators for next generation Computers
DRAC: Designing RISC-V-based Accelerators for next generation ComputersDRAC: Designing RISC-V-based Accelerators for next generation Computers
DRAC: Designing RISC-V-based Accelerators for next generation ComputersFacultad de Informática UCM
 
Introduction to Quantum Computing and Quantum Service Oriented Computing
Introduction to Quantum Computing and Quantum Service Oriented ComputingIntroduction to Quantum Computing and Quantum Service Oriented Computing
Introduction to Quantum Computing and Quantum Service Oriented ComputingFacultad de Informática UCM
 
Inteligencia Artificial en la atención sanitaria del futuro
Inteligencia Artificial en la atención sanitaria del futuroInteligencia Artificial en la atención sanitaria del futuro
Inteligencia Artificial en la atención sanitaria del futuroFacultad de Informática UCM
 
Design Automation Approaches for Real-Time Edge Computing for Science Applic...
 Design Automation Approaches for Real-Time Edge Computing for Science Applic... Design Automation Approaches for Real-Time Edge Computing for Science Applic...
Design Automation Approaches for Real-Time Edge Computing for Science Applic...Facultad de Informática UCM
 
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...Estrategias de navegación para robótica móvil de campo: caso de estudio proye...
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...Facultad de Informática UCM
 
Fault-tolerance Quantum computation and Quantum Error Correction
Fault-tolerance Quantum computation and Quantum Error CorrectionFault-tolerance Quantum computation and Quantum Error Correction
Fault-tolerance Quantum computation and Quantum Error CorrectionFacultad de Informática UCM
 
Cómo construir un chatbot inteligente sin morir en el intento
Cómo construir un chatbot inteligente sin morir en el intentoCómo construir un chatbot inteligente sin morir en el intento
Cómo construir un chatbot inteligente sin morir en el intentoFacultad de Informática UCM
 
Automatic generation of hardware memory architectures for HPC
Automatic generation of hardware memory architectures for HPCAutomatic generation of hardware memory architectures for HPC
Automatic generation of hardware memory architectures for HPCFacultad de Informática UCM
 
Hardware/software security contracts: Principled foundations for building sec...
Hardware/software security contracts: Principled foundations for building sec...Hardware/software security contracts: Principled foundations for building sec...
Hardware/software security contracts: Principled foundations for building sec...Facultad de Informática UCM
 
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...Facultad de Informática UCM
 
Redes neuronales y reinforcement learning. Aplicación en energía eólica.
Redes neuronales y reinforcement learning. Aplicación en energía eólica.Redes neuronales y reinforcement learning. Aplicación en energía eólica.
Redes neuronales y reinforcement learning. Aplicación en energía eólica.Facultad de Informática UCM
 
Challenges and Opportunities for AI and Data analytics in Offshore wind
Challenges and Opportunities for AI and Data analytics in Offshore windChallenges and Opportunities for AI and Data analytics in Offshore wind
Challenges and Opportunities for AI and Data analytics in Offshore windFacultad de Informática UCM
 
Evolution and Trends in Edge AI Systems and Architectures for the Internet of...
Evolution and Trends in Edge AI Systems and Architectures for the Internet of...Evolution and Trends in Edge AI Systems and Architectures for the Internet of...
Evolution and Trends in Edge AI Systems and Architectures for the Internet of...Facultad de Informática UCM
 

Más de Facultad de Informática UCM (20)

¿Por qué debemos seguir trabajando en álgebra lineal?
¿Por qué debemos seguir trabajando en álgebra lineal?¿Por qué debemos seguir trabajando en álgebra lineal?
¿Por qué debemos seguir trabajando en álgebra lineal?
 
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...
 
DRAC: Designing RISC-V-based Accelerators for next generation Computers
DRAC: Designing RISC-V-based Accelerators for next generation ComputersDRAC: Designing RISC-V-based Accelerators for next generation Computers
DRAC: Designing RISC-V-based Accelerators for next generation Computers
 
uElectronics ongoing activities at ESA
uElectronics ongoing activities at ESAuElectronics ongoing activities at ESA
uElectronics ongoing activities at ESA
 
Formalizing Mathematics in Lean
Formalizing Mathematics in LeanFormalizing Mathematics in Lean
Formalizing Mathematics in Lean
 
Introduction to Quantum Computing and Quantum Service Oriented Computing
Introduction to Quantum Computing and Quantum Service Oriented ComputingIntroduction to Quantum Computing and Quantum Service Oriented Computing
Introduction to Quantum Computing and Quantum Service Oriented Computing
 
Computer Design Concepts for Machine Learning
Computer Design Concepts for Machine LearningComputer Design Concepts for Machine Learning
Computer Design Concepts for Machine Learning
 
Inteligencia Artificial en la atención sanitaria del futuro
Inteligencia Artificial en la atención sanitaria del futuroInteligencia Artificial en la atención sanitaria del futuro
Inteligencia Artificial en la atención sanitaria del futuro
 
Design Automation Approaches for Real-Time Edge Computing for Science Applic...
 Design Automation Approaches for Real-Time Edge Computing for Science Applic... Design Automation Approaches for Real-Time Edge Computing for Science Applic...
Design Automation Approaches for Real-Time Edge Computing for Science Applic...
 
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...Estrategias de navegación para robótica móvil de campo: caso de estudio proye...
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...
 
Fault-tolerance Quantum computation and Quantum Error Correction
Fault-tolerance Quantum computation and Quantum Error CorrectionFault-tolerance Quantum computation and Quantum Error Correction
Fault-tolerance Quantum computation and Quantum Error Correction
 
Cómo construir un chatbot inteligente sin morir en el intento
Cómo construir un chatbot inteligente sin morir en el intentoCómo construir un chatbot inteligente sin morir en el intento
Cómo construir un chatbot inteligente sin morir en el intento
 
Automatic generation of hardware memory architectures for HPC
Automatic generation of hardware memory architectures for HPCAutomatic generation of hardware memory architectures for HPC
Automatic generation of hardware memory architectures for HPC
 
Type and proof structures for concurrency
Type and proof structures for concurrencyType and proof structures for concurrency
Type and proof structures for concurrency
 
Hardware/software security contracts: Principled foundations for building sec...
Hardware/software security contracts: Principled foundations for building sec...Hardware/software security contracts: Principled foundations for building sec...
Hardware/software security contracts: Principled foundations for building sec...
 
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...
 
Do you trust your artificial intelligence system?
Do you trust your artificial intelligence system?Do you trust your artificial intelligence system?
Do you trust your artificial intelligence system?
 
Redes neuronales y reinforcement learning. Aplicación en energía eólica.
Redes neuronales y reinforcement learning. Aplicación en energía eólica.Redes neuronales y reinforcement learning. Aplicación en energía eólica.
Redes neuronales y reinforcement learning. Aplicación en energía eólica.
 
Challenges and Opportunities for AI and Data analytics in Offshore wind
Challenges and Opportunities for AI and Data analytics in Offshore windChallenges and Opportunities for AI and Data analytics in Offshore wind
Challenges and Opportunities for AI and Data analytics in Offshore wind
 
Evolution and Trends in Edge AI Systems and Architectures for the Internet of...
Evolution and Trends in Edge AI Systems and Architectures for the Internet of...Evolution and Trends in Edge AI Systems and Architectures for the Internet of...
Evolution and Trends in Edge AI Systems and Architectures for the Internet of...
 

Último

Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docxGLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docxAleParedes11
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfMaryRotonda1
 
Herramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdfHerramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdfMARIAPAULAMAHECHAMOR
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfResolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxPryhaSalam
 

Último (20)

Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docxGLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdf
 
Herramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdfHerramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdf
 
La Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdfLa Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdf
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfResolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
 

Tendencias en el diseño de procesadores con arquitectura Arm

  • 1. Tendencias en el Diseño de Procesadores con Arquitectura ARM Javier Diaz Bruguera Senior Principal Microarchitect, Contractor Arm Cambridge, UK UCM, Noviembre 2022
  • 2. ¡El Procesador ha cumplido 50 años! “Microprocessors are getting into everything. We won’t be able to pick up a single piece of equipment in the near future, except maybe a broom that hasn’t got a microprocessor in it.” Arthur Clarke, 1979 Electronics News Weekly, Noviembre 1971
  • 3. Una evolución vertiginosa • Posible debido a los avances en • Arquitectura • Microarquitectura • Tecnología • Fabricación de CIs Intel 4004 (1971) Apple M1 (2022) Frecuencia 750 KHz 3.3 GHz Transistores 2.250 16.000 millones Tecnología 10 𝜇m 5 nm Area 12 mm2 120 mm2 Datos 4 bits 64 bits • Límite en la frecuencia (GHz) debido a la enorme cantidad de calor que se genera en el procesador y al consumo de potencia
  • 4. Los procesadores han cambiado Bus de 4 bits multiplexado direcciones de 12 bits datos de 4 bits instrucciones de 8 bits Chip del Intel 4004 de National Semiconductor
  • 5. Los procesadores han cambiado Bus de 4 bits multiplexado direcciones de 12 bits datos de 4 bits instrucciones de 8 bits Chip del Intel 4004 de National Semiconductor El número de pines de I/O es > 1000 Sistemas heterogéneos en un chip (SoC)
  • 7. • Imagen abstracta del sistema como sería visto por un programador en lenguaje ensamblador • Es muy difícil introducir cambios rompedores en la arquitectura de un procesador • Se debe mantener la compatibilidad con versiones anteriores de la arquitectura • Las arquitecturas suelen evolucionar de forma suave • Transición de 32 a 64 bits • Extensiones vectoriales • Protección y seguridad • … La arquitectura del procesador
  • 8. • Implementación de una arquitectura en un procesador • Una arquitectura dada puede ser implementada con diferentes microarquitecturas • Las implementaciones pueden variar debido a diferentes objetivos de diseño • La microarquitectura ha evolucionado (radicalmente) para mejorar las prestaciones • Evolución posible gracias a los avances tecnológicos y de fabricación de circuitos integrados • Mayor densidad: más transistores en el mismo área de silicio Microarquitectura del procesador
  • 9. • Tres modelos de uso diferentes • x86 • Procesadores de Intel y AMD • ARM • Se licencia a los partners para que la implementen en sus procesadores • Qualcomm, Apple, Samsung, MediaTek, NXP, Nvidia, AWS, Google, … • RISC-V • Open source • SiFive, MIPS, Imagination, … Las arquitecturas más destacadas
  • 10. • El núcleo del negocio es la venta (licencia) de IPs y los royalties de los chips producidos • Arquitectura: El partner diseña su propio procesador con arquitectura Arm • Microarquitectura: el core ARM se integra en el diseño del partner • Cortex CPU • Neoverse: HPC, Cloud, Infraestructura • Cortex-X, Cortex-A: De aplicaciones para sistemas computacionalmente complejos • Cortex-X: Alto rendimiento • Cortex-A: Eficiencia energética (big, little) • Cortex-M: Procesadores de bajo consumo de potencia para microcontroladores y IOT • Cortex-R: Procesadores de tiempo real para aplicaciones críticas • Flexible Access: acceso ilimitado a un número elevado de IPs, herramientas y formación de Arm para desarrollo de productos Licencias ARM
  • 11. Licencias ARM En Octubre de 2021 se alcanzaron los 200.000 millones de chips con tecnología Arm acumulados en 30 años
  • 12. Computación cloud-edge-endpoint • Plataformas muy diferentes • La arquitectura ARM es central en la tecnología
  • 13. Computación cloud-edge-endpoint When we look today, I think the trend is that everything is moving to Arm. Cristiano Amon, CEO of Qualcomm, 2022
  • 15. Armv9: Machine learning, SVE y seguridad • Tres pilares: Inteligencia artificial (Machine Learning), mejoras en extensiones vectoriales, y seguridad
  • 16. Armv9: Machine learning (ML) • Las cargas de ML son cada vez más importantes • Cientos de miles de gigabytes de datos se generan cada día con aplicaciones de IA • Electrónica de consumo, salud, logística, fabricación inteligente, automoción, … • Aceleradores de ML, pero algunas tareas de ML se ejecutan en CPU • Instrucciones de multiplicación de matrices 2x2, dot product (8 y 16 bits) • Nuevos formatos de datos: bfloat • En desarrollo • Punto flotante de 8 bits • Nuevas extensions de multiplicación de matrices Sign Exponent Fraction 11 bits 52 bits 64 bits DP Sign Exponent Fraction 8 bits 23 bits 32 bits SP Sign Exponent Fraction 5 bits 10 bits 16 bits HP Sign Exponent Fraction 8 bits 7 bits 16 bits Bfloat Sign Exp Fract 5,4 2,3 8 bits new 8-bit formats
  • 17. Armv9: scalable vector extensions (SVE/SVE2) • Sucesor de NEON • Anunciado en 2016 e implementado por primera vez en Fujitsu A64FX CPU (2018) • La primera version SVE muy orientada a HPC • Menos eficiente que NEON en otras cargas • SVE2 anunciado en 2019 • Se añadieron instrucciones para DSP, vision por computador, criptografía, comunicaciones, etc.
  • 18. Scalable vector extensions (SVE/SVE2) • Vectores de longitud variable: de 128 a 2048 bits, en incrementos de 128 bits • Foco en la arquitectura • Independiente de la longitud de vector del hardware • El partner elige la implementación hardware • Vector-length agnostic (VLA) programming model: El programador no necesita saber la longitud del vector • Código de operación único para cada instrucción • Longitud del vector en un registro de la arquitectura • El código solo necesita compilarse una vez • El mismo binario puede ejecutarse en diferentes núcleos, con diferentes SIMD pipelines • Vectores con elementos de 64, 32, 16 y 8 bits
  • 19. SVE: vector-length agnostic (VLA) • Predicación por elementos: La operación se hace en elementos individuales bajo control del registro de predicado • Control de lazos con predicación: eliminación de control del lazo • Partición de vectores
  • 20. Seguridad: confidential compute architecture (CCA) • Varias brechas de seguridad en los últimos años (Spectre, Meltdown) • Rediseño de mecanismos de seguridad • Modelo tradicional de seguridad: • Las aplicaciones confían en el SO y el hipervisor • Software con mayores privilegios pueden intervenir en la ejecución de software con menores privilegios • Brecha de seguridad • Arm Confidencial Compute (CCA) • Introduce los “reinos” (realms) • Contenedores seguros de entornos de ejecución • Opacos al SO y el hipervisor • Se crean de forma dinámica • Area de memoria con protección hardware • Aislados del resto del sistema • Los reinos reducen la interferencia de otros elementos del SO • Aplicaciones críticas en seguridad no requieren dispositivos específicos
  • 21. Seguridad: memory tagging extension (MTE) • Protección contra la corrupción de la memoria • MTE: añadir un conjunto de bits a grupos de posiciones de memoria para identificarlas como seguras • Address tagging (key): 4 bits en cada puntero • Memory tagging (lock): 4 bits en cada región de 16 bytes de la memoria de aplicaciones • Comparación de key y lock • Las etiquetas de bloques de memoria contiguos son diferentes • Gestionado en hardware: modificación de las instrucciones de load y store • Implementado en la cache
  • 22. La microarquitectura de los procesadores ARM Cortex CPU
  • 23. ARM Cortex CPU • Neoverse: HPC, Cloud, Infraestructura • Cortex-X, Cortex-A: De aplicaciones para sistemas computacionalmente complejos • Cortex-X: Alto rendimiento • Cortex-A: Eficiencia energética
  • 24. • Procesadores multinúcleo heterogéneos • Combinación de núcleos de diferentes características para mejorar la eficiencia energética • Configuración Arm big.LITTLE • Dos tipos de núcleos en el chip • Big para maximizar rendimiento • Little para reducir el consumo de potencia • Configuracion Tri-cluster Cortex-A y Cortex-X en smartphones y tablets
  • 25. Evolución de los cores Cortex-A y Cortex-X Cortex-X Cortex-A Big Cortex-A Little
  • 26. • Varios núcleos de diferentes características • Graphics processing Unit (GPU) • Ray-tracing • Neural networks processing unit (DLA) • Otros aceleradores (ISP, 5G, …) Cortex-A, Cortex-X: system-on-chip (SoC)
  • 27. Tri-cluster: Cortex-X2, Cortex-A710, Cortex-A510 • Evolución de big.LITTLE • Diferentes puntos en la curva de PPA (power, performance, area) • Cortex-X2: “performance first”, a costa de mayor área y potencia • Cortex-A710: optimizado para eficiencia y performance, PPA balanceado • Cortex-A510: power efficiency • Soporte para aplicaciones de 32 bits solo en el Cortex A710
  • 28. • In-order • Microarquitectura merged core: dos núcleos que comparten L2, FP, NEON/SVE2 • Cada núcleo es un núcleo completo con front-end, integer back-end y L1 • Las cargas de trabajo más frecuentes para este núcleo son de enteros • Mejora en área y rendimiento • 2x64-bit o 2x128-bit pipelines • Menos unidades que en los big cores Cortex-A510: energéticamente eficiente
  • 30. Comparación del rendimiento de CPUs Arm y x86 1 núcleo Multinúcleo
  • 31. Edge-cloud computing: ARM Neoverse • Neoverse V: Máximo rendimiento • Neoverse N: rendimiento/W • Neoverse E: Eficiencia • Neoverse V: supercomputadores (HPC) y servidores high-end • Neoverse N: servidores main-stream, DPUs y 5G • Neoverse E: sistemas empotrados
  • 32. Edge-cloud computing: cliente e infraestructura Cortex-A710 Cortex-X2 Cortex-A715 Cortex-X3 Neoverse E1 Neoverse V2
  • 33. HPC con ARM Neoverse: Fujistu Fugaku • A64FX: 1 nodo -> 4 CMGs con • 13 núcleos • 8 MB L2 compartida • Núcleos Neoverse V1 • SVE de 512 bits en cada núcleo • Frecuencia de operación baja para limitar el consumo de potencia (~2.2𝐺𝐻𝑧) • Número 1 en el TOP500: junio 2020 - junio 2022 • 156.976 nodos NUMA A64FX, 52 núcleos por nodo, 7.630.848 núcleos • Tofu NOC: topología de red en forma de torus desarrollado por Fujitsu CMG:
  • 34. HPC y cloud con ARM Neoverse • Otros supercomputadores y cloud con Arm • ETRI • Ampere computing • Nvidia A100 • Google Cloud • Microsoft Azure Cloud • Tencent Cloud • Oracle Cloud • Alibaba Cloud • Sandia National Laboratories • Amazon Web Services (AWS) • SiPearl (European Processor Initiative) • Marvell • …
  • 36. Procesadores en automoción • Toma de autónoma de decisiones y terminación segura de las tareas • En algunos entornos cualquier fallo o malfunción puede ser una amenaza vital • Vehículos autónomos (AV) y ayudas a la conducción (Advanced Driver – Assistance Systems, ADAS) • Automatización industrial • Se requiere alta potencia computacional • Captura y análisis de grandes cantidades de datos • Numerosos sensores (cámaras, LIDAR, GPS, …) • Respuesta en tiempo real para predecir situaciones y posibilitar una respuesta o reacción • Se necesitan soluciones unificadas • La seguridad demanda redundancia a todos los niveles
  • 37. Procesadores en automoción • La industria del automóvil utiliza decenas de ordenadores empotrados en los vehículos • Cambio tecnológico sin parangón en ninguna otra industria • Muy afectada por la carencia de chips y la fragilidad de sus cadenas de suministros • Electrónica y software son esenciales en los vehículos • 100-150 unidades de control electrónico (ECUs) • > 100 millones de líneas de código • 3000 chips de todo tipo • Cerca del 40% del coste es atribuible a electrónica y software (Deloitte) IEEE MIcro DELOITTE TOUCHE TOHMATSU LIMITED • Esfuerzo de integración de sistemas de diferentes OEMs • El test es un reto