Construyendo modelos para dispositivos edge tpu dev fest galiciaMoisés Martínez
En los últimos años, el uso de modelos basados en el Aprendizaje Automático (AA) se ha vuelto muy popular. El AA nos permite construir modelos para la detección/clasificación o regresión de manera sencilla, pero en muchos casos el coste computacional de utilizarlos puede ser muy elevado sobre todo en pequeños dispositivos con baja capacidad de computo, los cuales han comenzado a poblar nuestras casas, oficinas y ciudades. ¿Cómo podemos utilizar nuestros modelos en dispositivos con diferentes capacidades, como por ejemplo las nuevas Edge TPUs?
Acompáñame en esta charla para adentrarnos en lo profundo de TensorFlow para construir modelos utilizando Cloud ML Engine y ejecutarlos en diferentes tipos de dispositivos. Aprendamos como funcionan los dispositivos Edge TPU y como podemos construir modelos para ejecutarlos en ellos.
Advances in the Solution of Navier-Stokes Eqs. in GPGPU Hardware. Modelling F...Storti Mario
In this article we compare the results obtained with an implementation of the Finite Volume for structured meshes on GPGPUs with experimental results and also with a Finite Element code with boundary fitted strategy. The example is a fully submerged spherical buoy immersed in a cubic water recipient. The recipient undergoes an harmonic linear motion imposed with a shake table. The experiment is recorded with a high speed camera and the displacement of the buoy if obtained from the video with a MoCap (Motion Capture) algorithm. The amplitude and phase of the resulting motion allows to determine indirectly the added mass and drag of the sphere.
Advances in the Solution of NS Eqs. in GPGPU Hardware. Second order scheme an...Storti Mario
A Navier-Stokes solver based on Cartesian structured finite volume
discretization with embedded bodies is presented. Fluid structure
interaction with solid bodies is performed with an explicit
partitioned strategy. The Navier-Stokes equations are solved in the
whole domain via a Semi-Implicit Method for Pressure Linked Equations
(SIMPLE) using a colocated finite volume scheme, stabilized
via the Rhie-Chow discretization. As uniform Cartesian grids are used,
the solid interface usually do not coincide with the mesh, and then a
second order Immersed Boundary Method is proposed, in order to avoid
the loss of precision due to the staircase representation of the
surface. This fact also affects the computation of fluid forces on the
solid wall and, accordingly, the results in the fluid-structure
analysis. In the present work, first and second order approximations
for computing the fluid forces at the interface are studied and
compared. The solver is specially oriented to General Purpose Graphic
Processing Units (GPGPU) hardware and the efficiency is
discussed. Moreover, a novel submerged buoy experiment is also
reported and serves to validate the presented fluid-structure
algorithm. The experiment consists of a sphere with positive buoyancy
fully submerged in a cubic tank, subject to harmonic displacements
imposed by a shake table. The sphere is attached to the bottom of
the tank with a string. Position of the buoy is determined from video
records with a Motion Capture algorithm. The obtained amplitude and
phase curves allow a precise determination of the added mass and drag
forces. Due to this aspect the experimental data can be of interest
for the validation of fluid-structure interaction codes. Finally, the
numerical results are compared with the experiments, and allows the
validation of the numerically predicted drag and added mass of the
body.
The resolution of Computational Fluid Dynamics (CFD) problems on Graphic Processing
Units (GPU’s) requires of specialized algorithms due to the particular hardware architecture of these
devices. Algorithms that fall in the category of cellular automata (CA) are the best fitted, for instance
explicit Finite Volume or Finite Element methods. But in the case of incompressible flow it is not possible
to develop a pure explicit algorithm, due to the essentially non-local character of the incompressibility
condition. In this case the algorithms that are closer to an explicit approach, are segregated algorithms,
like the Fractional Step Method. In these algorithms the more time consuming stage is (asymptotically
for large problems) the solution of the Poisson’s equation for pressure. A common choice for it’s solution
is the IOP (Iterated Orthogonal Projection) method, which requires a series of solutions on the complete
mesh. In this work a variant of the IOP, called Accelerated Global Preconditioning (AGP), is proposed.
It is based on using a Preconditioned Conjugate Gradient (which is an accelerated iterative method, in
contrast with the stationary scheme used in IOP ) for the pressure on the fluid, and preconditioning with
the solution on the global domain (fluid and solid). Of course, solving the problem on the global domain
represents more computational work than solving the problem only in the fluid, but this can be faster
in a structured mesh if a fast solvers as Multigrid or Fast Fourier Transform (FFT) is used. The main
advantage of AGP over IOP is that it is an accelerated solver, whereas the IOP is stationary. In addition
AGP iterates only on pressure, whereas IOP iterates on both pressure and velocity.
Construyendo modelos para dispositivos edge tpu dev fest galiciaMoisés Martínez
En los últimos años, el uso de modelos basados en el Aprendizaje Automático (AA) se ha vuelto muy popular. El AA nos permite construir modelos para la detección/clasificación o regresión de manera sencilla, pero en muchos casos el coste computacional de utilizarlos puede ser muy elevado sobre todo en pequeños dispositivos con baja capacidad de computo, los cuales han comenzado a poblar nuestras casas, oficinas y ciudades. ¿Cómo podemos utilizar nuestros modelos en dispositivos con diferentes capacidades, como por ejemplo las nuevas Edge TPUs?
Acompáñame en esta charla para adentrarnos en lo profundo de TensorFlow para construir modelos utilizando Cloud ML Engine y ejecutarlos en diferentes tipos de dispositivos. Aprendamos como funcionan los dispositivos Edge TPU y como podemos construir modelos para ejecutarlos en ellos.
Advances in the Solution of Navier-Stokes Eqs. in GPGPU Hardware. Modelling F...Storti Mario
In this article we compare the results obtained with an implementation of the Finite Volume for structured meshes on GPGPUs with experimental results and also with a Finite Element code with boundary fitted strategy. The example is a fully submerged spherical buoy immersed in a cubic water recipient. The recipient undergoes an harmonic linear motion imposed with a shake table. The experiment is recorded with a high speed camera and the displacement of the buoy if obtained from the video with a MoCap (Motion Capture) algorithm. The amplitude and phase of the resulting motion allows to determine indirectly the added mass and drag of the sphere.
Advances in the Solution of NS Eqs. in GPGPU Hardware. Second order scheme an...Storti Mario
A Navier-Stokes solver based on Cartesian structured finite volume
discretization with embedded bodies is presented. Fluid structure
interaction with solid bodies is performed with an explicit
partitioned strategy. The Navier-Stokes equations are solved in the
whole domain via a Semi-Implicit Method for Pressure Linked Equations
(SIMPLE) using a colocated finite volume scheme, stabilized
via the Rhie-Chow discretization. As uniform Cartesian grids are used,
the solid interface usually do not coincide with the mesh, and then a
second order Immersed Boundary Method is proposed, in order to avoid
the loss of precision due to the staircase representation of the
surface. This fact also affects the computation of fluid forces on the
solid wall and, accordingly, the results in the fluid-structure
analysis. In the present work, first and second order approximations
for computing the fluid forces at the interface are studied and
compared. The solver is specially oriented to General Purpose Graphic
Processing Units (GPGPU) hardware and the efficiency is
discussed. Moreover, a novel submerged buoy experiment is also
reported and serves to validate the presented fluid-structure
algorithm. The experiment consists of a sphere with positive buoyancy
fully submerged in a cubic tank, subject to harmonic displacements
imposed by a shake table. The sphere is attached to the bottom of
the tank with a string. Position of the buoy is determined from video
records with a Motion Capture algorithm. The obtained amplitude and
phase curves allow a precise determination of the added mass and drag
forces. Due to this aspect the experimental data can be of interest
for the validation of fluid-structure interaction codes. Finally, the
numerical results are compared with the experiments, and allows the
validation of the numerically predicted drag and added mass of the
body.
The resolution of Computational Fluid Dynamics (CFD) problems on Graphic Processing
Units (GPU’s) requires of specialized algorithms due to the particular hardware architecture of these
devices. Algorithms that fall in the category of cellular automata (CA) are the best fitted, for instance
explicit Finite Volume or Finite Element methods. But in the case of incompressible flow it is not possible
to develop a pure explicit algorithm, due to the essentially non-local character of the incompressibility
condition. In this case the algorithms that are closer to an explicit approach, are segregated algorithms,
like the Fractional Step Method. In these algorithms the more time consuming stage is (asymptotically
for large problems) the solution of the Poisson’s equation for pressure. A common choice for it’s solution
is the IOP (Iterated Orthogonal Projection) method, which requires a series of solutions on the complete
mesh. In this work a variant of the IOP, called Accelerated Global Preconditioning (AGP), is proposed.
It is based on using a Preconditioned Conjugate Gradient (which is an accelerated iterative method, in
contrast with the stationary scheme used in IOP ) for the pressure on the fluid, and preconditioning with
the solution on the global domain (fluid and solid). Of course, solving the problem on the global domain
represents more computational work than solving the problem only in the fluid, but this can be faster
in a structured mesh if a fast solvers as Multigrid or Fast Fourier Transform (FFT) is used. The main
advantage of AGP over IOP is that it is an accelerated solver, whereas the IOP is stationary. In addition
AGP iterates only on pressure, whereas IOP iterates on both pressure and velocity.
tipos de computadoras y sus perifericos, Supercomputadoras, Mainframe, Minicomputadoras, Microcomputadoras, Accelerati Incredibilus, Blue Gene/P, Puertos de entrada y salida
tipos de computadoras y sus perifericos, Supercomputadoras, Mainframe, Minicomputadoras, Microcomputadoras, Accelerati Incredibilus, Blue Gene/P, Puertos de entrada y salida
An air pulse generating fruit harvesting device that causes the oscillation and detaching of said fruits by fatigue and breakage of the stems of the same, that comprises at least two rotating elements: a first rotating element that generates an air current and a second rotating element that movably guides said pulses of air; and also comprises static blades that guide said air current. A process to harvest fruits with said device.
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaAMADO SALVADOR
Descubre el catálogo general de la gama de productos de refrigeración del fabricante de electrodomésticos Miele, presentado por Amado Salvador distribuidor oficial Miele en Valencia. Como distribuidor oficial de electrodomésticos Miele, Amado Salvador ofrece una amplia selección de refrigeradores, congeladores y soluciones de refrigeración de alta calidad, resistencia y diseño superior de esta marca.
La gama de productos de Miele se caracteriza por su innovación tecnológica y eficiencia energética, garantizando que cada electrodoméstico no solo cumpla con las expectativas, sino que las supere. Los refrigeradores Miele están diseñados para ofrecer un rendimiento óptimo y una conservación perfecta de los alimentos, con características avanzadas como la tecnología de enfriamiento Dynamic Cooling, sistemas de almacenamiento flexible y acabados premium.
En este catálogo, encontrarás detalles sobre los distintos modelos de refrigeradores y congeladores Miele, incluyendo sus especificaciones técnicas, características destacadas y beneficios para el usuario. Amado Salvador, como distribuidor oficial de electrodomésticos Miele, garantiza que todos los productos cumplen con los más altos estándares de calidad y durabilidad.
Explora el catálogo completo y encuentra el refrigerador Miele perfecto para tu hogar con Amado Salvador, el distribuidor oficial de electrodomésticos Miele.
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialAMADO SALVADOR
Explora el catálogo completo de cajas fuertes BTV, disponible a través de Amado Salvador, distribuidor oficial de BTV. Este catálogo presenta una amplia variedad de cajas fuertes, cada una diseñada con la más alta calidad para ofrecer la máxima seguridad y satisfacer las diversas necesidades de protección de nuestros clientes.
En Amado Salvador, como distribuidor oficial de BTV, ofrecemos productos que destacan por su innovación, durabilidad y robustez. Las cajas fuertes BTV son reconocidas por su eficiencia en la protección contra robos, incendios y otros riesgos, lo que las convierte en una opción ideal tanto para uso doméstico como comercial.
Amado Salvador, distribuidor oficial BTV, asegura que cada producto cumpla con los más estrictos estándares de calidad y seguridad. Al adquirir una caja fuerte a través de Amado Salvador, distribuidor oficial BTV, los clientes pueden tener la tranquilidad de que están obteniendo una solución confiable y duradera para la protección de sus pertenencias.
Este catálogo incluye detalles técnicos, características y opciones de personalización de cada modelo de caja fuerte BTV. Desde cajas fuertes empotrables hasta modelos de alta seguridad, Amado Salvador, como distribuidor oficial de BTV, tiene la solución perfecta para cualquier necesidad de seguridad. No pierdas la oportunidad de conocer todos los beneficios y características de las cajas fuertes BTV y protege lo que más valoras con la calidad y seguridad que solo BTV y Amado Salvador, distribuidor oficial BTV, pueden ofrecerte.
1. HPC en MC
Supercomputadoras en carrera
por Mario Storti
´
Centro Internacional de Metodos Computacionales
en Ingenier´a - CIMEC
ı
INTEC, (CONICET-UNL), Santa Fe, Argentina
mario.storti@gmail.com
http://www.cimec.org.ar/mstorti
CIMEC-INTEC-CONICET-UNL 1
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
2. HPC en MC
Supercomputadoras, para que sirven?
De vez en cuando
aparecen en los
´
periodicos noticias
acerca de que se ha
estrenado una
supercomputadora.
¿Que es una super-
computadora?
¿Para que sirve?
¿Son costosas?
CIMEC-INTEC-CONICET-UNL 2
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
3. HPC en MC
´
La supercomputadora mas potente
Actualmente la mas ´
poderosa
supercomputadora
es Jaguar.
Construida por la
firma CRAY,
´
Esta ubicada en Oak
Ridge National
Laboratory. Su
´
potencia de calculo
es 2.3 Petaflops y
´
esta construida en
base a 224.256
procesadores
Opteron y utiliza el
Sistema Operativo
Linux.
CIMEC-INTEC-CONICET-UNL 3
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
4. HPC en MC
Otras supercomputadoras
Roadrunner Mare-Nostrum, construida por IBM,
contructor IBM, para Los Alamos NL, para el gobierno español.
(New Mexico). 1.026Petaflops. 70 Teraflops.
Puesto #1 en top500 hasta Dic 2009. 10.240 procs (2560 x 2 dual-core
12.960 procesadores IBM PowerXCell IBM 64-bit PowerPC 970MP)
+ 6,480 procs AMD Opteron dual-core
CIMEC-INTEC-CONICET-UNL 4
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
5. HPC en MC
¿Como se mide la velocidad de las supercomputadoras?
´
La unidad es el flops: una operacion de punto flotante
(numeros con 10-15 decimales aprox) por segundo,
´
´
puede ser multiplicacion o suma. Se usa con
multiplicadores del SI.
´
Humano con papel y lapiz: 0.01 flops
´ ´
Regla de calculo (precision??): 0.1 flops
Calculadora: 1 flops
´
Eniac: primera computadora electronica 0.5 Kflops
(=500 flops)
Intel i486: 20 Mflops (20.000.000 flops)
Intel Dual core: 5 Gflops (5.000.000.000 flops)
Cluster con 100 procs: 0.5 Tflops (500.000.000.000
flops)
MareNostrum: 70 Tflops (70.000.000.000.000 flops)
Jaguar: 2.3 Pflops (2.300.000.000.000.000 flops)
CIMEC-INTEC-CONICET-UNL 5
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
6. HPC en MC
Aplicaciones cient´ficas de las supercomputadoras
ı
Modelo de la
explosión de
una supernova
Modelo detallado de una molécula de lípido
CIMEC-INTEC-CONICET-UNL 6
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
7. HPC en MC
´ ´
Mecanica de fluidos con reaccion y transporte
COMITENTE: Ente Binacional Yacyreta ´
El chorro de agua que pega sobre la pileta de aquietamiento produce un
alto contenido de burbujas (espuma). El jet arrastra las burbujas al fondo
´
de la pileta. Las altas presiones promueve la disolucion de O2/N2 de la
´
fase gaseosa a la fase liquida y puede producir la sobresaturacion.
compuerta
embalse
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
C
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
s
111111111111111111111111111111111
000000000000000000000000000000000
vertedero A
ga
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
B pileta de
111111111111111111111111111111111
000000000000000000000000000000000
liquido
111111111111111111111111111111111
000000000000000000000000000000000
aquietamiento
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
CIMEC-INTEC-CONICET-UNL 7
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
8. HPC en MC
CIMEC-INTEC-CONICET-UNL 8
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
9. HPC en MC
CIMEC-INTEC-CONICET-UNL 9
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
10. HPC en MC
(launch video spillwgc)
CIMEC-INTEC-CONICET-UNL 10
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
11. HPC en MC
Encendido de una tobera divergente
COMITENTE: ESTEC/ESA (European Space Research and Technology
Centre-European Space Agency, Noordwijk, Holanda), and Open Engineering
(Liege, Belgium).
CIMEC-INTEC-CONICET-UNL 11
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
12. HPC en MC
Encendido de una tobera divergente (cont.)
´
Se calcula la ingnicion de un la tobera divergente de un lanzador en una
´ ´ ´
atmosfera de baja presion. El fluido esta inicialmente en reposo a 143 Pa,
◦
262 K. En el momento de encendido la presion en la tobera sube a
´
◦
5
6×10 Pa, 4170 K. Una onda de choque muy intensa (p1 /p2 > 1000) se
propaga desde la garganta de la tobera hacia la salida. El objetivo de la
´ ´
simulacion es determinar el tiempo que se necesita para llenar la camara
(< 1msec) y el flujo estacionario final.
CIMEC-INTEC-CONICET-UNL 12
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
13. HPC en MC
´
Proteccion contra incendios
COMITENTE: Vialmani S.A., HP-IC
S.A., KB Engineering, para la
´
Ciudad Autonoma de Buenos Aires
La CABA planea techar el corredor
del ferrocarrila Sarmiento por unos
800 m empezando en la estacion ´
de Once.
´
Para un analisis de seguridad entre
otras cosas se calcula el TAE
(“Time Available for Escape”) y el
TNE (for “Time Needed for
Escape”). Para el primero se
simula el encendido de un vagon ´
(1.7 MW, 1500 C, 6 % CO, 1e9 solid
part/m3, 10 micra) para determinar
el TAE.
CIMEC-INTEC-CONICET-UNL 13
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
14. HPC en MC
Estudio de maniobrabilidad en un muelle
COMITENTE: Orengo y C. Ingenier´a (Rosario)
ı
Rio Parana
costa
muelle de barcazas
obra civil
CIMEC-INTEC-CONICET-UNL 14
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
15. HPC en MC
Estudio de maniobrabilidad en un muelle (cont.)
Objetivo: Calcular la intensidad de la turbulencia producida por una
´
construccion civil cerca de un muelle.
zona muelle Puerto San Lorenzo
Rosario
zona muelle
R
io
Pa
ra
na
Rio Parana
CIMEC-INTEC-CONICET-UNL 15
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
16. HPC en MC
Estudio de maniobrabilidad en un muelle (cont.)
CIMEC-INTEC-CONICET-UNL 16
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
17. HPC en MC
Estudio de maniobrabilidad en un muelle (cont.)
(launch video muelle planta) (launch video muelle 3D)
CIMEC-INTEC-CONICET-UNL 17
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
18. HPC en MC
´ ´
Aerodinamica de un auto de competicion
´
COMITENTE: SportTeam Competicion S.A. (9 de Julio, BA)
(launch video bora2) (launch video bora)
CIMEC-INTEC-CONICET-UNL 18
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
19. HPC en MC
´ ´
Sedimentacion de part´culas en un ducto de aspiracion
ı
´
COMITENTE: TERNIUM-SIDERAR (San Nicolas, BA)
CIMEC-INTEC-CONICET-UNL 19
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
20. HPC en MC
Repsol-YPF
•Las linea de transferencia del horno BA-101 ubicado en CILP. •Deposicion ´
de barros en un recipiente de oxo-alcoholes. •Transporte de fases l´quido/gas
ı
en plato distribuidor en un reactor de HDS. •Distribucion l´quido/gas
´ ı
enreactor de gas buteno. •Flujo trifasico de l´quido/gas/solido catalizador en
´ ı ´
reactor de PIB. •Aireacion del standpipe de una planta de cracking catal´tico
´ ı
(FCC).
CIMEC-INTEC-CONICET-UNL 20
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
21. HPC en MC
Otros comitentes
´ ´
INTA (Argeninta e INTEA S.A.) Analisis aerodinamico de un generador de
´
pulsos para la cosecha de frutos (Patente INPI en tramite P070103318).
´
Interfaces S.A. (Buenos Aires) Implementacion de un resolvedor eficiente.
´ ´
Instituto Universitario Aeronautico, Comision Nacional de Investigaciones
´
Espaciales (CNIE). Estudio fluidodinamico de un tanque de combustible
´
de un cohete en rotacion.
´ ´
Unilever. Estudio de refrigeracion en molde para fabricacion de jabon.
CIMEC-INTEC-CONICET-UNL 21
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
22. HPC en MC
Modelo de un brassiere
(launch
video brassiere)
CIMEC-INTEC-CONICET-UNL 22
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
23. HPC en MC
Mec. Comp. visita a los Cazadores de Mitos
CIMEC-INTEC-CONICET-UNL 23
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
24. HPC en MC
´
¿Como funciona la mecanica computacional?
´
Basicamente consiste en
dividir las regiones
ocupadas por el cuerpo o
los fluidos a estudiar en
´ ˜
dominios mas pequenos y
simples, (llamados celdas
hexahedro tetraedro
o elementos) como (cubo) (pirámide de
base triangular)
hexaedros (cubos) o
´
tetrahedros (piramides de
base triangular) cubos.
En cada celda las variables
´
(presion, velocidad,
temperatura) tiene un
comportamiento muy
simple (por ej. se asume
que es constante).
CIMEC-INTEC-CONICET-UNL 24
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
25. HPC en MC
´
¿Como funciona la mecanica computacional? (cont.)
De esta forma se llegan a sistemas de
ecuaciones en las cantidades para
cada celda.
2x + 3y − z = 5
3x − y + z = 4
x + y − 2z = 1
´
En los modelos por mecanica
computacional, se resuelven sistemas
con millones de ecuaciones. Este es el
´
punto que necesita mas tiempo de
´
calculo.
´ ´
T´picamente para un problema con 1 millon de incognitas se necesitan
ı
realizar 100 Gflop (1Gflop= 1000.000.000 de operaciones). En una PC de
escritorio normal (5 Gflops), esto tardar´a unos 20 segundos, pero esto hay
ı
que a su vez realizarlo miles de veces (por cada cuadro del video), de manera
´
que estos calculos tardan desde horas hasta semanas.
CIMEC-INTEC-CONICET-UNL 25
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
26. HPC en MC
´
Ingredientes de la Mecanica Computacional
T IC A
EN EMA
IS TA ACIONAL
T
IAL MPUT
ICA
MA
C
PE CO
ES A
C IS MA
NI
OR TICA
F
INF TENCIA
C A
ME
PO DE
PERCOM CALC
(SU PU
TA
ULO
CIO
N)
CIMEC-INTEC-CONICET-UNL 26
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
27. HPC en MC
´
Evolucion de las supercomputadoras
˜
Ley de Moore: la potencia de las computadoras se duplica cada ano.
SUMA DE TODAS LAS
COMPUTADORAS
Ley de Moore
COMPUTADORA
MÁS RÁPIDA
(ROADRUNNER)
COMPUTADORA #500
6-8 años
MI LAPTOP
CIMEC-INTEC-CONICET-UNL 27
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
28. HPC en MC
Necesidad de paralelismo
Computadoras en paralelo
Incremento del
paralelismo
Procesadores
secuenciales
Frecuencia de los
procesadores
CIMEC-INTEC-CONICET-UNL 28
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
29. HPC en MC
´
Paralelismo por descomposicion de dominio
switch (red)
Una forma de usar la
potencia de varias
computadoras para
´ ´
resolver mas rapido un
problema es dividir la
´
region en subdominios
´ ˜
mas pequenos y procesar
cada uno en una
S4 S2
computadora. S3
Las computadoras cuyos
subdominios se tocan
deben intercambiar S1
´
informacion. Esto se hace S5
´
a traves del hardware
(equipamiento) de red. descomposición en subdominios
de un modelo de mecánica computacional
CIMEC-INTEC-CONICET-UNL 29
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
30. HPC en MC
El proyecto Beowulf
Las supercomputadoras eran El heroe legendario
´
equipamiento muy caro, utilizado solo en Beowulf acabando con
el monstruo Grendel
los grandes laboratorios.
El proyecto Beowulf del Goddard Flight
´
Space Center de la NASA desarrollo el
know-how necesario para contruir
supercomputadoras con equipamiento de
bajo costo (COTS). Los componentes
principales son:
´
Equipamiento informatico de bajo costo
(COTS). PC’s y red Ethernet (100 Mbs o
1 Gbs).
Sistemas operativos abiertos (Linux,BSD) Primer cluster Beowulf
construido en el laboratorio
Librer´as de paso de mensajes (PVM, MPI)
ı
Goddard de la NASA
CIMEC-INTEC-CONICET-UNL 30
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
31. HPC en MC
Procesamiento en paralelo masivo, SETI@HOME
El proyecto SETI (Search for
Extra-Terrestrial Intelligence) se basa
en procesar ondas de radio con radio
telescopios en la busqueda de
´
˜
capturar senales producidas por
civilizaciones extraterrestres.
El cuello de botella es el
˜
procesamiento de la senal, que
demanda mucho tiempo de computo.´
SETI@Home permite que usuarios
apoyen al proyecto corriendo en sus
˜
computadoras hogarenas una
´
aplicacion que utiliza la potencia de
´ ´
calculo ociosa de la maquina para
˜
porcesar las senales.
Es un ejemplo de computacion ´
distribuida voluntaria.
CIMEC-INTEC-CONICET-UNL 31
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
32. HPC en MC
RSA Factoring Challenge
clave "privada"
La criptograf´a actual se basa en claves
ı primos
privadas y publicas. La privada es un par
´
de numeros primos mientras que la
´ 98947 x 88667
publica es el producto de ellas.
´ = 8864128657
La clave publica de un banco es conocida
´
por todos, pero si alguien logra descubrir
clave "p'ublica"
cuales son los dos primos que la forman,
entonces puede desencriptar toda la
´
informacion. RSA-129=
Pero se puede demostrar que el tiempo de 11438162575788886766923577
99761466120102182967212423
´
calculo necesario para hacer esa 62562561842935706935245733
89783059712356395870505898
=
´
factorizacion crece much´simo con el
ı 9075147599290026879543541
numero de d´gitos de la clave publica.
´ ı ´
34905295108476509491478496
El RSA propuso una serie de desaf´os. el
ı 19903898133417764638493387
x
RSA-129 fue crackeado en 1994 por un 843990820577
´
equipo que hac´a computacion distribuida
ı
voluntaria en 1600 computadoras 32769132993266709549961988
19083446141317764296799294
˜
hogarenas. 2539798288533
CIMEC-INTEC-CONICET-UNL 32
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
33. HPC en MC
Clusters en CIMEC
GERONIMO. 1998
Todos: 10 x Pentium IV, 2.8 Ghz,
Sistema 100 Mbs Ethernet
10 Gflops
operativo: Red
Hat Linux, AQUILES, 2003
Fedora Linux PME 2003 ANPCYT.
Consorcio de 5 grupos
Sin disco duro
de INTEC y FI CH-UNL.
(diskless)
85xPentium IV, 3GHz,
booteo por
red Gigabit Ehernet
diskette o por
PXE (Ware-
Wulf/Perceus). COYOTE, 2007, 8 nodos
Software 2 x Xeon E5420
instalado: MPI, 64 núcleos en total
PETSc, red Ethernet Gigabit
compiladores
GNU, Intel,
PETSc-FEM, NIKOLA, 2010
server Intel i7 950 @ 3.07GHz
Fluent, CFX. 2 GPU's Nvidia Tesla C1060
CIMEC-INTEC-CONICET-UNL 33
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
34. HPC en MC
PETSc-FEM
encendido de
aerodinámica un motor cohete
impacto ambiental
´
Programa de Mecanica
Computacional (Elementos aeroespacial
Finitos) para resolver
´
problemas de mecanica de
fluidos.
Desarrollado en el CIMEC.
Usa procesamiento en
paralelo
convección natural
(MPI/PETSc/OpenMP)
Es software libre
(http://www.cimec.
org.ar/petscfem) contenedores
de líquidos
CIMEC-INTEC-CONICET-UNL 34
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
35. HPC en MC
´
El problema termico
´
Un inconveniente importante en la operacion de supercomputadoras es el
´
problema termico.
Cada procesador puede disipar aprox. 100W, esto puede hace que haga
falta remover grandes cantidades de energ´a.
ı
En el CIMEC: potencia total de 30kW. Tenemos instaladas 45.000 frigor´as
ı
´
de refrigeracion. Sistema de alarma de temperatura con monitoreo.
´
Sistema de monitoreo por software con notificacion por e-mail.
En general entre 250 y 750
Mflops/Watt. MareNostrum, Barcelona
PC de escritorio: 5 Gflops, 100W,
50 Mflops/Watt (muy ineficiente).
Jaguar: 7.5 MW (250 Mflops/Watt)
(ineficiente)
Forschungszentrum Juelich (FZj): sistema de enfrimamiento
´
posicion 110 en top500, 42
Teraflops, 59kW, (722 Mflops/Watt)
´
(muy eficiente termicamente)
switch de comunicaciones
CIMEC-INTEC-CONICET-UNL 35
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
36. HPC en MC
Confiabilidad
Cuando una computadora procesa
pueden producirse errores por
fallas de software y/o de hardware.
El tiempo medio entre fallas
(MTBF, Mean Time Between
Failures) por hardware para una
computadora de escritorio puede Probabilidad de que
estar en aprox. MTBF=100 d´as, es
ı un rayo cósmico caiga
sobre la T ierra
decir una falla cada 100 d´as.
ı
Una fuente de errores de hardware
´
son los rayos cosmicos
LHC = Large Hadron Collider
Cuando hay digamos N=100 (La "Máquina de Dios")
computadoras, entonces el MTBF Partícula "Oh-My-God"
del conjunto baja en un factor 100,
es decir que tendremos un MTBF
del conjunto de una falla por d´a.
ı
CIMEC-INTEC-CONICET-UNL 36
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
37. HPC en MC
Calculando “en tiempo real”
CIMEC-INTEC-CONICET-UNL 37
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
38. HPC en MC
´
Uso de GPU’s en Mecanica Computacional
´
Para el procesamiento grafico en juegos y
˜ ´
servidores para diseno grafico y otras
aplicaciones demandantes se utilizan
tarjetas aceleradoras (GPU = Graphic
Processing Unit). Por ej. Nvidia GeForce,
adictos a los
ATI Radeon, ... videojuegos!!
Estas placas tienen muchos procesadores
´
(mas de 100) y su propia memoria server con
8 Teslas
RAM(desde 512MB hasta varios GB).
´
Su potencia de calculo se estima en
1 Teraflops (aprox 200 PC’s).
Desde hace un tiempo se viene estudiando
NVidia Tesla C1060 1Tflop
la posibilidad de utilizar estas tarjetas para
´
realizar calculos de utilidad en ingenier´a. ı
Nuestro plan es utilizar estas GPU’s dentro
´
del proyecto de calculo en Real Time de
Sergio Idelsohn. (launch video nsfvm-bodies-all)
CIMEC-INTEC-CONICET-UNL 38
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
39. HPC en MC
´
¿Rapidez o precision?
- Homero, RAPIDO,
cuánto es 2+2?
- Da 5
- No, animal!! Es 4!!
Pero a veces querer - Bueno, tu me
dijiste RAPIDO,
´
obtener resultados rapido no PRECISO!!!
va en sentido contrario a la
´
precision.
´
Por ejemplo los metodos
´
que van muy rapido en
GPU’s se basan en usar Auto modelado con LBM
mallas estructuradas, lo
cual genera superficies
tipo Lego.
RAPI
Estas superficies dan
DE
mucho error, por ejemplo
Z
PRECI
al calcular la resistencia al
avance (drag) de un esfera hecha con Lego
IO
´
veh´culo aerodinamico, o
ı S N
el intercambio de calor. El Yin-Yang de la
Mecánica Computacional
CIMEC-INTEC-CONICET-UNL 39
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))
40. HPC en MC
Agradecimiento
Este trabajo ha recibido financiamiento de Consejo Nacional de
´
Investigaciones Cient´ficas y Tecnicas (CONICET, Argentina, PIP 5271/05),
ı
Universidad Nacional del Litoral (UNL, Argentina, grants CAI+D 2005-10-64) y
´ ´
Agencia Nacional de Promocion Cient´fica y Tecnologica (ANPCyT, Argentina,
ı
grants PICT PME 209/2003, PICT-1141/2007, PICT-1506/2006).
Hemos hecho uso de Software Libre (http://www.gnu.org) como
GNU/Linux OS, MPI, PETSc, compiladores GCC/G++, Octave, Open-DX, VTK,
´
Python, Git, entre otros. Ademas muchas ideas tomadas de estos paquetes
nos han inspirado para escribir nuestras aplicaciones.
CIMEC-INTEC-CONICET-UNL 40
((version texstuff-1.2.0-25-gfa23cc8 Sun Aug 19 22:39:36 2012 -0300) (date Thu Aug 23 18:49:15 2012 -0300))