SlideShare una empresa de Scribd logo
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




        Eficiencia Energética más allá del PUE:
             Explotando el Conocimiento de la
                     Aplicación y los Recursos
                                    José M. Moya <jm.moya@upm.es>
                                    Laboratorio de Sistemas Integrados



                                    José M.Moya | Madrid (Spain), June 12, 2012   1
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                                  Contenido
“Ingeniamos el futuro”




    • Motivación
    • Nuestro enfoque
            – Planificación y gestión
              de recursos
            – Optimización de
              máquinas virtuales
            – Gestión de modos de
              bajo consumo
            – Diseño de procesadores
    • Conclusiones

                                    José M.Moya | Madrid (Spain), June 12, 2012     2
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                                  Motivación
“Ingeniamos el futuro”



     • Consumo energético en data centers
             – 1.3% de la producción energética mundial en 2010
             – USA: 80 mill MWh/año en 2011 = 1,5 x NYC
             – 1 datacenter = 25 000 casas
     • Más de 43 Millones de Toneladas de CO2 / año
       (2% mundial)
     • Más agua que la industria del
       papel, automóvil, petróleo, madera o plástico
                          Jonathan Koomey. 2011. Growth in Data center electricity use 2005 to 2010



                                    José M.Moya | Madrid (Spain), June 12, 2012      3
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                                                        Motivación
“Ingeniamos el futuro”                                                                35000




                                                        World server installed base
                                                                                      30000

• Se espera que la electricidad                                                       25000




                                                               (thousands)
                                                                                      20000                               High-end servers
  total utilizada por los data                                                        15000                               Mid-range servers
                                                                                      10000
  centers en 2015 exceda los                                                           5000
                                                                                                                          Volume servers

  400 GWh/año.                                                                              0
                                                                                            2000      2005         2010

• El consumo de energía de la                                                         5,75 Millones de servidores nuevos / año
  refrigeración continuará                                                            10% de servidores sin utilizar (CO2 de 6,5
  teniendo una importancia                                                            millones de coches)
  similar o superior al consumo
                                                                                      300
  de la computación                                                                   250                                 Infrastructure
                                                        (billion kWh/year)
                                                          Electricity use




                                                                                      200                                 Communications
• La optimización energética                                                          150                                 Storage

  de los data centers del futuro                                                      100                                 High-end servers
                                                                                       50                                 Mid-range servers
  requerirá un enfoque global                                                           0                                 Volume servers
  y multi-disciplinar.                                                                  2000         2005          2010




                                    José M.Moya | Madrid (Spain), June 12, 2012                                4
CAMPUS OF                        Problemas de fiabilidad
                         INTERNATIONAL
                         EXCELLENCE               que dependen de la temperatura
“Ingeniamos el futuro”




                               ✔
                                Electromigration (EM)
                                                                           ✖
                                                              Time-dependent
                                                               dielectric-
                                                        breakdown (TDDB)

                                                     Stress
                                                     migration (SM)
                                                                                  ✖
                                                  ✖                    Thermal
                                                                    cycling (TC)
                                    José M.Moya | Madrid (Spain), June 12, 2012    5
CAMPUS OF
                                                                             Refrigeración de
                                                                              un data center
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




                                    José M.Moya | Madrid (Spain), June 12, 2012     6
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                       Mejoras en servidores
“Ingeniamos el futuro”




               • Virtualización
                                                                - 27%
               • Servidores conforme a
                 Energy Star
                                                                                  = 6.500

               • Mejor planificación de
                 capacidad                                      2.500

                                    José M.Moya | Madrid (Spain), June 12, 2012    7
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                             Mejoras en refrigeración
“Ingeniamos el futuro”




    • Mejoras en gestión de flujos de aire y rangos
      de temperatura ligeramente más amplios
             Reducción del consumo
             hasta un          25%                           25.000
             Recuperación de la inversión
             en solo         2 años

                                    José M.Moya | Madrid (Spain), June 12, 2012   8
CAMPUS OF
                         INTERNATIONAL           Mejoras en infraestructura
                         EXCELLENCE
“Ingeniamos el futuro”




    CA  CC
            – 20% reducción de pérdidas de conversión
            – 47 millones de dólares de gastos
              inmobiliarios por data center
            – Mayor eficiencia, ahorro de energía suficiente para
                 cargar un iPad durante                     70 millones de años
                                    José M.Moya | Madrid (Spain), June 12, 2012   9
CAMPUS OF
                                                              Mejores prácticas de
                                                              eficiencia energética
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




                                    José M.Moya | Madrid (Spain), June 12, 2012   10
CAMPUS OF
                                                                    PUE
                                               Power Usage Effectiveness
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




    • Estado del arte: PUE ≈ 1,2
            – La parte importante es el consumo de computación
            – El trabajo en eficiencia energética en DC está centrado
              en la reducción del PUE
            – Reducir PIT no reduce el PUE, pero se nota en la
              factura de la luz
    • ¿Cómo se puede reducir PIT ?
                                    José M.Moya | Madrid (Spain), June 12, 2012   11
CAMPUS OF
                                             Ahorro energético según el
                                                   nivel de abstracción
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




                                    José M.Moya | Madrid (Spain), June 12, 2012   12
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                      Nuestro enfoque
“Ingeniamos el futuro”




    • Estrategia global para permitir la utilización de
      múltiples fuentes de información y para coordinar las
      decisiones con el fin de reducir el consumo total
    • Utilización del conocimiento de las características de
      demanda energética de las aplicaciones y las
      características de los recursos de computación y
      refrigeración para aplicar técnicas proactivas de
      optimización


                                    José M.Moya | Madrid (Spain), June 12, 2012   13
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                      Enfoque holístico
“Ingeniamos el futuro”




                                              Chip        Server         Rack     Room    Multi-
                                                                                          room
                Sched & alloc                                 2                    1

                app

                OS/middleware

                Compiler/VM                                   3                    3

                architecture                                  4                    4

                technology                       5




                                    José M.Moya | Madrid (Spain), June 12, 2012          14
CAMPUS OF
                                                                     1. Gestión de recursos
                         INTERNATIONAL
                         EXCELLENCE                                              en la sala
“Ingeniamos el futuro”




                                              Chip        Server         Rack     Room    Multi-
                                                                                          room
                Sched & alloc                                 2                    1

                app

                OS/middleware

                Compiler/VM                                   3                    3

                architecture                                  4                    4

                technology                       5




                                    José M.Moya | Madrid (Spain), June 12, 2012          15
CAMPUS OF
                         INTERNATIONAL       Aprovechando la heterogeneidad
                                                                                  CCGrid 2012
                         EXCELLENCE
“Ingeniamos el futuro”



    • Utilización de la heterogeneidad para minimizar el
      consumo energético desde un punto de vista
      estático/dinámico
            – Estático: Encontrar el mejor set-up del datacenter,
              dado un número heterogéneo de máquinas
            – Dinámico: Optimización de la asignación de tareas en
              el Resource Manager
    • Demostramos que la mejor solución se encuentra
      en un datacenter heterogéneo
            – Muchos datacenters son heterogéneos (diversas
              generaciones de máquinas)
                          M. Zapater, J.M. Moya, J.L. Ayala. Leveraging Heterogeneity for
                          Energy Minimization in Data Centers, CCGrid 2012

                                    José M.Moya | Madrid (Spain), June 12, 2012       16
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                      Escenario actual
“Ingeniamos el futuro”




                                             Scheduler                            Resource
             WORKLOAD
                                                                                  Manager

                                                                                                  Execution




                                    José M.Moya | Madrid (Spain), June 12, 2012              17
CAMPUS OF
                                                                   Potencial de mejora
                                                                  con mejores prácticas
                              INTERNATIONAL
                              EXCELLENCE
“Ingeniamos el futuro”



                              Total power (computing and cooling) for various scheduling approaches

                   1400                                     max computing power, worst thermal placement
                                                            min computing power, worst thermal placemenit
                                                                                optimal computing+cooling
                   1200                                            optimal computing+cooling, shut off idles
                                                   optimal computing+cooling, shut off idles, no recirculation
                   1000
      Power (KW)




                                          savings by minimizing computing power
                                 savings by minimizing the recirculation’s effect
                    800                  savings by turning off idle machines
                                       unaddressed heat recirculation cost
                    600                         basic (unavoidable) cost

                    400

                    200

                      0
                          0                   20                 40                 60                80         100
                                                   job size relative to data center capacity (%)

                     José
                          operation cost (in kilowatts) for various “savings
     Fig. 3. Data center M.Moya | Madrid (Spain), June 12, 2012 18
energy consume




                                                                                                                                                         energy consume
                                                                                                                                                                                     20



                                                                                                       Planificación y asignación de recursos
                                              100

                                                                                                                                                                                     15

                                                       CAMPUS OF
                                                                                                                consciente de la refrigeración
                                                                                                                                                                                     10
                                                       INTERNATIONAL
                                               50


                                                       EXCELLENCE                                                                                                                     5

                                                0



                                                                                                                               iMPACT Lab (Arizona State U)
                                                                                                                                                                                      0
“Ingeniamos el futuro”                                              FCFS-FF       FCFS-LRH            EDF-LRH          FCFS-Xint         SCINT                                                               FCFS-FF      FCFS-LRH             EDF-LRH          FCFS-Xint         SCINT

                                                                                             (a)                                                                                                                                       (b)
                                                     Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers on                                                          Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers off
                                                                                                                                                                                     40    Energy consumption, Scenario (a) 40 jobs, 25014 core-hours, idle servers off
                                                      Energy consumption, Scenario (a) 40 jobs, 25014 core-hours,energy
                                                                                                          cooling idle servers on                                                                                                               cooling energy
                                                                                                                          computing energy                                                                                                                          computing energy
                                                                                                                                                                                     40                                                                               cooling energy
                                              300 Throughput         0.580 jobs/hr 0.580 jobs/hr 0.349 jobs/hr 0.580 cooling energy
                                                                                                                     jobs/hr 0.254 jobs/hr                                           35                                                                             computing energy
                                               200 Turnaround time 8.98 hr                                        computing energy
                                                                                      8.98 hr          12.17 hr         8.98 hr          48.49 hr
                                                                                                                                                                                            Throughput        0.580 jobs/hr    0.580 jobs/hr    0.349 jobs/hr     0.580 jobs/hr   0.427 jobs/hr
                                                      Alg. runtime    170 ms          186 ms           397 ms           40.8 min         88.6 min                                    35
                                              250     Energy savings 0.197 jobs/hr
                                                       Throughput       0%             0.197 jobs/hr
                                                                                       1.7%            0.172 jobs/hr
                                                                                                        4.1%            0.197 jobs/hr
                                                                                                                         3.6%            0.163 jobs/hr
                                                                                                                                          4.7%                                       30     Turnaround time
                                                                                                                                                                                            Throughput
                                                                                                                                                                                                              8.98 hr
                                                                                                                                                                                                              0.197 jobs/hr
                                                                                                                                                                                                                               8.98 hr
                                                                                                                                                                                                                               0.197 jobs/hr
                                                                                                                                                                                                                                                12.17 hr
                                                                                                                                                                                                                                                0.172 jobs/hr
                                                                                                                                                                                                                                                                  8.98 hr
                                                                                                                                                                                                                                                                  0.197 jobs/hr
                                                                                                                                                                                                                                                                                  17.75 hr
                                                                                                                                                                                                                                                                                  0.163 jobs/hr
                                                                                                                                                                                            Alg. runtime      171 ms           186 ms           397 ms            42 min          100 min
                  energy consumed (GJ) (GJ)




                                                                                                                                                         energy consumed (GJ) (GJ)
                                                       Turnaround time 18.41 hr        18.41 hr        20.75 hr         18.41 hr         51.75 hr                                           Turnaround time   18.41 hr         18.41 hr         20.75 hr          18.41 hr        38.02 hr
                                                       Alg. runtime    3.4 ms          6.9 ms          213 ms           23 min           40 min                                      30     Energy savings      0%              4.0%             14.6%             14.2%           15.1%
                                                                                                                                                                                     25     Alg. runtime      3.4 ms           6.9 ms           213 ms            23 min          43 min
                       energy consumed




                                                                                                                                                              energy consumed
                                               150
                                              200
                                                       Energy savings    0%             6.2%            8.6%              8.7%            10.2%
                                                                                                                                                                                            Energy savings      0%              11.8%            54.7%             21.8%           60.5%
                                                                                                                                                                                     25
                                                                                                                                                                                     20
                                              150
                                                                                                                                                                                     20
                                              100                                                                                                                                    15

                                              100                                                                                                                                    15
                                                                                                                                                                                     10

                                                50
                                               50                                                                                                                                    10
                                                                                                                                                                                      5

                                                                                                                                                                                      5
                                                0                                                                                                                                     0
                                                                    FCFS-FF       FCFS-LRH            EDF-LRH          FCFS-Xint         SCINT                                                               FCFS-FF      FCFS-LRH             EDF-LRH          FCFS-Xint         SCINT
                                                 0                                                                                                                                    0
                                                                     FCFS-FF               (c)
                                                                                     FCFS-LRH EDF-LRH                  FCFS-Xint         SCINT                                                               FCFS-FF             (d)
                                                                                                                                                                                                                          FCFS-LRH EDF-LRH                      FCFS-Xint         SCINT

                                                     Energy consumption, Scenario (c)(a) jobs, 45817 core-hours, idle servers on
                                                                                      174                                                                                                  Energy consumption, Scenario (c)(b) jobs, 45817 core-hours, idle servers off
                                                                                                                                                                                                                            174

                                                     Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers on
                                                                                                          cooling energy                                                                   Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers off
                                                                                                                                                                                                                                                 cooling energy
                                                                                                                          computing energy                                                                                                                          computing energy
                                              450
                                                                                                                             cooling energy                                          40                                                                               cooling energy
                                                      Throughput     0.892 jobs/hr    0.892 jobs/hr    0.861 jobs/hr    0.892 jobs/hr energy
                                                                                                                           computing 0.561 jobs/hr                                   100  Throughput                                                   computing
                                                                                                                                                                                                          0.892 jobs/hr 0.892 jobs/hr 0.861 jobs/hr 0.892 jobs/hr             energy
                                                                                                                                                                                                                                                                               0.590 jobs/hr
                                              400                                                                                                                                         Turnaround time 9.99 hr        9.99 hr       13.39 hr     9.99 hr                       61.49 hr
                                               300 Turnaround time 9.99 hrjobs/hr 9.99 hrjobs/hr 13.39 hr
                                                    Throughput        0.580        0.580
                                                                                                               9.99 hr       65.38 hr
                                                                                                 0.349 jobs/hr 0.580 jobs/hr 0.254 jobs/hr                                           35   Alg. runtime    173 ms         191 ms        346 ms       21 min                        147 min
                                                   Alg. runtime time 173 ms
                                                    Turnaround        8.98 hr     196 ms
                                                                                   8.98 hr       346 ms
                                                                                                 12.17 hr      20 min
                                                                                                               8.98 hr       142 min
                                                                                                                             48.49 hr                                                     Energy savings   0.0%           7.5%          17.3%        25.7%                         41.4%
                                              350                                                                                                                                        Throughput      0.580 jobs/hr 0.580 jobs/hr 0.349 jobs/hr 0.580 jobs/hr                  0.427 jobs/hr
                  energy consumed (GJ) (GJ)




                                                                                                                                                         energy consumed (GJ) (GJ)
                                                      Energy savings 170 ms
                                                       Alg. runtime   0%              2.5%
                                                                                      186 ms            5.9%
                                                                                                       397 ms             9.4%
                                                                                                                         40.8 min        12.5%
                                                                                                                                         88.6 min                                     80
                                               250     Energy savings  0%              1.7%             4.1%              3.6%            4.7%                                       30 Turnaround time 8.98 hr         8.98 hr       12.17 hr      8.98 hr                       17.75 hr
                                              300                                                                                                                                        Alg. runtime    171 ms         186 ms        397 ms        42 min                        100 min
                      energy consumed




                                                                                                                                                             energy consumed             Energy savings    0%            4.0%          14.6%         14.2%                         15.1%
                                                                                                                                                                                     25
                                              250
                                               200                                                                                                                                    60

                                              200                                                                                                                                    20
                                               150                                                                                                                                    40
                                              150
                                                                                                                                                                                     15

                                               100
                                              100
                                                                                                                                                                                      20
                                                                                                                                                                                     10
                                               50
                                                50
                                                                                                                                                                                      5
                                                0                                                                                                                                      0
                                                                    FCFS-FF       FCFS-LRH            EDF-LRH          FCFS-Xint         SCINT                                                                FCFS-FF         FCFS-LRH          EDF-LRH          FCFS-Xint        SCINT
                                                 0                                                                                                                                    0
                                                                     FCFS-FF               (e)
                                                                                     FCFS-LRH EDF-LRH                  FCFS-Xint         SCINT                                                               FCFS-FF             (f)
                                                                                                                                                                                                                          FCFS-LRH EDF-LRH                      FCFS-Xint         SCINT

                                                  (c)                                                                        (d)
                 Fig. 8. Energy comparison of the simulated schemes for the three scenarios. The plots correspond in respective positions to the plots of Figure 7.
                                                     Energy consumption, Scenario (c) 174 jobs, 45817 core-hours, idle servers on                                                          Energy consumption, Scenario (c) 174 jobs, 45817 core-hours, idle servers off

                                                                                      José M.Moya | cooling energy (Spain), June 12, 2012
                                                                                                    Madrid                                                                                                                                                        19 cooling energy
                policy used in the data center, which enables energy execution as soon as they arrive if the queue is empty and the data
                    450
                                                        computing
                                                                  job                                                   computing energy

                                                       Throughput     0.892 jobs/hr   0.892 jobs/hr    0.861 jobs/hr     0.892 jobs/hr   0.561 jobs/hr                               100     Throughput        0.892 jobs/hr    0.892 jobs/hr    0.861 jobs/hr    0.892 jobs/hr   0.590 jobs/hr
                                              400
CAMPUS OF                 Planificación y asignación de
                         INTERNATIONAL
                         EXCELLENCE         recursos consciente de la aplicación
                                                                                                  LSI-UPM
“Ingeniamos el futuro”




                                                                                  Resource
          WORKLOAD                                                                Manager
                                                                                  (SLURM)
                                                                                                  Execution


                                         Profiling and                        Energy
                                         Classification                     Optimization




                                    José M.Moya | Madrid (Spain), June 12, 2012              20
CAMPUS OF                 Planificación y asignación de
                         INTERNATIONAL
                         EXCELLENCE         recursos consciente de la aplicación
                                                                                   Escenario
“Ingeniamos el futuro”




    • Workload:
            – 12 tareas del benchmark SpecCPU 2006
            – Workload aleatorio de 2000 tareas, dividido en job sets
            – Tiempo de llegada aleatorio entre job sets
    • Servidores:




                                    José M.Moya | Madrid (Spain), June 12, 2012   21
CAMPUS OF                 Planificación y asignación de
                         INTERNATIONAL
                         EXCELLENCE         recursos consciente de la aplicación
                                                                            Profiling de energía
“Ingeniamos el futuro”




                                                                                  Resource
          WORKLOAD                                                                Manager
                                                                                  (SLURM)
                                                                                                  Execution


                                         Profiling and                        Energy
                                         Classification                     Optimization


                                    Energy profiling




                                    José M.Moya | Madrid (Spain), June 12, 2012              22
CAMPUS OF
                                                             Caracterización de la
                                                                 carga de trabajo
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




                                    José M.Moya | Madrid (Spain), June 12, 2012   23
CAMPUS OF
                         INTERNATIONAL                              Trabajo realizado
                                                                                      Optimizaciones
                         EXCELLENCE
“Ingeniamos el futuro”




                                                                                  Resource
          WORKLOAD                                                                Manager
                                                                                  (SLURM)
                                                                                                   Execution


                                         Profiling and                        Energy
                                         Classification                     Optimization

                                                                           Energy Minimization:
                                                                           • Minimization subjected to constraints
                                                                           • MILP problem (solved with CPLEX)
                                                                           • Static and Dynamic


                                    José M.Moya | Madrid (Spain), June 12, 2012               24
CAMPUS OF                 Planificación y asignación de
                         INTERNATIONAL
                         EXCELLENCE         recursos consciente de la aplicación
“Ingeniamos el futuro”
                                                                     Optimización estática
    • Definición del datacenter óptimo
            –    Dado un pool de 100 máquinas de cada
            –    1 job set del workload
            –    El optimizador escoge los mejores servidores
            –    Constraints de presupuesto y espacio
                                                                                  Mejor solución:
                                                                                  • 40 Sparc
                                                                                  • 27 AMD

                                                                                  Ahorros:
                                                                                  • 5 a 22% en energía
                                                                                  • 30% tiempo




                                    José M.Moya | Madrid (Spain), June 12, 2012   25
CAMPUS OF                 Planificación y asignación de
                         INTERNATIONAL
                         EXCELLENCE         recursos consciente de la aplicación
“Ingeniamos el futuro”
                                                                 Optimización dinámica
    • Asignación óptima del workload
            – Uso del workload completo (2000 tareas)
            – El algoritmo encuentra una buena asignación (no la mejor)
              en términos de energía
            – Ejecución del algoritmo en runtime

                                                                                       Ahorros del 24%
                                                                                       al 47% en energía




                                    José M.Moya | Madrid (Spain), June 12, 2012   26
CAMPUS OF                 Planificación y asignación de
                         INTERNATIONAL
                         EXCELLENCE         recursos consciente de la aplicación
“Ingeniamos el futuro”
                                                                                  Conclusiones
    • Primera prueba de concepto en cuanto a ahorros
      energéticos gracias a heterogeneidad
    • Solución automática
    • La solución automática de procesadores ofrece
      notables ahorros energéticos.
    • La solución puede ser fácilmente implementable en
      un entorno real
            – Uso del Resource Manager SLURM
            – Workloads y servidores más realistas

                                    José M.Moya | Madrid (Spain), June 12, 2012     27
CAMPUS OF
                                                                     2. Gestión de recursos
                         INTERNATIONAL
                         EXCELLENCE                                           en el servidor
“Ingeniamos el futuro”




                                              Chip        Server         Rack     Room    Multi-
                                                                                          room
                Sched & alloc                                 2                    1

                app

                OS/middleware

                Compiler/VM                                   3                    3

                architecture                                  4                    4

                technology                       5




                                    José M.Moya | Madrid (Spain), June 12, 2012          28
CAMPUS OF                            Políticas de planificación y
                            INTERNATIONAL
                            EXCELLENCE                   asignación de recursos en MPSoCs
  “Ingeniamos el futuro”
                                                        UCSD – System Energy Efficiency Lab
       A. Coskun , T. Rosing , K. Whisnant and K. Gross "Static and dynamic temperature-
       aware scheduling for multiprocessor SoCs", IEEE Trans. Very Large Scale Integr. Syst.,
       vol. 16, no. 9, pp.1127 -1140 2008




Fig. 3. Distribution of thermal hot spots, with with DPM (ILP).
     Fig. 3. Distribution of thermal hot spots, DPM (ILP).        Fig. 4. Distribution of spatial gradients, with with DPM (ILP).
                                                                       Fig. 4. Distribution of spatial gradients, DPM (ILP).


    A. Static Scheduling Techniques
A. Static Scheduling Techniques                                     hot spots. While Min-Th reduces the spatial differentials
                                                                hot spots. While Min-Th reduces the highhigh spatial differentials
   We We next provideextensive comparison of the ILP ILP based above 15 we observe a substantial increase in the spatial
       next provide an an extensive comparison of the based above 15 C, C, we observe a substantial increase in the spatial
                                      José M.Moya | Min-Th&Sp. gradients
techniques. We refer to to static approach as as Madrid (Spain), June 12, above 10 C. C. In contrast, method achieves lower
    techniques. We referour our static approach Min-Th&Sp. gradients 2012above 10 In contrast,29 our method achieves lower
                                                                                                 our
    As discussedSection III, we implemented the ILP ILP min- and and more balanced temperature distribution in die. die.
As discussed in   in Section III, we implemented the for for min- more balanced temperature distribution in the the
CAMPUS OF                 Planificación y asignación de
                         INTERNATIONAL
                         EXCELLENCE         recursos consciente de la aplicación
“Ingeniamos el futuro”




    • La caracterización energética de las
      aplicaciones permite la definición de políticas
      proactivas de planificación y asignación de
      recursos que minimizan los hotspots
    • La reducción de hotspots permite aumentar la
      temperatura del aire de los sistemas de
      refrigeración


                                    José M.Moya | Madrid (Spain), June 12, 2012   30
CAMPUS OF
                                                3. Máquina virtual consciente
                         INTERNATIONAL
                         EXCELLENCE             de la aplicación y los recursos
“Ingeniamos el futuro”




                                              Chip        Server         Rack     Room    Multi-
                                                                                          room
                Sched & alloc                                 2                    1

                app

                OS/middleware

                Compiler/VM                                   3                    3

                architecture                                  4                    4

                technology                       5




                                    José M.Moya | Madrid (Spain), June 12, 2012          31
CAMPUS OF
                                                                      Compilación JIT en
                                                                      máquinas virtuales
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




    • La máquina virtual
      compila (JIT) la
      aplicación a código
      nativo por eficiencia
    • El optimizador es
      genérico y orientado a
      la optimización de
      rendimiento



                                    José M.Moya | Madrid (Spain), June 12, 2012   32
CAMPUS OF
                                                              Compilación JIT para
                                                             reducción de energía
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”


                                                    Back-end

                  Front-end                                                       Generador de
                                                         Optimizador                 código


    • Compilador consciente de la aplicación
            – Caracterización de aplicaciones y transformaciones
            – Optimizador dependiente de la aplicación
            – Visión global de la carga de trabajo del data center
    • Optimizador de energía
            – En la actualidad, los compiladores para procesadores
              de altas prestaciones solo optimizan rendimiento

                                    José M.Moya | Madrid (Spain), June 12, 2012     33
CAMPUS OF
                                              Potencial de ahorro desde
                                                el compilador (MPSoCs)
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




    T. Simunic, G. de Micheli, L. Benini, and M. Hans. “Source code optimization and
    profiling of energy consumption in embedded systems,” International Symposium on
    System Synthesis, pages 193 – 199, Sept. 2000

            – Reducción de un 77 % de energía en un
              decodificador MP3
    FEI, Y., RAVI, S., RAGHUNATHAN, A., AND JHA, N. K. 2004. Energy-optimizing source
    code transformations for OS-driven embedded software. In Proceedings of the
    International Conference VLSI Design. 261–266.

            – Hasta el 37,9% (media 23,8%) de ahorro
              energético en programas multiproceso sobre
              Linux

                                    José M.Moya | Madrid (Spain), June 12, 2012   34
CAMPUS OF
                                                           4. Gestión automática de
                         INTERNATIONAL
                         EXCELLENCE                         frecuencia a nivel global
“Ingeniamos el futuro”




                                              Chip        Server         Rack     Room    Multi-
                                                                                          room
                Sched & alloc                                 2                    1

                app

                OS/middleware

                Compiler/VM                                   3                    3

                architecture                                  4                    4

                technology                       5




                                    José M.Moya | Madrid (Spain), June 12, 2012          35
CAMPUS OF
                                                    DVFS – Dynamic Voltage
                                                     and Frequency Scaling
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




    • Al decrementar la tensión de alimentación, la
      potencia se reduce cuadráticamente (a
      frecuencia constante)
    • El retardo se incrementa solo linealmente
    • La frecuencia máxima también se decrementa
      linealmente
    • Actualmente los modos de bajo consumo se
      activan por inactividad del sistema operativo
      de un servidor
                                    José M.Moya | Madrid (Spain), June 12, 2012   36
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                           DVFS a nivel de sala
“Ingeniamos el futuro”




    • Para minimizar el consumo hay que minimizar
      los cambios de modo
    • Existen algoritmos óptimos para un conjunto
      conocido de tareas (YDS)
    • El conocimiento de la carga de trabajo permite
      planificar los modos de bajo consumo a nivel
      global sin pérdida de rendimiento


                                    José M.Moya | Madrid (Spain), June 12, 2012   37
CAMPUS OF
                                                     Paralelismo para ahorrar
                                                                     energía
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




                                    José M.Moya | Madrid (Spain), June 12, 2012   38
CAMPUS OF
                                                  5. Emplazamiento de cores
                         INTERNATIONAL
                         EXCELLENCE             consciente de la temperatura
“Ingeniamos el futuro”




                                              Chip        Server         Rack     Room    Multi-
                                                                                          room
                Sched & alloc                                 2                    1

                app

                OS/middleware

                Compiler/VM                                                        3

                architecture                                  4                    4

                technology                      5




                                    José M.Moya | Madrid (Spain), June 12, 2012          39
CAMPUS OF
                                                   Floorplanning consciente
                                                          de la temperatura
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




                                    José M.Moya | Madrid (Spain), June 12, 2012   40
Average MaxTemp reduction: 12 oC
                             CAMPUS OF
                                        Potencial de ahorro
             Larger temperature reductions for benchmarks
             with higher maximum temperature por floorplaning
                             energético
                             INTERNATIONAL
                             EXCELLENCE
“Ingeniamos el futuro”
             For many benchmarks, temperature reducions are
    Y. Han, I. Koren, and C. A. Moritz. Temperature Aware Floorplanning. In Proc. of the
         larger than 20 oC
    Second Workshop on Temperature-Aware Computer Systems, June 2005
                                                                             Maximum Temperature                                                                        original           modified
   140
   120
   100
     80
     60
     40
     20
      0




                                                                                                                                                                                           wupwise
                                                                                                                                                                    twolf
                                                                                                                                                            swim
                                                                                                     gzip




                                                                                                                                 mgrid
                                                                                                                    mcf
                                                                                                            lucas
                  applu
           ammp




                                       bzip2
                                               crafty




                                                                                 fma3d




                                                                                                                                                  perlbmk




                                                                                                                                                                            vortex




                                                                                                                                                                                                     avg
                          apsi




                                                                                                                                                                                     vpr
                                                              equake
                                                                       facerec




                                                                                               gcc




                                                                                                                          mesa
                                                        eon




                                                                                         gap
                                 art




                                                                                                                                         parser
            – Reducciones de temperatura máxima de hasta 21oC
            – Media: -12oC en temperatura máxima
            – Mayor reducción en los casos más críticos
                                                    José M.Moya | Madrid (Spain), June 12, 2012                                                                    41
CAMPUS OF
                                              Floorplanning consciente de la
                         INTERNATIONAL
                         EXCELLENCE                 temperatura en chips 3D
“Ingeniamos el futuro”




    • El circuito integrado 3D está recibiendo
      atención:
            –     Escalado: reduce área 2D equivalente
            –     Rendimiento: menor longitud de
              comunicaciones
            –     Fiabilidad: menor cableado

    • Desventaja:
            – Aumentan drásticamente los picos de
              temperatura con respecto a los diseños 2D
              equivalentes

                                    José M.Moya | Madrid (Spain), June 12, 2012   42
CAMPUS OF
                                                   Floorplanning consciente
                                                          de la temperatura
                         INTERNATIONAL
                         EXCELLENCE
“Ingeniamos el futuro”




    • Reducción de hasta 30oC por capa en un chip
      3D de 4 capas y 48 cores

                                    José M.Moya | Madrid (Spain), June 12, 2012   43
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                Y todavía hay más
“Ingeniamos el futuro”




    • Smart Grids
            – Consumir cuando nadie consume
            – Reducir el consumo cuando todo el mundo
              consume
    • Reducción de la factura de luz
            – Coste dependiente del horario
            – Coeficiente de energía reactiva
            – Picos de consumo

                                    José M.Moya | Madrid (Spain), June 12, 2012   44
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                                  Conclusiones
“Ingeniamos el futuro”

    • Reducir el PUE no es lo mismo que reducir el consumo
            – El consumo de computación es dominante en data centers
              modernos
    • El conocimiento de la aplicación y de los recursos puede
      ser utilizado para establecer políticas proactivas para
      reducir la energía total
            – A todos los niveles
            – En todos los ámbitos
            – Considerando simultáneamente computación y refrigeración
    • La gestión adecuada del conocimiento del comportamiento
      térmico del data center permite reducir los problemas de
      fiabilidad
    • Reducir el consumo total no es lo mismo que reducir la
      factura de la luz

                                    José M.Moya | Madrid (Spain), June 12, 2012       45
CAMPUS OF
                         INTERNATIONAL
                         EXCELLENCE
                                                                                  Contacto
“Ingeniamos el futuro”



                José M. Moya
                +34 607 082 892
                jm.moya@upm.es
                ETSI de Telecomunicación, B104
                Avenida Complutense, 30
                Madrid 28040, Spain

 Gracias:




                                    José M.Moya | Madrid (Spain), June 12, 2012    46

Más contenido relacionado

PDF
Electrification of Mobility_Rafael SáNchez DuráN
PDF
El CPD eficiente
PPTX
Pararrayos en tierra
ODP
Gestión de Datacenter con Software Libre
PDF
Seguridad y Aspectos Legales del Cloud Computing, Metodologías de Defensa- Gu...
PDF
Optimización energética de centros de datos aprovechando el conocimiento de l...
PDF
Calculo de enlaces inalabrico PTP / Wimax / Wifi /
PPT
La influencia de la mitología en la psicología
Electrification of Mobility_Rafael SáNchez DuráN
El CPD eficiente
Pararrayos en tierra
Gestión de Datacenter con Software Libre
Seguridad y Aspectos Legales del Cloud Computing, Metodologías de Defensa- Gu...
Optimización energética de centros de datos aprovechando el conocimiento de l...
Calculo de enlaces inalabrico PTP / Wimax / Wifi /
La influencia de la mitología en la psicología

Destacado (16)

PPSX
Proceso constructivo de una torre
PPT
Resumen principio de funcionamiento l pdce 2011
PDF
Principio de funcionamiento
PDF
Diseño estructural de mástiles y torres.
PDF
Pdce tecnico comercial
PPTX
Pararrayos ionizantes-Funcionamiento
PDF
Torres ventadas
PDF
Nueva tecnologia en pararrayos
PPT
Edificios EnergéTicamente Eficientes_ENFOQUES DE DISEÑO
PDF
Catalogo de Torres Ventadas
PDF
Manual de sistema de proteccion electrica pararayos
PDF
Manual De Sistemas De Proteccion Electrica V2008
PDF
Modulo 2 resitividad de suelos-mediciones
PDF
Modulo 7 pararrayos
PDF
Modulo 3 diseno de puesta a tierra
PPT
La Mitología Griega y los Dioses del Olimpo
Proceso constructivo de una torre
Resumen principio de funcionamiento l pdce 2011
Principio de funcionamiento
Diseño estructural de mástiles y torres.
Pdce tecnico comercial
Pararrayos ionizantes-Funcionamiento
Torres ventadas
Nueva tecnologia en pararrayos
Edificios EnergéTicamente Eficientes_ENFOQUES DE DISEÑO
Catalogo de Torres Ventadas
Manual de sistema de proteccion electrica pararayos
Manual De Sistemas De Proteccion Electrica V2008
Modulo 2 resitividad de suelos-mediciones
Modulo 7 pararrayos
Modulo 3 diseno de puesta a tierra
La Mitología Griega y los Dioses del Olimpo
Publicidad

Similar a Eficiencia Energética Más Allá Del PUE: Explotando el Conocimiento de la Aplicación y los Recursos (20)

PDF
Soluciones para la Administración de la Infraestructura Física de Data Centers
PPT
Sistemas inteligentes de sensado diego benitez
PDF
Tendencias de Infraestructura para Data Centers
PDF
Taller Data Centers parte1
PDF
Supercomputacion una herramienta estrategica para la empresa
PPTX
Eficiencia energeticahpc
PPTX
PDF
Data Center Consultores - Green Data Center
PDF
Data Center Green
PDF
vSphere 5 la tecnología de nueva generación (Omega Peripherals Bilbao)
PDF
Desde la virtualización hacia la gestión integral de TI- Gabriel Adonaylo
PDF
Virtualizacion: maximice la eficiencia con la energía y refrigeración adecuada.
PDF
Redes Inteligentes
PPTX
Evaluación y administración de proyectos
PDF
Ciclo De Vida Del Cpd Eficiente
PDF
Su servidor en un Datacenter - G2K Hosting
PPTX
ExpoCloud2013 - Si la respuesta es convergencia ¿Cual es la pregunta?
PDF
ENTEL: On demand or without demand That is the questions?
PDF
VDI: Sirviendo escritorios desde la nube con Software Libre
PDF
[Salta] La nueva era de TI. Una Infraestructura más inteligente - Mariano Bat...
Soluciones para la Administración de la Infraestructura Física de Data Centers
Sistemas inteligentes de sensado diego benitez
Tendencias de Infraestructura para Data Centers
Taller Data Centers parte1
Supercomputacion una herramienta estrategica para la empresa
Eficiencia energeticahpc
Data Center Consultores - Green Data Center
Data Center Green
vSphere 5 la tecnología de nueva generación (Omega Peripherals Bilbao)
Desde la virtualización hacia la gestión integral de TI- Gabriel Adonaylo
Virtualizacion: maximice la eficiencia con la energía y refrigeración adecuada.
Redes Inteligentes
Evaluación y administración de proyectos
Ciclo De Vida Del Cpd Eficiente
Su servidor en un Datacenter - G2K Hosting
ExpoCloud2013 - Si la respuesta es convergencia ¿Cual es la pregunta?
ENTEL: On demand or without demand That is the questions?
VDI: Sirviendo escritorios desde la nube con Software Libre
[Salta] La nueva era de TI. Una Infraestructura más inteligente - Mariano Bat...
Publicidad

Más de GreenLSI Team, LSI, UPM (8)

PDF
LSI Seminar on Marina Zapater's PhD Thesis
PDF
Exploiting parallelism opportunities in non-parallel architectures to improve...
PDF
A Cyber Physical Approach to a Combined Hardware-Software
PDF
JPAR 2013: On the leakage-power modeling for optimal server operation
PPTX
Energy Efficiency in Data Centers
PPTX
Energy-efficient data centers: Exploiting knowledge about application and res...
PPTX
GreenDisc: A HW/SW energy optimization framework in globally distributed comp...
PPTX
Proactive and reactive thermal optimization techniques to improve energy effi...
LSI Seminar on Marina Zapater's PhD Thesis
Exploiting parallelism opportunities in non-parallel architectures to improve...
A Cyber Physical Approach to a Combined Hardware-Software
JPAR 2013: On the leakage-power modeling for optimal server operation
Energy Efficiency in Data Centers
Energy-efficient data centers: Exploiting knowledge about application and res...
GreenDisc: A HW/SW energy optimization framework in globally distributed comp...
Proactive and reactive thermal optimization techniques to improve energy effi...

Último (20)

PPTX
Propuesta BKP servidores con Acronis1.pptx
PPTX
Sesion 1 de microsoft power point - Clase 1
PPTX
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PDF
Estrategia de apoyo tecnología miguel angel solis
PDF
Estrategia de apoyo tecnología grado 9-3
PDF
clase auditoria informatica 2025.........
PPTX
IA de Cine - Como MuleSoft y los Agentes estan redefiniendo la realidad
PPT
introduccion a las_web en el 2025_mejoras.ppt
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
PDF
CyberOps Associate - Cisco Networking Academy
PPT
Que son las redes de computadores y sus partes
PDF
Maste clas de estructura metálica y arquitectura
PDF
Influencia-del-uso-de-redes-sociales.pdf
PPT
El-Gobierno-Electrónico-En-El-Estado-Bolivia
PDF
SAP Transportation Management para LSP, TM140 Col18
PPTX
Presentación de Redes de Datos modelo osi
PDF
Liceo departamental MICRO BIT (1) 2.pdfbbbnn
PDF
taller de informática - LEY DE OHM
PPTX
REDES INFORMATICAS REDES INFORMATICAS.pptx
PDF
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...
Propuesta BKP servidores con Acronis1.pptx
Sesion 1 de microsoft power point - Clase 1
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
Estrategia de apoyo tecnología miguel angel solis
Estrategia de apoyo tecnología grado 9-3
clase auditoria informatica 2025.........
IA de Cine - Como MuleSoft y los Agentes estan redefiniendo la realidad
introduccion a las_web en el 2025_mejoras.ppt
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
CyberOps Associate - Cisco Networking Academy
Que son las redes de computadores y sus partes
Maste clas de estructura metálica y arquitectura
Influencia-del-uso-de-redes-sociales.pdf
El-Gobierno-Electrónico-En-El-Estado-Bolivia
SAP Transportation Management para LSP, TM140 Col18
Presentación de Redes de Datos modelo osi
Liceo departamental MICRO BIT (1) 2.pdfbbbnn
taller de informática - LEY DE OHM
REDES INFORMATICAS REDES INFORMATICAS.pptx
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...

Eficiencia Energética Más Allá Del PUE: Explotando el Conocimiento de la Aplicación y los Recursos

  • 1. CAMPUS OF INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” Eficiencia Energética más allá del PUE: Explotando el Conocimiento de la Aplicación y los Recursos José M. Moya <jm.moya@upm.es> Laboratorio de Sistemas Integrados José M.Moya | Madrid (Spain), June 12, 2012 1
  • 2. CAMPUS OF INTERNATIONAL EXCELLENCE Contenido “Ingeniamos el futuro” • Motivación • Nuestro enfoque – Planificación y gestión de recursos – Optimización de máquinas virtuales – Gestión de modos de bajo consumo – Diseño de procesadores • Conclusiones José M.Moya | Madrid (Spain), June 12, 2012 2
  • 3. CAMPUS OF INTERNATIONAL EXCELLENCE Motivación “Ingeniamos el futuro” • Consumo energético en data centers – 1.3% de la producción energética mundial en 2010 – USA: 80 mill MWh/año en 2011 = 1,5 x NYC – 1 datacenter = 25 000 casas • Más de 43 Millones de Toneladas de CO2 / año (2% mundial) • Más agua que la industria del papel, automóvil, petróleo, madera o plástico Jonathan Koomey. 2011. Growth in Data center electricity use 2005 to 2010 José M.Moya | Madrid (Spain), June 12, 2012 3
  • 4. CAMPUS OF INTERNATIONAL EXCELLENCE Motivación “Ingeniamos el futuro” 35000 World server installed base 30000 • Se espera que la electricidad 25000 (thousands) 20000 High-end servers total utilizada por los data 15000 Mid-range servers 10000 centers en 2015 exceda los 5000 Volume servers 400 GWh/año. 0 2000 2005 2010 • El consumo de energía de la 5,75 Millones de servidores nuevos / año refrigeración continuará 10% de servidores sin utilizar (CO2 de 6,5 teniendo una importancia millones de coches) similar o superior al consumo 300 de la computación 250 Infrastructure (billion kWh/year) Electricity use 200 Communications • La optimización energética 150 Storage de los data centers del futuro 100 High-end servers 50 Mid-range servers requerirá un enfoque global 0 Volume servers y multi-disciplinar. 2000 2005 2010 José M.Moya | Madrid (Spain), June 12, 2012 4
  • 5. CAMPUS OF Problemas de fiabilidad INTERNATIONAL EXCELLENCE que dependen de la temperatura “Ingeniamos el futuro” ✔ Electromigration (EM) ✖ Time-dependent dielectric- breakdown (TDDB) Stress migration (SM) ✖ ✖ Thermal cycling (TC) José M.Moya | Madrid (Spain), June 12, 2012 5
  • 6. CAMPUS OF Refrigeración de un data center INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” José M.Moya | Madrid (Spain), June 12, 2012 6
  • 7. CAMPUS OF INTERNATIONAL EXCELLENCE Mejoras en servidores “Ingeniamos el futuro” • Virtualización - 27% • Servidores conforme a Energy Star = 6.500 • Mejor planificación de capacidad 2.500 José M.Moya | Madrid (Spain), June 12, 2012 7
  • 8. CAMPUS OF INTERNATIONAL EXCELLENCE Mejoras en refrigeración “Ingeniamos el futuro” • Mejoras en gestión de flujos de aire y rangos de temperatura ligeramente más amplios Reducción del consumo hasta un 25% 25.000 Recuperación de la inversión en solo 2 años José M.Moya | Madrid (Spain), June 12, 2012 8
  • 9. CAMPUS OF INTERNATIONAL Mejoras en infraestructura EXCELLENCE “Ingeniamos el futuro” CA  CC – 20% reducción de pérdidas de conversión – 47 millones de dólares de gastos inmobiliarios por data center – Mayor eficiencia, ahorro de energía suficiente para cargar un iPad durante 70 millones de años José M.Moya | Madrid (Spain), June 12, 2012 9
  • 10. CAMPUS OF Mejores prácticas de eficiencia energética INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” José M.Moya | Madrid (Spain), June 12, 2012 10
  • 11. CAMPUS OF PUE Power Usage Effectiveness INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” • Estado del arte: PUE ≈ 1,2 – La parte importante es el consumo de computación – El trabajo en eficiencia energética en DC está centrado en la reducción del PUE – Reducir PIT no reduce el PUE, pero se nota en la factura de la luz • ¿Cómo se puede reducir PIT ? José M.Moya | Madrid (Spain), June 12, 2012 11
  • 12. CAMPUS OF Ahorro energético según el nivel de abstracción INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” José M.Moya | Madrid (Spain), June 12, 2012 12
  • 13. CAMPUS OF INTERNATIONAL EXCELLENCE Nuestro enfoque “Ingeniamos el futuro” • Estrategia global para permitir la utilización de múltiples fuentes de información y para coordinar las decisiones con el fin de reducir el consumo total • Utilización del conocimiento de las características de demanda energética de las aplicaciones y las características de los recursos de computación y refrigeración para aplicar técnicas proactivas de optimización José M.Moya | Madrid (Spain), June 12, 2012 13
  • 14. CAMPUS OF INTERNATIONAL EXCELLENCE Enfoque holístico “Ingeniamos el futuro” Chip Server Rack Room Multi- room Sched & alloc 2 1 app OS/middleware Compiler/VM 3 3 architecture 4 4 technology 5 José M.Moya | Madrid (Spain), June 12, 2012 14
  • 15. CAMPUS OF 1. Gestión de recursos INTERNATIONAL EXCELLENCE en la sala “Ingeniamos el futuro” Chip Server Rack Room Multi- room Sched & alloc 2 1 app OS/middleware Compiler/VM 3 3 architecture 4 4 technology 5 José M.Moya | Madrid (Spain), June 12, 2012 15
  • 16. CAMPUS OF INTERNATIONAL Aprovechando la heterogeneidad CCGrid 2012 EXCELLENCE “Ingeniamos el futuro” • Utilización de la heterogeneidad para minimizar el consumo energético desde un punto de vista estático/dinámico – Estático: Encontrar el mejor set-up del datacenter, dado un número heterogéneo de máquinas – Dinámico: Optimización de la asignación de tareas en el Resource Manager • Demostramos que la mejor solución se encuentra en un datacenter heterogéneo – Muchos datacenters son heterogéneos (diversas generaciones de máquinas) M. Zapater, J.M. Moya, J.L. Ayala. Leveraging Heterogeneity for Energy Minimization in Data Centers, CCGrid 2012 José M.Moya | Madrid (Spain), June 12, 2012 16
  • 17. CAMPUS OF INTERNATIONAL EXCELLENCE Escenario actual “Ingeniamos el futuro” Scheduler Resource WORKLOAD Manager Execution José M.Moya | Madrid (Spain), June 12, 2012 17
  • 18. CAMPUS OF Potencial de mejora con mejores prácticas INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” Total power (computing and cooling) for various scheduling approaches 1400 max computing power, worst thermal placement min computing power, worst thermal placemenit optimal computing+cooling 1200 optimal computing+cooling, shut off idles optimal computing+cooling, shut off idles, no recirculation 1000 Power (KW) savings by minimizing computing power savings by minimizing the recirculation’s effect 800 savings by turning off idle machines unaddressed heat recirculation cost 600 basic (unavoidable) cost 400 200 0 0 20 40 60 80 100 job size relative to data center capacity (%) José operation cost (in kilowatts) for various “savings Fig. 3. Data center M.Moya | Madrid (Spain), June 12, 2012 18
  • 19. energy consume energy consume 20 Planificación y asignación de recursos 100 15 CAMPUS OF consciente de la refrigeración 10 INTERNATIONAL 50 EXCELLENCE 5 0 iMPACT Lab (Arizona State U) 0 “Ingeniamos el futuro” FCFS-FF FCFS-LRH EDF-LRH FCFS-Xint SCINT FCFS-FF FCFS-LRH EDF-LRH FCFS-Xint SCINT (a) (b) Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers on Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers off 40 Energy consumption, Scenario (a) 40 jobs, 25014 core-hours, idle servers off Energy consumption, Scenario (a) 40 jobs, 25014 core-hours,energy cooling idle servers on cooling energy computing energy computing energy 40 cooling energy 300 Throughput 0.580 jobs/hr 0.580 jobs/hr 0.349 jobs/hr 0.580 cooling energy jobs/hr 0.254 jobs/hr 35 computing energy 200 Turnaround time 8.98 hr computing energy 8.98 hr 12.17 hr 8.98 hr 48.49 hr Throughput 0.580 jobs/hr 0.580 jobs/hr 0.349 jobs/hr 0.580 jobs/hr 0.427 jobs/hr Alg. runtime 170 ms 186 ms 397 ms 40.8 min 88.6 min 35 250 Energy savings 0.197 jobs/hr Throughput 0% 0.197 jobs/hr 1.7% 0.172 jobs/hr 4.1% 0.197 jobs/hr 3.6% 0.163 jobs/hr 4.7% 30 Turnaround time Throughput 8.98 hr 0.197 jobs/hr 8.98 hr 0.197 jobs/hr 12.17 hr 0.172 jobs/hr 8.98 hr 0.197 jobs/hr 17.75 hr 0.163 jobs/hr Alg. runtime 171 ms 186 ms 397 ms 42 min 100 min energy consumed (GJ) (GJ) energy consumed (GJ) (GJ) Turnaround time 18.41 hr 18.41 hr 20.75 hr 18.41 hr 51.75 hr Turnaround time 18.41 hr 18.41 hr 20.75 hr 18.41 hr 38.02 hr Alg. runtime 3.4 ms 6.9 ms 213 ms 23 min 40 min 30 Energy savings 0% 4.0% 14.6% 14.2% 15.1% 25 Alg. runtime 3.4 ms 6.9 ms 213 ms 23 min 43 min energy consumed energy consumed 150 200 Energy savings 0% 6.2% 8.6% 8.7% 10.2% Energy savings 0% 11.8% 54.7% 21.8% 60.5% 25 20 150 20 100 15 100 15 10 50 50 10 5 5 0 0 FCFS-FF FCFS-LRH EDF-LRH FCFS-Xint SCINT FCFS-FF FCFS-LRH EDF-LRH FCFS-Xint SCINT 0 0 FCFS-FF (c) FCFS-LRH EDF-LRH FCFS-Xint SCINT FCFS-FF (d) FCFS-LRH EDF-LRH FCFS-Xint SCINT Energy consumption, Scenario (c)(a) jobs, 45817 core-hours, idle servers on 174 Energy consumption, Scenario (c)(b) jobs, 45817 core-hours, idle servers off 174 Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers on cooling energy Energy consumption, Scenario (b) 120 jobs, 16039 core-hours, idle servers off cooling energy computing energy computing energy 450 cooling energy 40 cooling energy Throughput 0.892 jobs/hr 0.892 jobs/hr 0.861 jobs/hr 0.892 jobs/hr energy computing 0.561 jobs/hr 100 Throughput computing 0.892 jobs/hr 0.892 jobs/hr 0.861 jobs/hr 0.892 jobs/hr energy 0.590 jobs/hr 400 Turnaround time 9.99 hr 9.99 hr 13.39 hr 9.99 hr 61.49 hr 300 Turnaround time 9.99 hrjobs/hr 9.99 hrjobs/hr 13.39 hr Throughput 0.580 0.580 9.99 hr 65.38 hr 0.349 jobs/hr 0.580 jobs/hr 0.254 jobs/hr 35 Alg. runtime 173 ms 191 ms 346 ms 21 min 147 min Alg. runtime time 173 ms Turnaround 8.98 hr 196 ms 8.98 hr 346 ms 12.17 hr 20 min 8.98 hr 142 min 48.49 hr Energy savings 0.0% 7.5% 17.3% 25.7% 41.4% 350 Throughput 0.580 jobs/hr 0.580 jobs/hr 0.349 jobs/hr 0.580 jobs/hr 0.427 jobs/hr energy consumed (GJ) (GJ) energy consumed (GJ) (GJ) Energy savings 170 ms Alg. runtime 0% 2.5% 186 ms 5.9% 397 ms 9.4% 40.8 min 12.5% 88.6 min 80 250 Energy savings 0% 1.7% 4.1% 3.6% 4.7% 30 Turnaround time 8.98 hr 8.98 hr 12.17 hr 8.98 hr 17.75 hr 300 Alg. runtime 171 ms 186 ms 397 ms 42 min 100 min energy consumed energy consumed Energy savings 0% 4.0% 14.6% 14.2% 15.1% 25 250 200 60 200 20 150 40 150 15 100 100 20 10 50 50 5 0 0 FCFS-FF FCFS-LRH EDF-LRH FCFS-Xint SCINT FCFS-FF FCFS-LRH EDF-LRH FCFS-Xint SCINT 0 0 FCFS-FF (e) FCFS-LRH EDF-LRH FCFS-Xint SCINT FCFS-FF (f) FCFS-LRH EDF-LRH FCFS-Xint SCINT (c) (d) Fig. 8. Energy comparison of the simulated schemes for the three scenarios. The plots correspond in respective positions to the plots of Figure 7. Energy consumption, Scenario (c) 174 jobs, 45817 core-hours, idle servers on Energy consumption, Scenario (c) 174 jobs, 45817 core-hours, idle servers off José M.Moya | cooling energy (Spain), June 12, 2012 Madrid 19 cooling energy policy used in the data center, which enables energy execution as soon as they arrive if the queue is empty and the data 450 computing job computing energy Throughput 0.892 jobs/hr 0.892 jobs/hr 0.861 jobs/hr 0.892 jobs/hr 0.561 jobs/hr 100 Throughput 0.892 jobs/hr 0.892 jobs/hr 0.861 jobs/hr 0.892 jobs/hr 0.590 jobs/hr 400
  • 20. CAMPUS OF Planificación y asignación de INTERNATIONAL EXCELLENCE recursos consciente de la aplicación LSI-UPM “Ingeniamos el futuro” Resource WORKLOAD Manager (SLURM) Execution Profiling and Energy Classification Optimization José M.Moya | Madrid (Spain), June 12, 2012 20
  • 21. CAMPUS OF Planificación y asignación de INTERNATIONAL EXCELLENCE recursos consciente de la aplicación Escenario “Ingeniamos el futuro” • Workload: – 12 tareas del benchmark SpecCPU 2006 – Workload aleatorio de 2000 tareas, dividido en job sets – Tiempo de llegada aleatorio entre job sets • Servidores: José M.Moya | Madrid (Spain), June 12, 2012 21
  • 22. CAMPUS OF Planificación y asignación de INTERNATIONAL EXCELLENCE recursos consciente de la aplicación Profiling de energía “Ingeniamos el futuro” Resource WORKLOAD Manager (SLURM) Execution Profiling and Energy Classification Optimization Energy profiling José M.Moya | Madrid (Spain), June 12, 2012 22
  • 23. CAMPUS OF Caracterización de la carga de trabajo INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” José M.Moya | Madrid (Spain), June 12, 2012 23
  • 24. CAMPUS OF INTERNATIONAL Trabajo realizado Optimizaciones EXCELLENCE “Ingeniamos el futuro” Resource WORKLOAD Manager (SLURM) Execution Profiling and Energy Classification Optimization Energy Minimization: • Minimization subjected to constraints • MILP problem (solved with CPLEX) • Static and Dynamic José M.Moya | Madrid (Spain), June 12, 2012 24
  • 25. CAMPUS OF Planificación y asignación de INTERNATIONAL EXCELLENCE recursos consciente de la aplicación “Ingeniamos el futuro” Optimización estática • Definición del datacenter óptimo – Dado un pool de 100 máquinas de cada – 1 job set del workload – El optimizador escoge los mejores servidores – Constraints de presupuesto y espacio Mejor solución: • 40 Sparc • 27 AMD Ahorros: • 5 a 22% en energía • 30% tiempo José M.Moya | Madrid (Spain), June 12, 2012 25
  • 26. CAMPUS OF Planificación y asignación de INTERNATIONAL EXCELLENCE recursos consciente de la aplicación “Ingeniamos el futuro” Optimización dinámica • Asignación óptima del workload – Uso del workload completo (2000 tareas) – El algoritmo encuentra una buena asignación (no la mejor) en términos de energía – Ejecución del algoritmo en runtime Ahorros del 24% al 47% en energía José M.Moya | Madrid (Spain), June 12, 2012 26
  • 27. CAMPUS OF Planificación y asignación de INTERNATIONAL EXCELLENCE recursos consciente de la aplicación “Ingeniamos el futuro” Conclusiones • Primera prueba de concepto en cuanto a ahorros energéticos gracias a heterogeneidad • Solución automática • La solución automática de procesadores ofrece notables ahorros energéticos. • La solución puede ser fácilmente implementable en un entorno real – Uso del Resource Manager SLURM – Workloads y servidores más realistas José M.Moya | Madrid (Spain), June 12, 2012 27
  • 28. CAMPUS OF 2. Gestión de recursos INTERNATIONAL EXCELLENCE en el servidor “Ingeniamos el futuro” Chip Server Rack Room Multi- room Sched & alloc 2 1 app OS/middleware Compiler/VM 3 3 architecture 4 4 technology 5 José M.Moya | Madrid (Spain), June 12, 2012 28
  • 29. CAMPUS OF Políticas de planificación y INTERNATIONAL EXCELLENCE asignación de recursos en MPSoCs “Ingeniamos el futuro” UCSD – System Energy Efficiency Lab A. Coskun , T. Rosing , K. Whisnant and K. Gross "Static and dynamic temperature- aware scheduling for multiprocessor SoCs", IEEE Trans. Very Large Scale Integr. Syst., vol. 16, no. 9, pp.1127 -1140 2008 Fig. 3. Distribution of thermal hot spots, with with DPM (ILP). Fig. 3. Distribution of thermal hot spots, DPM (ILP). Fig. 4. Distribution of spatial gradients, with with DPM (ILP). Fig. 4. Distribution of spatial gradients, DPM (ILP). A. Static Scheduling Techniques A. Static Scheduling Techniques hot spots. While Min-Th reduces the spatial differentials hot spots. While Min-Th reduces the highhigh spatial differentials We We next provideextensive comparison of the ILP ILP based above 15 we observe a substantial increase in the spatial next provide an an extensive comparison of the based above 15 C, C, we observe a substantial increase in the spatial José M.Moya | Min-Th&Sp. gradients techniques. We refer to to static approach as as Madrid (Spain), June 12, above 10 C. C. In contrast, method achieves lower techniques. We referour our static approach Min-Th&Sp. gradients 2012above 10 In contrast,29 our method achieves lower our As discussedSection III, we implemented the ILP ILP min- and and more balanced temperature distribution in die. die. As discussed in in Section III, we implemented the for for min- more balanced temperature distribution in the the
  • 30. CAMPUS OF Planificación y asignación de INTERNATIONAL EXCELLENCE recursos consciente de la aplicación “Ingeniamos el futuro” • La caracterización energética de las aplicaciones permite la definición de políticas proactivas de planificación y asignación de recursos que minimizan los hotspots • La reducción de hotspots permite aumentar la temperatura del aire de los sistemas de refrigeración José M.Moya | Madrid (Spain), June 12, 2012 30
  • 31. CAMPUS OF 3. Máquina virtual consciente INTERNATIONAL EXCELLENCE de la aplicación y los recursos “Ingeniamos el futuro” Chip Server Rack Room Multi- room Sched & alloc 2 1 app OS/middleware Compiler/VM 3 3 architecture 4 4 technology 5 José M.Moya | Madrid (Spain), June 12, 2012 31
  • 32. CAMPUS OF Compilación JIT en máquinas virtuales INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” • La máquina virtual compila (JIT) la aplicación a código nativo por eficiencia • El optimizador es genérico y orientado a la optimización de rendimiento José M.Moya | Madrid (Spain), June 12, 2012 32
  • 33. CAMPUS OF Compilación JIT para reducción de energía INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” Back-end Front-end Generador de Optimizador código • Compilador consciente de la aplicación – Caracterización de aplicaciones y transformaciones – Optimizador dependiente de la aplicación – Visión global de la carga de trabajo del data center • Optimizador de energía – En la actualidad, los compiladores para procesadores de altas prestaciones solo optimizan rendimiento José M.Moya | Madrid (Spain), June 12, 2012 33
  • 34. CAMPUS OF Potencial de ahorro desde el compilador (MPSoCs) INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” T. Simunic, G. de Micheli, L. Benini, and M. Hans. “Source code optimization and profiling of energy consumption in embedded systems,” International Symposium on System Synthesis, pages 193 – 199, Sept. 2000 – Reducción de un 77 % de energía en un decodificador MP3 FEI, Y., RAVI, S., RAGHUNATHAN, A., AND JHA, N. K. 2004. Energy-optimizing source code transformations for OS-driven embedded software. In Proceedings of the International Conference VLSI Design. 261–266. – Hasta el 37,9% (media 23,8%) de ahorro energético en programas multiproceso sobre Linux José M.Moya | Madrid (Spain), June 12, 2012 34
  • 35. CAMPUS OF 4. Gestión automática de INTERNATIONAL EXCELLENCE frecuencia a nivel global “Ingeniamos el futuro” Chip Server Rack Room Multi- room Sched & alloc 2 1 app OS/middleware Compiler/VM 3 3 architecture 4 4 technology 5 José M.Moya | Madrid (Spain), June 12, 2012 35
  • 36. CAMPUS OF DVFS – Dynamic Voltage and Frequency Scaling INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” • Al decrementar la tensión de alimentación, la potencia se reduce cuadráticamente (a frecuencia constante) • El retardo se incrementa solo linealmente • La frecuencia máxima también se decrementa linealmente • Actualmente los modos de bajo consumo se activan por inactividad del sistema operativo de un servidor José M.Moya | Madrid (Spain), June 12, 2012 36
  • 37. CAMPUS OF INTERNATIONAL EXCELLENCE DVFS a nivel de sala “Ingeniamos el futuro” • Para minimizar el consumo hay que minimizar los cambios de modo • Existen algoritmos óptimos para un conjunto conocido de tareas (YDS) • El conocimiento de la carga de trabajo permite planificar los modos de bajo consumo a nivel global sin pérdida de rendimiento José M.Moya | Madrid (Spain), June 12, 2012 37
  • 38. CAMPUS OF Paralelismo para ahorrar energía INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” José M.Moya | Madrid (Spain), June 12, 2012 38
  • 39. CAMPUS OF 5. Emplazamiento de cores INTERNATIONAL EXCELLENCE consciente de la temperatura “Ingeniamos el futuro” Chip Server Rack Room Multi- room Sched & alloc 2 1 app OS/middleware Compiler/VM 3 architecture 4 4 technology 5 José M.Moya | Madrid (Spain), June 12, 2012 39
  • 40. CAMPUS OF Floorplanning consciente de la temperatura INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” José M.Moya | Madrid (Spain), June 12, 2012 40
  • 41. Average MaxTemp reduction: 12 oC CAMPUS OF Potencial de ahorro Larger temperature reductions for benchmarks with higher maximum temperature por floorplaning energético INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” For many benchmarks, temperature reducions are Y. Han, I. Koren, and C. A. Moritz. Temperature Aware Floorplanning. In Proc. of the larger than 20 oC Second Workshop on Temperature-Aware Computer Systems, June 2005 Maximum Temperature original modified 140 120 100 80 60 40 20 0 wupwise twolf swim gzip mgrid mcf lucas applu ammp bzip2 crafty fma3d perlbmk vortex avg apsi vpr equake facerec gcc mesa eon gap art parser – Reducciones de temperatura máxima de hasta 21oC – Media: -12oC en temperatura máxima – Mayor reducción en los casos más críticos José M.Moya | Madrid (Spain), June 12, 2012 41
  • 42. CAMPUS OF Floorplanning consciente de la INTERNATIONAL EXCELLENCE temperatura en chips 3D “Ingeniamos el futuro” • El circuito integrado 3D está recibiendo atención: – Escalado: reduce área 2D equivalente – Rendimiento: menor longitud de comunicaciones – Fiabilidad: menor cableado • Desventaja: – Aumentan drásticamente los picos de temperatura con respecto a los diseños 2D equivalentes José M.Moya | Madrid (Spain), June 12, 2012 42
  • 43. CAMPUS OF Floorplanning consciente de la temperatura INTERNATIONAL EXCELLENCE “Ingeniamos el futuro” • Reducción de hasta 30oC por capa en un chip 3D de 4 capas y 48 cores José M.Moya | Madrid (Spain), June 12, 2012 43
  • 44. CAMPUS OF INTERNATIONAL EXCELLENCE Y todavía hay más “Ingeniamos el futuro” • Smart Grids – Consumir cuando nadie consume – Reducir el consumo cuando todo el mundo consume • Reducción de la factura de luz – Coste dependiente del horario – Coeficiente de energía reactiva – Picos de consumo José M.Moya | Madrid (Spain), June 12, 2012 44
  • 45. CAMPUS OF INTERNATIONAL EXCELLENCE Conclusiones “Ingeniamos el futuro” • Reducir el PUE no es lo mismo que reducir el consumo – El consumo de computación es dominante en data centers modernos • El conocimiento de la aplicación y de los recursos puede ser utilizado para establecer políticas proactivas para reducir la energía total – A todos los niveles – En todos los ámbitos – Considerando simultáneamente computación y refrigeración • La gestión adecuada del conocimiento del comportamiento térmico del data center permite reducir los problemas de fiabilidad • Reducir el consumo total no es lo mismo que reducir la factura de la luz José M.Moya | Madrid (Spain), June 12, 2012 45
  • 46. CAMPUS OF INTERNATIONAL EXCELLENCE Contacto “Ingeniamos el futuro” José M. Moya +34 607 082 892 jm.moya@upm.es ETSI de Telecomunicación, B104 Avenida Complutense, 30 Madrid 28040, Spain Gracias: José M.Moya | Madrid (Spain), June 12, 2012 46