Energy-aware Instruction Cache Design using Partitioning

분할 기법을 이용한 저전력 명령어 캐쉬 설계

  • 김종면 (울산대학교 컴퓨터정보통신공학부) ;
  • 정재욱 (전남대학교 전자컴퓨터공학부) ;
  • 김철홍 (전남대학교 전자컴퓨터공학부)
  • Published : 2007.10.31

Abstract

Energy consumption in the instruction cacheaccounts for a significant portion of the total processor energy consumption. Therefore, reducing energy consumption in the instruction cache is important in designing embedded processors. This paper proposes a method for reducing dynamic energy consumption in the instruction cache by partitioning it to smaller (less energy-consuming) sub-caches. When a request comes into the proposed cache, only one sub-cache is accessed by utilizing the locality of applications. By contrast, the other sub-caches are not accessed, leading todynamic energy reduction. In addition, the proposed cache reduces dynamic energy consumption by eliminating the energy consumed in tag matching. We evaluated the energy efficiency by running cycle accurate simulator, SimpleScalar. with power parameters obtained from CACTI. Simulation results show that the proposed cache reduces dynamic energy consumption by $37%{\sim}60%$ compared to the traditional direct-mapped instruction cache.

최근의 내장형 프로세서를 설계하는데 있어서는 성능 못지 않게 에너지 효율성이 중요하게 고려되어야 한다. 내장형 프로세서에서 소모되는 에너지의 상당 부분은 캐쉬 메모리에서 소모되는 것으로 알려지고 있다. 특히 1차 명령어 캐쉬는 거의 매 사이클마다 접근이 이루어지므로 상당히 많은 양의 동적 에너지를 소모하게 된다. 그러므로, 내장형 프로세서를 설계하는데 있어서 1차 명령어 캐쉬의 에너지 효율성을 높이는 기법은 프로세서의 총 에너지 소모를 줄여주는 결과로 이어질 것으로 기대된다. 본 논문에서는 내장형 프로세서에 적합한 저전력 1차 명령어 캐쉬를 설계하는 기법을 제안하고자 한다. 제안하는 기법은 명령어 캐쉬를 여러 개의 작은 서브 캐쉬들로 분할하는 기법을 통해 명령어 접근 시 활성화되는 캐쉬의 크기를 줄임으로써 1차 명령어 캐쉬에서 소모되는 동적 에너지를 감소시켜 준다. 또한, 하나의 서브 캐쉬 크기를 페이지 크기와 동일하게 함으로써 캐쉬 내에서 태그가 차지하는 칩 공간을 없애고, 태그 비교에 소모되는 에너지도 없애는 효과를 얻는다. 제안하는 1차 명령어 캐쉬는 물리적인 접근 시간 감소를 통해 캐쉬 분할로 인한 성능 저하를 최대한 줄이고, 에너지 감소 효과는 최대로 얻고자 한다. 모의 실험 결과, 제안하는 구조는 기존의 1차 명령어 캐쉬 구조와 비교하여 명령어 접근에 소모되는 동적 에너지를 평균 $37%{\sim}60%$ 감소시키는 결과를 보인다.

Keywords

References

  1. Simon Segars, 'Low power design techniques for microprocessors,' In Proceedings of International Solid-State Circuits Conference, 2001
  2. J. Kin, M. Gupta, and W. Mangione-Smith, 'The Filter Cache: An Energy Efficient Memory Structure,' In Proceedings of International Symposium on Microarchitecture, pp. 184-193, 1997
  3. N. Bellas, I. Hajj, and C. Polychronopoulos, 'Using dynamic cache management techniques to reduce energy in a high-performance processor,' In Proceedings of International Symposium on Low Power Electronics and Design, pp. 64-69, 1999
  4. David H. Albonesi, 'Selective Cache Ways: On-Demand cache resource allocation,' In Proceedings of International Symposium on Microarchitecture, pp. 70-75, 1999
  5. M. Powell, A. Agarwal, T. N. Vijaykumar, B. Falsafi, and K. Roy, 'Reducing Set-Associative Cache Energy via Way-Prediction and Selective Direct-Mapping,' In Proceedings of International Symposium on Microarchitecture, pp. 54-65, 2001
  6. J. Montanaro et al., 'A 160 Mhz, 32b, 0.5W CMOS RISC microprocessor,' In Proceedings of International Solid-State Circuits Conference, pp. 214-229, 1996
  7. D. Burger, T. M. Austin, and S. Bennett, 'Evaluating future micro-processors: the SimpleScalar tool set,' Tech. Report TR-1308, Univ. of Wisconsin-Madison Computer Sciences Dept., 1997
  8. SPEC CPU2000 Benchmarks, http://www.specbench.org
  9. SoonTae Kim, N. Vijaykrishnan, Mahmut Kandemir, Anand Sivasubramaniam and Mary Jane Irwin, 'Partitioned Instruction Cache Architecture for Energy Efficiency,' ACM Transactions on Embedded Computing Systems, Vol. 2, Issue 2, pp. 163-185, 2003 https://doi.org/10.1145/643470.643473
  10. Yen-Jen Chang, Feipei Lai, and Shanq-Jang Ruan, 'Cache Design for Eliminating the Address Translation Bottleneck and Reducing the Tag Area Cost,' In Proceedings of International Conference on Computer Design, pp. 334, 2002
  11. ARM Corp., ARM1136J(F)-S, http://www.arm.com/products/CPUs/ARM1136JF-S.html
  12. P. Shivakumar and N. P. Jouppi, 'CACTI 3.0: An Integrated Cache Timing, Power, and Area Model,' TR-WRL-2001-2, 2001
  13. Mike Muller, 'At the Heart of Innovation,' http://www.arm.com/miscPDFs/6871.pdf
  14. ASIC STD130 DATABOOK, Samsung Electronics, 2001