DOI QR코드

DOI QR Code

Low-power Filter Cache Design Technique for Multicore Processors

멀티 코어 프로세서를 위한 저전력 필터 캐쉬 설계 기법

  • 박영진 (전남대학교 전자컴퓨터공학부) ;
  • 김종면 (울산대학교 컴퓨터정보통신공학부) ;
  • 김철홍 (전남대학교 전자컴퓨터공학부)
  • Published : 2009.12.31

Abstract

Energy consumption as well as performance should be considered when designing up-to-date multicore processors. In this paper, we propose new design technique to reduce the energy consumption in the instruction cache for multicore processors by using modified filter cache. The filter cache has been recognized as one of the most energy-efficient design techniques for singlecore processors. The energy consumed in the instruction cache accounts for a significant portion of total processor energy consumption. Therefore, energy-aware instruction cache design techniques are essential to reduce the energy consumption in a multicore processor. The proposed technique reduces the energy consumption in the instruction cache for multicore processors by reducing the number of accesses to the level-1 instruction cache. We evaluate the proposed design using a simulation infrastructure based on SimpleScalar and CACTI. Simulation results show that the proposed architecture reduces the energy consumption in the instruction cache for multicore processors by up to 3.4% compared to the conventional filter cache architecture. Moreover, the proposed architecture shows better performance over the conventional filter cache architecture.

최신의 멀티코어 프로세서를 설계할 때에는 성능과 함께 전력 효율성이 반드시 고려되어야 한다. 본 논문에서는 싱글 코어 프로세서의 명령어 캐쉬에서 소비되는 전력을 줄이기 위해 사용되는 대표적 기법중 하나인 필터 캐쉬 구조를 멀티 코어 프로세서에 적용하기 위한 새로운 방안을 제시하고자 한다. 명령어 캐쉬는 프로세서 전체에서 소비되는 전력의 상당 부분을 차지하고 있기 때문에, 변형 필터 캐쉬 구조를 이용한 저전력 명령어 캐쉬 설계는 멀티 코어 프로세서의 전력 소비를 줄이는데 있어서 중요한 역할을 담당할 수 있다. 제안하는 변형 필터 캐쉬 구조는 멀티코어 프로세서에서 필터 캐쉬에 대한 희생 캐쉬를 추가함으로써 1차 명령어 캐쉬에 대한 접근 횟수를 감소시키는 방법을 이용하여 명령어 캐쉬에서 소비되는 총전력을 줄일 수 있다. 제안하는 명령어 캐쉬 구조의 효율성을 분석하기 위한 모의 실험 도구로 SimpleScalar시뮬레이터와 CACTI를 사용한다. 모의실험 결과, 제안하는 기술은 멀티코어 프로세서의 명령어 캐쉬에서 소비되는 전력을 기존의 필터 캐쉬 구조와 비교하여 최대 3.4% 감소시킬 수 있음을 확인할 수 있다. 더욱이 제안하는 구조는 기존의 필터 캐쉬 구조에 비해 보다 우수한 성능을 보여준다.

Keywords

References

  1. 공준호, 최진항, 이종성, 정성우, "인텔 펜티엄 4와 코어 2 듀오의 실행시간과 파워소모량 효율성 비교," 한국컴퓨터정보학회 논문지, 제 13권, 제 7호, 165-172쪽, 2008년 12월.
  2. 양나라, 김종면, 김철홍, "임베디드 시스템에서 후방 분기 명령어 정보를 이용한 저전력 명령어 캐쉬 설계 기법," 한국컴퓨터정보학회 논문지, 제 13권, 제 6호, 33-39쪽, 2008년 11월.
  3. S. Segars, "Low Power Design Techniques for Microprocessors," Proceedings of International Solid-State Circuits Conference, 2001.
  4. J. Kin, M. Gupta, and W. Mangione-Smith, "The Filter Cache: An Energy Efficient Memory Structure," Proceedings of the International Symposium on Microarchitecture, pp. 184-193, 1997.
  5. 곽종욱, "모드 선택 비트를 사용한 필터 캐시 예측기," 전자공학회 논문지, 제 46권, 제 5호, 539-551쪽, 2009년 9월.
  6. D. H. Albonesi, "Selective Cache Ways: On-demand Cache Resource Allocation," Proceedings of the International Symposium on Microarchitecture, pp. 70-75, 1999.
  7. K. Inonue, T. Ishihara, and K. Murakami, "Way-predicting Set-associative Cache for High Performance and Low Energy Consumption," Proceedings of the International Symposium on Low Power Electronics and Design, pp. 273-275, 1999.
  8. M. Powell, A. Agarwal, T. N. Vijavkumar, B. Falsafi, and K. Roy, "Reducing Set-associative Cache Energy via Way-prediction and Selective Direct-mapping," Proceedings of the International Symposium on Microarchitecture, pp. 54-65, 2001.
  9. C. H. Kim, S. W. Chung, and C. S. Jhon, "PP-cache: A Partitioned Power-aware Instruction Cache Architecture," Microprocessors and Microsystems, Vol. 30, pp. 268-279, 2006. https://doi.org/10.1016/j.micpro.2005.12.004
  10. 이광용, 박호준, 김동환, 강동욱, 김재명, 박승민, "멀티코어 기술 및 산업 동향," 정보통신연구진흥원 학술정보, 주간기술동향 1295호, 2007년.
  11. N. P. Jouppi, "Improving Direct-Mapped Cache Performance by the Addition of a Small Fully-Associative Cache and Prefetch Buffers," Proceedings of 17th Annual International Symposiumon Computer Architecture, pp. 364-373,1990.
  12. D. Burger, T. M. Austin, and S. Bennett, "Evaluating Future Micro-Processors: the SimpleScalar tool set," Tech. Report TR-138, Univ. of Wisconsin-Madison Computer Sciences Dept., 1997.
  13. P. Shivakumar and N. P. Jouppi, "CACTI 3.0: An Integrated Cache Timing, Power, and Area Model," TR-WRL-2001-2, 2001.
  14. SPEC CPU 2000 Benchmarks, http://www.specbench.org