The Inplementation of Fault-Tolerant Dual System Using the Hot-Standby Sparing Technique

핫 스탠바이 스페어링 기법을 이용한 고장 감내 이중화 시스템 설계

  • 신진욱 (전북대학교 전자정보공학부 멀티미디어연구실) ;
  • 박동선 (전북대학교 전자정보공학부 멀티미디어연구실)
  • Published : 2004.10.01

Abstract

This paper is basically to achieve the high-availability and high-reliability of the control system from the implementation of the fault-tolerant system using the hot-standby sparing technique. To meet the objective, we design and implement a board with fault tolerance I/O bus to detect the fault. Warm-standby sparing technique is the fault tolerance technique usually used for switching control system in present. This technique can be easily implemented, but can not detect the fault quickly and can malfunction because of the hardware fault. The hot-standby sparing fault tolerant technique implemented in this paper is consists of dual processor modules and a I/O processor using fault tolerant I/O bus. The proposed method can find the faults as soon as possible, so it can prevent from wrong operation. Also it is possible to normal re-service due to the short recovering time. To implement the fault-tolerant dual system with fault detection be, two daughter, called FTMA and FTIA, boards designed and implemented are applied to the system. And we also simulated the proposed method to verify the high-availability and high-reliability of the control system using Markov process.

분산 컴퓨팅 기술 발달과 인터넷 이용의 확산에 따라 고속의 멀티미디어 서비스에 대한 사용자의 욕구가 날로 증가하고 있다. 이에 따라 영상, 음성 등이 포함된 대용량 정보매체를 다루는 서비스가 주로 이루어지고 있으며 망 사업자들은 이러한 대용량 정보매체의 고속 전송이 가능하도록 초고속 네트워킹 설비에 끊임없이 투자하고 있다. 이와 같은 빠른 속도의 서비스뿐만 아니라 이와 동시에 만족되어야 하는 서비스의 요건은 안정성이다. 시스템 고장으로 인하여 기반 시설이 마비될 수 있는 전자 정보 시스템은 매우 높은 가용성 및 신뢰성을 가져야 한다. 이러한 고가용성과 고신뢰성을 얻기 위하여 본 논문에서는 핫 스탠바이 스페어링 기법을 이용한 고장 감내 다중화 시스템을 제안하고 구현한다. 제안된 시스템은 일반적인 단일 모듈 시스템을 다중화 하여 고장이 발생하면 유연하게 대처하도록 하고 고장 검출 버스를 적용하여 비교를 통한 고장 검출 기능이 가능하도록 하였다. 또한 제안된 구조는 단일 모듈 시스템에 버스 변환 장치를 도입하여 보다 쉽게 고장 감내 다중화 시스템을 구현할 수 있도록 하였다. 그리고 본 논문에서 제안한 하드웨어 시스템의 성능 평가를 위하여 마코프 프로세스를 이용한 모델링을 적용하여 고가용성 및 고신뢰성을 검증하였다.

Keywords

References

  1. Dhiraj K. Pradhan, Fault-Tolerant Computer System Design, PRENTICE HALL
  2. 정우석, 권보섭, 송광석, '동시 쓰기 방식을 이용한 결함 허용 제어 시스템', JCCI97, 1997
  3. Ft-SPARC manual, IMP Ltd
  4. Emrys John Williams, Davic Charles Liddell, Fault-tolerant computer system, UK Patent
  5. Texas Instruments, SuperSPARC User's Guide
  6. 정우석, 송광석, 이광선, 신진욱, 박동선, '고장감내 시스템을 위한 버스 변환장치 설계', 추계통신학회, 1998
  7. 박혜숙, 송광석, 이상백, 신진욱, 박동선, '고장 감내형 교환제어 시스템을 위한 관리 시스템 설계', 추계통신학회, 1999
  8. Jan Pukite외 1명, Modeling for Reliability Analysis