DOI QR코드

DOI QR Code

Implementation and Performance Analysis of High-availability System for Mission Computer

임무컴퓨터를 위한 고가용 시스템의 구현 및 성능분석

  • 정재엽 (충남대학교 컴퓨터공학과) ;
  • 박성종 (충남대학교 컴퓨터공학과) ;
  • 임재석 (충남대학교 컴퓨터공학과) ;
  • 이철훈 (충남대학교 컴퓨터공학과)
  • Published : 2008.08.28

Abstract

MC(Mission Computer) performs important function in avionics system which tactic data processing, image processing and managing navigation system etc. In general, the fault of SPOF(Single Point Of Failure) in unity system can lead to failure of whole system. It can cause a failure of a mission and also can threaten to the life of the pilot. So, in this paper, we design the HA(Hight-availability) system so that dealing with the failure. And we use HA software like Heartbeat, Fake, DRBD and Bonding to manage HA system. Also we analyze the performance of HA system using the FDT(Fault Detection Time) for fast fault detection and MTTR(Mean Time To Repair) for mission continuity.

임무컴퓨터는 항공전자시스템에서 임무 수행에 필요한 각종 전술데이터 처리, 영상처리, 항법정보의 관리 및 융합 등의 매우 중요한 기능을 수행한다. 이러한 중요 시스템이 단일시스템으로 구성되면, 여러 가지 SPOF(Single Point Of Failure) 요소의 고장으로 인해 전체 시스템의 고장으로 이어질 수 있다. 이는 서비스 중단으로 인한 임무의 실패뿐만 아니라 조종사의 생명까지도 위협할 수 있다. 본 논문에서는 단일 시스템의 이중화를 통해 SPOF 요소를 제거하고, 이를 운영하기 위한 방안으로 리눅스 기반의 Heartbeat, Fake, DRBD(Distributed Replicated Block Device), Bonding 등의 기법을 이용하여 고가용 시스템을 구현하였다. 또한, 구현한 고가용 시스템에서 빠른 고장 탐지를 위한 FDT(Fault Detection Time)와 고장 발생 시 임무 연속성을 위해 중요한 요소일 MTTR(Mean Time To Repair)의 평균값을 측정하고, 그에 따른 성능분석 결과를 제시한다.

Keywords

References

  1. P. S. Weygant, Clusters for High Availability : A Primer of HP Solutions, Prentice Hall PTR, 2001.
  2. D. K. Pradhan, Fault-Tolerant Computer System Design, Prentice Hall PTR, 1996.
  3. http://linux-ha.org
  4. http://www.linux-ha.org/Heartbeat
  5. http://www.vergenet.net/linux/fake/
  6. http://www.linux-ha.org/ipfail
  7. http://linbit.com/, http://drbd.org/
  8. http://www.linas.org/linux/Software-RAID/Soft ware-RAID.html
  9. http://www.redhat.com/gfs/
  10. http://logfs.sourceforge.net/
  11. http://www.coda.cs.cmu.edu/
  12. http://www.ultramonkey.org/
  13. http://mon.wiki.kernel.org/index.php/Main_Page
  14. http://netsaint.sourceforge.net/
  15. http://clumon.ncsa.uiuc.edu/
  16. http://ganglia.info/
  17. A. Robertson, "Linux-HA Heartbeat System Design," USENIX, pp.305-316, 2000.
  18. http://en.wikipedia.org/wiki/Mean_time between_failures
  19. http://en.wikipedia.org/wiki/Mean_time_to recovery
  20. http://www.ntp.org/
  21. J. E. J. Bottomley, "Implementing Clusters for High Availability," USENIX, pp.237-244, 2004.
  22. D. P. Siewiorek, "Architecture of fault-tolerant computers : an historical perspective," IEEE, Vol.79, No.1, pp.1710-1734, 1991. https://doi.org/10.1109/5.119549
  23. 최종명, 한주현, 최재영, "Diehard:인터넷 서비스를 위한 N-way 고가용성 시스템", 정보과학회논문지, 제28권, 제8호, pp.390-398, 2001.
  24. 배재환, "멀티미디어 관광정보시스템을 위한 고가용성 리눅스 서버에 관한 연구", 한국통신학회 논문지, Vol.29, No.9B, pp.818-825, 2004.
  25. http://xcr.cenit.latech.edu/ha-oscar/index.html
  26. L. Chokchai, S. Lixin, L. Tong, S. Hertong, and L. S. Stephen, "Availability Prediction and Modeling of High Availability OSCAR Cluster," IEEE, pp.380-387, 2003. https://doi.org/10.1109/CLUSTR.2003.1253337
  27. ftp://ftp.software.ibm.com/software/data/pubs/papers/10sfailover.pdf
  28. http://h71028.www7.hp.com/enterprise/downloads/Optimizing%20failover_6-22.pdf