DOI QR코드

DOI QR Code

Application of Recent Approximate Dynamic Programming Methods for Navigation Problems

주행문제를 위한 최신 근사적 동적계획법의 적용

  • 민대홍 (고려대학교 제어계측공학과) ;
  • 정근우 (고려대학교 제어계측공학과) ;
  • 권기영 (고려대학교 제어계측공학과) ;
  • 박주영 (고려대학교 제어계측공학과)
  • Received : 2011.11.19
  • Accepted : 2011.12.11
  • Published : 2011.12.25

Abstract

Navigation problems include the task of determining the control input under various constraints for systems such as mobile robots subject to uncertain disturbance. Such tasks can be modeled as constrained stochastic control problems. In order to solve these control problems, one may try to utilize the dynamic programming(DP) methods which rely on the concept of optimal value function. However, in most real-world problems, this trial would give us many difficulties; for examples, the exact system model may not be known; the computation of the optimal control policy may be impossible; and/or a huge amount of computing resource may be in need. As a strategy to overcome the difficulties of DP, one can utilize ADP(approximate dynamic programming) methods, which find suboptimal control policies resorting to approximate value functions. In this paper, we apply recently proposed ADP methods to a class of navigation problems having complex constraints, and observe the resultant performance characteristics.

주행문제는 불확실한 외란의 영향을 받는 이동로봇 등의 시스템에 대하여 각종 제약조건들을 만족하도록 하는 제어 입력을 결정하는 과제를 포함한다. 이러한 과제는 제약조건을 갖는 확률 제어 문제로 모델링될 수 있다. 이러한 종류의 제어문제를 풀기 위하여, 최적 가치함수 개념에 의존하는 동적 계획법의 활용을 시도해볼 수 있다. 하지만, 대부분의 실제 문제에서 이러한 시도는 많은 어려움, 예컨대, 시스템의 완벽한 모델이 알려지지 않거나, 최적 제어정책을 구하기 위한 계산이 불가능하거나, 수없이 많은 계산 자원을 필요로 하는 등의 문제점을 안겨줄 수 있다. 이러한 동적 계획법의 어려움을 극복하기 위한 전략으로, 근사적 가치함수에 의존하여 준최적 제어정책을 구하는 근사적 동적 계획법을 사용할 수 있다. 본 논문에서는 최근에 제시된 근사 동적 계획법들을 복잡한 제약조건을 갖는 주행 문제에 적용하여 보고 그 결과로 얻어지는 성능 특성을 관찰해 본다.

Keywords

References

  1. Y. Wang and S. Boyd, "Approximate dynamic programming via iterated Bellman inequalities," Stanford University, 2010. (Available at http://www.stanford.edu/ -boyd/papers.html)
  2. B. O'Donoghue, Y. Wang, and S. Boyd, "Min-max approximate dynamic programming," Proceedings of 2011 IEEE International Symposium on Computer-Aided Control System Design, pp. 424-431, 2011.
  3. D. P. Bertsekas, "Dynamic programming and suboptimal control: A survey from ADP to MPC," European Journal of Control, vol. 11, nos. 4-5, pp. 310-334, 2005. https://doi.org/10.3166/ejc.11.310-334
  4. 김정민, 허정민, 정승영, 김성신, "자율주행 장치를 위한 수정된 유전자 알고리즘을 이용한 경로계획과 특징 맵 기반 SLAM," 한국지능시스템학회 논문지, 19 권 3호, pp. 381-387, 2009.
  5. 나두영, 노수희, 문형필, 정진우, 김용태, "모듈형 로봇의 자가 결합을 위한 퍼지 주행 제어 및 장애물 회피 제어", 한국지능시스템학회 논문지, 19권 4호, pp. 470-477, 2009.
  6. V. A. Huynh, "Navigation in GPS-denied environments using approximate dynamic programming," MIT, 2009. (Avilable at http://www.mit.edu/-vuhuynh/publications.html)