Design and Implementation of a HTMLtoVoiceXML Converter

HTMLtoVoiceXML 변환기의 설계 및 구현

  • 최훈일 (청주대학교 전산정보공학과) ;
  • 장영건 (청주대학교 컴퓨터정보공학과)
  • Published : 2001.12.01

Abstract

It is possible to access web contents by mobile terminals and telephones due to the evolution of voice and VoiceXML technologies. Nevertheless, because these days most of all the web contents are constructed by HTML, it is impossible to access them by using the new technology. Therefore, to access the contents through voices requires the conversion of the web document from HTML to VoiceXML, but its manual conversion process should be involved additional time and expenditure. In this paper, we design and implement HTMLtoVoiceXML converter, suggest a system structure of it and propose a practical identification algorithm of meaningful fragmented group of contents to solve the problem. To test the performance and validity of the converter, we apply it to more than 400 web pages in Korean web sites, it works well except for web pages which involve invalid HTML codes.

음성 기술의 발달과 VoiceXML 1.0의 등장으로 인하여 표준화된 방식으로 이동 단말기와 전화를 통해 음성으로 웹 컨텐츠에 접근할 수 있게 되었다. 거의 모든 웹 컨텐츠들은 HTML로 작성되어 있으며, 기존의 HTML로 작성된 수많은 웹 컨텐츠에 음성으로 접근하기 위해서는 HTML 문서들을 VoiceXML 문서로 변환하여야 한다. 이를 수동으로 변환하기 위해서는 많은 시간과 비용이 필요하게 된다. 본 논문에서는 이 문제를 해결하기 위하여 HTML 문서를 VoiceXML 문서로 자동 변환하는 HTMLtoVoiceXML 변환기를 설계하고 구현하였으며, 그 구조를 제시하고 웹 페이지에서 중요한 내용을 포함한 조각을 지정하는 실용적인 알고리즘을 제안한다. 국내의 400여 개의 웹 페이지를 대상으로 개발된 변환기의 성능을 시험하였고, HTML문법을 정확히 지키지 않은 경우를 제외하고, 거의 모두가 VoiceXML 문서로 변화되어, 유효성과 실용성이 검증되었다.

Keywords

References

  1. VoiceXML Forum, www.voicexml.org
  2. W3C, 'Voice eXtensible Markup Language(Voice XML) version 1.0', http://www.w3.org/TR/voicexml, W3C Note 05, May 2000
  3. 김경란, 홍기영, 'VXML 편집기와 음성 브라우저의 설계 및 구현', 2000년 한국정보과학회 춘계학술대회 논문집, 27권 1호(B), pp.414-416, 2000.4
  4. 김경란, 'VoiceXML 기반 음성 브라우저의 설계 및 구현', 성신여자대학교 석사학위 논문, 2001.2
  5. http://www.mediaford.co.kr/
  6. 윤현주, 하춘, 은성배, 김병호, 강상민, 서원균, 'VXML 인터프리터의 설계 및 구현', 제9회 한국음성과학회 학술발표대회 논문집, 2000
  7. http://www.brain21.com/
  8. Stuart Goose. Mike Newman, Claus Schmidt, Laurent Hue, 'Enhancing Web accessibility via the Vox Portal and a Web-hosted dynamic HTMI.<->VoxML converter', WWW'9, Volume 33, Numbers 1-6, pp583-592, June 2000 https://doi.org/10.1016/S1389-1286(00)00036-0
  9. Mohan, R., Smith, J. & Li, C.-S., Adapting multimedia internet content for universal access', IEEE Transactions on Multimedia, pp104-114, 1999 https://doi.org/10.1109/6046.748175
  10. Vorburger, M. Altifier, 'Web acessibility enhancement tool', Available at http://www.vorburger.ch, 1999
  11. Asakawa,C. et al, 'User Interface of a Homepage Reader', Pro. of ASSET98, pp149-156, April 1998 https://doi.org/10.1145/274497.274526
  12. Kaasinen, E. et al, 'Two Approaches to bringing internet Services to WAP devices', Pro. of WWW9 Conference, pp231-246, May 2000
  13. Raman,T.V., 'Emacspeak-- direct speech access', Pro. of ASSETS '96, pp32-36, April 1996 https://doi.org/10.1145/228347.228354
  14. Zajicek M, 'A Web navigation tool for the blind', Pro. of ASSETS '98, pp204-206, April 1998 https://doi.org/10.1145/274497.274534
  15. Anita W. Huang, 'A Semantic Transcoding System to Adapt Web Services for Users with Disabilities', Pro. of ASSETS '00, pp156-163, Nov. 2000 https://doi.org/10.1145/354324.354363
  16. Asakawa, 'Annotation-Based Transcoding for Nonvisual Web Access' Pro. of ASSETS '00, pp172-179, Nov. 2000 https://doi.org/10.1145/354324.354588
  17. Hironobu Takagi, 'Transcoding Proxy for Nonvisual Web Access', Pro. of ASSETS '00, pp164-171, Nov. 2000 https://doi.org/10.1145/354324.354371
  18. DW. Embley, YS. Jiang, and Y.-K. Ng. 'Recordboundary discovery in Web documents', In Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data (SIGMOD'99), pp467-478, Philadelphia, Pennsylvania, 31 May - 3 June 1999 https://doi.org/10.1145/304182.304223
  19. David Buttler, Ling Liu, Calton Pu. 'A Fully Automated Extraction System for the World Wide Web', IEEE lCDCS-21, Phoenix, Arizona, April 16-19, 2001 https://doi.org/10.1109/ICDSC.2001.918966
  20. G.F. Luger, W.A. Stubblefield, 'Artificial Intelligence: Structures and Strategies for Complex Problem Solving', Third Edition. Addison Wesley Longman, Inc., 1997
  21. http://www.w3.org/People/Raggett/tidy/