DOI QR코드

DOI QR Code

A Relation Analysis between NDSL User Queries and Technical Terms

NDSL 검색 질의어와 기술용어간의 관계에 대한 분석적 연구

  • Kang, Nam-Gyu (Information System Development Team, KISTI) ;
  • Cho, Min-Hee (Information System Development Team, KISTI) ;
  • Kwon, Oh-Seok (Computer Science & Engineering, Chungnam National University)
  • 강남규 (한국과학기술정보연구원 정보시스템개발팀) ;
  • 조민희 (한국과학기술정보연구원 정보시스템개발팀) ;
  • 권오석 (충남대학교 컴퓨터공학과)
  • Published : 2008.09.30

Abstract

In this paper, we analyzed the relationship between user query keywords that is used to search NDSL and technical terms extracted from NDSL journals. For the analysis, we extracted about 833,000 query keywords from NDSL search logs during nearly 17 months and approximately 41,000,000 technical terms from NDSL, INSPEC, FSTA journals. And we used only the English noun phrase in extracted those and then we did an experiment on analysis of equality, relationship analysis and frequency analysis.

본 논문에서는 NDSL을 검색하기 위해 이용자가 입력하는 검색 질의어를 대상으로 질의어에 사용되는 키워드와 학술지에서 추출한 기술용어와의 관계를 분석하고자 한다. 관계 분석을 위해 사용된 키워드는 17개월 동안의 NDSL 검색 질의어에서 추출한 약 83만3,000개, 기술용어는 NDSL, INSPEC, FSTA 3개 영문 학술지 데이터베이스 약 4,100만건에서 추출한 약 97만5,000개이다. 그리고 분석에 사용된 키워드와 기술용어는 2어절 이상의 영어 단어이며, 이들 간의 관계 분석은 키워드와 기술용어간의 일치성, 연관성, 기술용어에 대한 빈도 분석 등이다.

Keywords

References

  1. 강정미. 1999. 전문용어사전 표제어 기술형식에 대한 연구. 한국정보관리학회 학술대회논문집, 6: 39-42.
  2. 박소연, 이준호. 2007. 웹 검색 분야에서의 로그 분석 방법론의 활용도. 한국문헌정보학회지, 41(1): 231-242. https://doi.org/10.4275/KSLIS.2007.41.1.231
  3. 오종훈, 이경순, 최기선. 2002. 분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출. 정보과학회논문지: 소프트웨어 및 응용, 29(3/4): 258-269.
  4. 오종훈. 2000. 전문분야 사전과 코퍼스 및 외래어 인식에 기반한 전문용어 추출. 석사학위논문, 한국과학기술원, 전산학과.
  5. Alan L.Porter, Scott W. Cunningham. 2004. Tech Mining : Exploiting New Technologies for Competitive Advantage. New York: John Wiley & Sons, Inc.
  6. Michael J. Cafarella, Christopher Re, Dan Suciu, Oren Etzioni, Michele Banko. 2007. “Structured Query of Web Text.” 3rd Biennial Conference on Innovative Data Systems Research.
  7. Michael J. Cafarella, Oren Etzioni. 2005. “A Search Engine for Natural Language Applications.” International World Wide Web Conference Committee.
  8. Doug Downey, Stefan Schoenmackers, Oren Etzioni. 2007. “Sparse Information Extraction : Unsupervised Language Models to the Rescue.” ACL2007.
  9. Michele Banko, Michael J Cafarella, Stephen Soderland, Matt Broadhead, Oren Etzioni. 2007. “Open Information Extraction from the Web.” IJCAI-07 Proceedings, 2670-2676.
  10. JTextPro. .
  11. KORTERM. .
  12. KnowItAll. .