시맨틱 검색 기술 동향

□ 날짜: 2010.02.02
□ 출처: 정보통신산업진흥원, 포커스
□ 분야: Semantic web
□ 키워드: Semantic web, Semantic search
□ 연관 내용: 
□ 내용 요약:

1. 서론
- Google trend(http://trends.google.com에서 검색 빈도수 검색을 할 수 있음.

2. 시맨틱 검색 기술
- 구글은 부가적으로 페이지 랭크(Page rank)와 깉은 하이퍼링크 정보를 추가적으로 활용하여 사용자 의도에 근접한 검색 결과를 보여줌.

- 사용자에게 제공하려고 하는, 원하는 결과를 보여주기 위해 3가지 해결 방법이 있다.

* 보유 정보를 분석해본 후 사용자에게 질문을 다시하여 검색어의 의미를 명확히 만드는 방법

* 위치, 성향 등 사용자 정보를 추가적으로 이용하는 방법

* 사용자가 원하는 정보를 선택할 수 있도록 검색 결과를 정리하여 제공하는 방법


- 키워드 이외의 정보, 능동적 해석, 사용자와의 상호작용 → 정보 연결 기술, 정보 검색 기술, 정보 시각화 기술, 정보 접근 기술


- 정보 검색의 핵심: 사용자의 질의 의도를 정확하게 파악하고, 관련 정보를 검색하며, 한 눈에 쉽게 이해할 수 있는 형식으로 시각화, 효율적으로 접근할 수 있게 하는 것

- 검색을 위해서는?

* 검색 기반 마련

- 색인: 정보를 수집하고 식별 체계, 정보 관리 체계를 이용하여 정보를 구축

- 정보확장: 자연어처리, 추론 기술을 적용

- 결과 생성: 

SPARQL과 같은 시맨틱 웹 질의 언어로 검색어를 매핑시키는 변환 과정

RDF 트리플 저장소나 데이터베이스 등에서 정보를 찾는 탐색 과정

- 정보시각화

단순 정보를 제공하는 시각화

사용자와 시각화를 위한 통찰력을 제공하는 시각화

사용자와 정보서비스 사이의 상호작용을 지원하는 시각화


3. 해외 기술 현황
- 해외 시맨틱 검색 기술과 검색 엔진에 대한 리뷰 정보는 Search Engine Journal에 잘 나타남.

- 시맨틱 검색 기준

* 검색어 생성(Query Construction)

- 자연어 입력

- 연산자: AND, OR, NOT

- 통제 어희: 의학, 생물학, 문헌정보학 등

- 사용자 피드백: 자동완성 기능 등

* 검색 알고리즘(Search Algorithm)

- 문법적 일치(Syntactic Matching): 형태소 분석, 전후방 일치, 스테밍 등의 일반적 검색 알고리즘

- 의미적 일치(Semantic Matching): 의미 유사도 계산, DL(Description Logic), 규칙 기반 추론 등의 의미적 검색 알고리즘

* 결과 표현(Presentation of Results)

- 자료 선택Data Selection): 정보 형태의 선택

- 정렬(Ordering): 연관 정보 제시 기준

- 구성(Organization): 사용자가 원하는 정보의 배열에 관한 것

* 사용자 피드백(User Feedback)


- Quintura


- Bing: 검색어에 대한 연관 정보를 제공


- Wolfram Alpha

* Computational Knowledge Engine이라는 모토 하에 일종의 질의 응답 서비스를 제공

* Seoul Washington DC라고 입력하면 두 도시의 인구/시각/고도, 두 도시간의 거리 등을 제시한다.

* 가장 진보된 형태의 시맨틱 검색이라 한다.


4. 국내 기술 현황

- 한국과학기술정보연구원 OntoFrame 서비스

- 시맨틱스 Qrobo

- 네이트 시맥틱 검색

- 네이버랩: 시맨틱 영화 검색

- 솔트룩스 Owlim



5. 결론
- 시맨틱 검색은 문서의 웹(Web of documents)이 데이터의 웹(Web of Data)으로 진화하는 현 시점에서 기존 검색에서는 얻을 수 없는 수준의 결과를 만들어 내는 잠재력을 지녔다.

□ 내용 평가:

+ Recent posts