현재의 검색엔진에서 부족한 한가지...

구글과 같은 검색엔진에서 한가지 부족하다고 느끼고 있는것 중의 하나가
수집 문서의 분류에 대한 것이다.
예를들어 만약 "델파이"라고 검색어를 지정한다면 프로그래밍 언어로서의 델파이가
있을 것이고 자동차 부품회사 델파이도 있다. 따라서 이 두가지가 모두 검색결과에
나타나게 되는데 정말 원하는 검색결과는 프로그래밍 언어인 델파이에 대한 자료이다.
이러한 문제를 해결하기 위해서는 수집한 문서를 자동으로 분류하는 시스템이 필요하다.
그리고 사용자가 입력한 검색어가 어떤 분류에 속하는 것인지 판단할 수도 있어야 하고.
구글과 같이 검색기록을 보관하면 원하는 검색결과가 어떤 분류에 속하는지는 알 수
있지 않을까 한다. 하지만 문서를 수집할 때 어떻게 문서를 자동으로 분류할 수 있을까?
언젠가는 이 주제에 대해 도전해 보고 싶은 맘이다.

by 미노 | 2007/05/10 23:03 | 검색엔진 | 트랙백 | 덧글(3)

트랙백 주소 : http://wyb330.egloos.com/tb/3165134
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Commented by typos at 2007/05/11 09:03
어찌 이것 한가지만 있겠습니까 ㅎㅎ.
Commented by 최종욱 at 2007/05/13 13:01
데이터 클러스터링.. 첫눈과 Vivismo에서 하고 있다죠.
Commented by 하니가모 at 2009/08/07 15:54
구글의 접근은 "연관 검색어" - 확장 키워드 - 를 통해서 의미를 좁혀가도록 가이드하는 방향 같습니다. 컴퓨터 프로그램에 의한 직접적인 분류는 좀 위험하잖아요... ^^

:         :

:

비공개 덧글

◀ 이전 페이지다음 페이지 ▶