네이트가 시멘틱검색을 발표했습니다. 신문기사 제목을 보고 아직 이론으로나 이야기 되고있는 '시맨틱웹' 을 넘어서서 '시맨틱 검색'이 나왔다니 놀랄 수 밖에 없었습니다.
시맨틱 검색을 이야기하기 앞서 우선 간단하게나마 시맨틱웹에 대한 개념을 먼저 이야기 한다면, 시맨틱웹은 컴퓨터가 정보의 의미를 이해하고 이를 개념으로 정의하여 개념과 개념과의 관계를 설정한다는 것으로 사람의 판단이 개입되지 않고 자동화된 에이전트에 의해 검색이나 새로운 지식의 생성이 가능한 웹이라는 의미입니다.
시맨틱 웹이란 한마디로 이야기 하면 컴퓨터가 사람처럼 판단하는 판단력을 가지고 있음을 전제로 성립됩니다. 시맨틱 검색을 이 개념에 비추어 본다면 검색엔진이 판단하여 검색결과의 중요성을 결정하고 검색결과에 대한 순위를 매긴 후 중요한 검색결과가 먼저 오게 조정 할 수 있음을 의미합니다.
간단한 예를 들어 보겠습니다.
검색창에 '해리포터' 라는 키워드를 쳤을 때 (스폰서링크를 제외하고) 가장 먼저 나와야 할 검색결과는 무엇일까요? 해리포터 영화? 해리포터 책? 해리포터 게임? 영화라면 1편인 마법사의 돌? 7편인 혼혈왕자? 현재 네이버나 다음음 검색결과에는 영화 해리포터 7편의 스페셜페이지가 가장 먼저 나오고있습니다. 왜냐하면 지난 여름 이 영화가 개봉 되었기 때문입니다. 만일 해리포터 책 8권이 나 프리퀄 같은 책이 나온다면 그 시점을 전후해서는 그 책의 정보가 가장 먼저 나올 것입니다.
이렇듯 같은 키워드에 대응하는 검색결과라도 시점이나 화제성, 트랜드에 따라 검색결과의 순위는 바뀌어야 하는데 네이버나 다음 검색에서는 이를 사람이 판단하고 순위를 수동으로 조정합니다. 그래서 통합검색을 편집검색이라고 이야기 합니다. 해리포터 책이 나와 화제가 될 때는 책이 상단으로, 영화가 화제일때는 영화를 상단으로 조정합니다.
진정한 시맨틱 검색이 구현된다면 이러한 작업을 사람이 아니라 컴퓨터가 인공지능을 통해 판단하고 조정한다는 의미입니다. 몇가지의 규칙을 만들어서 컴퓨터가 일부의 작업을 할 수 있도록 할 수는 있겠지만 모든 키워드에 대응해서 규칙을 만들 수는 없으며 만든다고 해도 그 정확성 및 신뢰성이 떨어지기에 그래서 네이버가 돈이 많이 들어도 사람들을 이용해서 검색결과를 편집하는 것 입니다.
마찬가지로 동명이인이나 동음이의어, 이음동의어, 자연어에 대한 처리 등 컴퓨터가 정보의 의미를 이해하기에는 아직 과학기술이 한참 못미치고 있습니다. 네이트 시맨틱 검색에 '잭슨' 이라고 쳤을 때 네이트는 마이클 잭슨에 대한 검색 결과를 주로 보여주는데 과연 사용자들이 마이클 잭슨만 검색하냐 하면 그것은 아니라는 것입니다. 영화감독인 피터잭슨이나 영화배우 사무엘 L 잭슨, 동생인 재닛 잭슨 일 수 도 있고 또 다른 가수인 잭슨 브라운일수도 있고 미술가인 잭슨 폴록 일수도 있습니다.

네이트의 시맨틱 검색은 시맨틱 검색이라기 보다는 시소러스를 이용하여 웹검색 결과를 보여주는 검색인것 같습니다. 시소러스는 원래부터 도서검색에 많이 쓰이던 개념이며 시맨틱 검색과는 상관이 없습니다. 그리고 이런 설정이 되어있는 키워드 역시 기존의 스페셜 페이지를 중심으로 작성되어 있습니다. 즉 연예인이나 영화 등 통합검색 상단에 오는 스폐셜페이지에서 제한적으로 보여주던 내용을 '시멘틱'이라는 이름으로 UI를 좀 바꾸어 웹검색결과를 뿌려주고 있습니다.

네이트가 네이버나 다음 검색에 밀려 뭔가 새로운 돌파구를 찾기 위해 노력하고 있다는 사실은 인정할 만합니다. 다만 이런식으로 '시맨틱 검색' 이 아닌 것을 '시맨틱 검색' 이라 부르면서까지 하는 것은 아닌 것 같습니다. 국산차에 BMW 마크를 단다고 해서 성능까지 BMW가 되는 것은 아니니까요.
← 좌측의 버튼을 누르시면 한RSS를 통해 더욱 편리하게 '니오의 nweb'을 구독하실 수 있습니다.








