|
|
|
|
|
피츠버그 카네기멜론대학(미국)=정종오기자 ikokid@inews24.com
2007년 01월 01일
"2007년 검색화두는 개인화 검색이 될 것이다."
카네기멜론대학(CMU) 언어기술연구소(Language Technologies Institute) 하이미 카보넬(Jaime G. Carbonell) 소장은 2007년 검색의 화두로 '개인화 검색(Personalized Search)'을 꼽았다. 검색기술이 더욱 정교해 지면서 개인에게 최적화된 검색이 주목받을 것이라고 말했다.
이러한 검색기술에서 특히 중요한 것은 각 나라의 언어를 번역해주는 MT(Machine Transfer)기술이 키포인트라고 설명했다. 카보넬 교수는 "제대로 된 검색결과를 보여주기 위해서는 내용에 따라 언어를 번역해 줄 수 있어야 한다"며 "자동화된 기계번역 기술력이 얼마나 고도화되느냐가 개인화 검색의 출발점"이라고 강조했다.
2007년 언어기술연구소의 연구방향도 이와 다르지 않다고 말했다. 그는 "마이크로소프트, 구글, 야후 등 전세계 인터넷업체들의 2007년 관심은 개인화 검색으로 옮겨갈 수 밖에 없다"며 "구글의 검색이 뛰어나다하더라도 아직 여기까지는 미치지 못하고 있다"고 지적했다.
◆ 다음은 일문일답.
-검색엔진은 디렉토리에서 키워드로 그리고 최근엔 구글의 페이지랭크 등 점점 발전해 왔다. 내년도 검색의 주요 흐름은 어떤 것이 될 것으로 보는가.
"검색기술은 점점 더 기술력이 고도화되는 것으로 발전했다. 여러 개의 데이터를 뽑아 다양한 결과를 만들어주는 검색기술, 나아가 나에게 최적화된 검색을 보여주는 개인화 검색이 내년도 주요 방향성이 될 것이다.
최근 CMU에서 만든 비비시모(vivisimo.com)를 미국 연방정부에서 사용하기로 결정했다. 비비시모는 메타데이타를 통해 다양한 결과물을 보여주는 검색기술이다. 텍스트 뿐만 아니라 이미지, 동영상 등 다양한 종류의 데이터를 처리할 수 있다.
최근 전세계적으로 관심의 대상이 되고 있는 UCC(이용자제작콘텐츠)를 추적해서 최상의 결과물을 뽑아낼 수 있는 기술력이다. 특히 이 기술은 서로 다른 언어, 서로 다른 미디어로 인한 번역에도 큰 효과를 내고 있다."
-지구촌에는 서로 다른 언어가 상당히 많다. 최상의 결과물을 보여주기 위해서는 정확한 번역이 필요한데 언어공학연구소에서 하는 역할이 궁금하다.
"무엇보다 중요한 것이 언어문제이다. 영어와 스페인어 등 서로 비슷한 문법 구조를 가진 언어도 있지만 그렇지 않은 경우가 더 많다. 영어와 일본어를 번역하는데는 상당히 복잡한 단계를 거처야 정확한 의미를 해석할 수 있다.
언어기술연구소의 2007년 주요 연구과제중의 하나가 바로 MT(자동화된 기계번역)이다. MT에서 가장 중요한 것은 단어를 단어로 번역해 주는 것이 아니다. 정확하게 무엇을 의미하고 있는지 그 내용을 번역해 주는 기술력을 말한다.
현재 일본, 중국, 한국, 아랍, 프랑스, 독일, 러시아 등 주요 나라별 언어를 70%까지 정확히 번역할 수 있는 MT에 이르고 있다. 올해에는 더욱 정교화게 기술을 발전시켜 거의 100% 일치하는 MT를 만들 계획이다."
-구글의 검색기술력에 대한 네티즌들의 관심이 높다. 구글이후는 어떤 검색흐름이 될 것으로 예상하는가.
"구글의 검색기술력은 뛰어난 것이 사실이다. 하지만 여전히 아직까지 정확한 검색결과를 보여주지 못하고 있다. 예를 들어 심장병 전문의인 한 의사가 수술에 필요한 로봇을 구매하기 위해 구글검색을 이용한다고 치자.
구글의 검색결과는 일반인들이 알 수 있는 검색 결과물을 보여줄 뿐이다. 즉 심장병 전문의인 내게 필요한 정보가 아니라 일반 대중들이 관심을 가지는 검색결과를 보여준다는 것이다. 앞으로 이런 검색결과가 많이 변화할 것으로 보인다.
심장병 의사인 나에게 꼭 필요한 검색결과를 보여줘야 한다는 것이다. 그것이 바로 한 개인의 검색 유형을 알고리즘으로 분석해 정보를 제공할 수 있는 '개인화 검색'이다. 이미 구글, 마이크로소프트, 야후 등이 개인화 검색으로 나아가고 있지 않은가.
CMU를 비롯해 마이크로소프트, 구글, 메사추세츠 대학 등이 내년도 개인화 검색을 연구하기 위해 이미 출발을 하고 있다. CMU 언어공학연구소의 주요 연구방향 중의 하나가 될 것이다.
이를 한마디로 정리하자면 현재 구글이 가지고 있는 검색기술력인 페이지랭크에다 개인화된 검색기술력이 결합, 최적의 결과물을 보여주는 방향으로 움직일 것이다."
-2007년도 CMU 언어공학연구소의 기타 연구방향성이 궁금하다.
"첫번째는 개인화검색이 될 것이다. 2007년 언어공학연구소의 연구과제는 많다. 두번째로는MT를 더욱 정교하게 만들기 위한 작업에 뛰어들 것이다. 현재 언어적 특성, 및 내용에 따라 번역할 수 있는 시스템을 고도화시키고 있다.
세번째는 BLM(Biological Language Modeling)이다. 생물학적 언어를 분석해 적절한 모델링을 함으로써 인체의 질병을 어떻게 효과적으로 대응할 수 있을 것인지는 연구하는 모델링이다. 즉 복잡한 DNA 구조를 언어로 대체해 연구하는 과제이다.
그리고 네번째로는 DM(Data Mining)이 될 것이다.
무엇보다 이러한 여러가지 연구과제를 수행하는 데 있어 중요한 것은 다양한 소스를 모두 받아서 최적화시키는 기술력이 될 것이다. CMU의 주요연구 방향성에다 다양한 소스경로를 통합시키는 것이 2007년 언어공학연구소의 핵심 연구과제가 될 것이다."
CMU 언어기술연구소는 라이코스가 탄생한 본고장이다. 카보넬 교수의 제자인 마이클 몰딘 교수가 라이코스 검색을 만들었다. CMU 언어공학연구소는 카보넬 교수가 설명했듯 언어를 최적화된 내용으로 번역해 네티즌들에게 최적의 검색을 보여줄 수 있는 연구를 수행하고 있다.
카보넬 교수는 자신이 직접 수행하고 있는 연구과제에 대한 PPT(파워포인트) 자료를 컴퓨터로 열거하면서 상세하게 설명해 줬다. 같은 검색 키워드를 통하더라도 개인의 관심분야에 따라 다른 결과물을 보여주는 '개인화 검색'이 2007년 어떤 모습으로 다가올지 관심이 모아지고 있다.
|
http://kr.blog.yahoo.com/scla98/trackback/3/8
|
|
|
|
|