a我考网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 76|回复: 1

[韩语阅读] 韩语阅读辅导:搜索功能大幅升级(1)

[复制链接]
发表于 2012-8-17 00:40:02 | 显示全部楼层 |阅读模式
야후 검색 성능 대폭 업그레이드( d6 P+ t, w+ m) b5 j( E: y, h
& r( w8 p" ^( H$ ~' M. S$ `
어, 야후 검색이 엄청 변했네. $ O% C- t( b/ ]3 `$ `
0 q" O4 X. h5 V7 ?% u' P
야후코리아(대표 이승일)의 검색 기능이 확 바뀌었다. 한 달 전에 비해 한글 웹페이지의 검색 성능이 눈에 띄게 좋아진 것.   J6 _2 z9 m% d) ?0 q3 j9 v2 T: R
2 K, ?5 |, a) L2 d7 v4 A; x
야후 서비스에 무슨 변화가 있었던 것일까.
. @8 K9 ^9 y/ u' I0 `2 f- _5 y- B9 \8 Y. ]: z5 j  ^
야후 본사는 최근 몇 년간 새로운 검색기술 개발에 주력해왔다. 그러다 2월 YST(Yahoo! Search Technology)라는 자체 검색엔진을 선보였다. 이 기술이 국내 사이트에도 적용되면서 검색 기능이 대폭 업그레이드된 것. : z9 }& |' Z, X1 _' k8 W+ h

0 d, V4 Y3 u6 k" X  }2 \야후 본사가 웹페이지 검색에 구글(Google)을 채택했던 것과는 달리 야후코리아는 국내 업체의 검색엔진을 사용해왔다. 그러나 이 한글 검색엔진은 종종 사오정과 같은 결과를 보여줘 이용자를 곤혹스럽게 했다. + x8 d" H* c; l% z4 f8 {# L& e
  Q% L9 L( B4 q2 W/ _
예를 들어 판소리 신동인 유태평양군의 이름을 검색하면 1만여건이 넘는 결과가 검색되는데 그중에서 법무법인 태평양의 한 변호사가 첫 번째로 등장했던 것.   J/ J+ C9 w& v! }

% j1 h& l8 o) W: z* Z' a( f이처럼 검색어와 상관없는 자료가 가장 먼저 검색되는 것은 한글 복합명사 처리기술의 문제 때문이다. 유태평양이란 단어를 복합명사로 오인하고 유와 태평양으로 분리해 검색한 것.
. U+ E& @& G9 W! k3 Z+ l4 F5 G, A6 ]- @" s
야후코리아는 YST의 성능이 토종 검색 포털은 물론 구글도 능가한다고 주장한다. 과연 그럴까.
% `9 r! l6 Z5 {% {
2 K1 Y! Z6 y; B  S3 K* d8 x검색 포털 업체들은 성능 비교 자료에 매우 민감한 편이다. 따라서 공식적인 순위는 아직 없지만 이용자 입장에서 간단한 테스트를 해보면 대략 윤곽을 알 수 있다. 각각의 사이트에 동일한 검색어를 넣어 검색 결과의 건수와 정확성, 관련도 등을 비교해 보는 것.
回复

使用道具 举报

 楼主| 发表于 2012-8-17 00:40:03 | 显示全部楼层

韩语阅读辅导:搜索功能大幅升级(1)

예를 들어 1970년대 유행가요 불나무의 가사 중 오 그대는 아는가라는 부분을 검색했을 때 이 구절이 담긴 웹페이지를 가장 먼저 소개해야 관련도가 높은 것으로 볼 수 있다. 7 y! w0 ?, c; V( z

0 i' I$ ?$ X- n4 Y7 o& E6 M여러 단어를 한 단어처럼 통째로 검색하는 구문 검색기능도 시험해 볼 수 있다. 구문 검색 기호로는 주로 큰따옴표가 사용된다. 결과를 비교해 보면 야후코리아의 약진을 어느 정도 확인할 수 있다.
" d. x+ I. y2 B. @9 z$ y0 d* ~# e9 L야후코리아 최형우 검색사업부장은 새로운 검색엔진을 도입한 후 웹문서 검색의 데이터베이스(DB)양과 랭킹기술, 한글처리기술, 스팸사이트 걸러내기 등이 크게 향상됐다고 말했다.
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Woexam.Com ( 湘ICP备18023104号 )

GMT+8, 2024-10-7 22:17 , Processed in 0.150415 second(s), 24 queries .

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表