针对高科技领域的语义搜索--超越Google的搜索引擎?
扫描二维码
随时随地手机看文章
“我们认为基于关键词的搜索需要改进,这也是我们发布illumin8的一个原因,我们需要找出信息的含义,”Elsevier公司illumin8的产品经理Joe Buzzanga表示,“这真的是个基于自然语言处理技术的研究和开发的工具,我们已经为我们的核心用户提供服务,他们都是各个企业里的研发专业人士。”
新的搜索引擎不是免费的,但已经在网页上运作了,允许用户执行他们之前在Google、Yahoo或其他关键词搜索引擎上所做的类似的查询。不同的是当你点“搜索”按钮,不是立即出现搜出的相关度排名列表,illumin8会花几秒钟与它的语义数据库进行对比来决定你的查询的含义。Elsevier的crawler算法是经常的搜索60亿个页面、3百万篇科学和技术期刊文章、3千3百万科学报告的结果,和2千1百万个专利,这些结果被翻译到11亿个相关概念的语义解释上。
在完成对你的相关查询的语义抽取后,立即可以在整个视窗屏幕显示出分栏的搜索结果,分类是根据组织、方法、益处、作者/发明者、公司和产品。每栏都有一系列搜索的信息,显示每个不同的项目的所有搜索结果。
将鼠标移到相关条目上会弹出一个窗口显示摘要,指出相关性并分类,还会拼出缩写词和别称。点击该条目就可以新出一个窗口转到搜索的结果。
搜索需要花费15秒钟来锁定语义数据库中的结果,而且需要近1分钟(取决于你得到信息的数量)来在概要页中进行组织。Elsevier表示目前正在为提高速度进行升级的工作,概要页面可以被约束为只显示网页条目、只显示期刊条目或专利条目,或自定义。例如,输入“半导体研发”,在概要页会出现5284个结果,包括公司、方法、人物、产品和其他相关结果 - 3869个项目是来自网页的。该查询出来的“公司”是由升序排列,包括了IBM、INTEL、英飞凌、意法半导体、三星、摩托罗拉、AMD、Toshiba、德州仪器等等。
使用illumin8需要注册,对各个组织的价格不同。目前已经有免费的语义搜索供读者尝试,虽然不提供概要页面,数据库也没有illumin8那么大。大家可以试试Hakia(http://www.hakia.com/,只搜索网页)或者Powerset(http://www.powerset.com/只搜索Wikipedia)。