- 中查找“对垂直搜索的展望”更多相关内容
- 中查找“对垂直搜索的展望”更多相关内容
- ·上一篇文章:从语义网络向结构化数据回归
- ·下一篇文章:国庆中秋将至 短信传情成热点
对垂直搜索的展望
准确的说不是本人的展望,是读The Future of Vertical Search Engines的感想。
垂直搜索早就退热了,网页抓取/数据抽取/信息提取软件工具包MetaSeeker为 垂直搜索引擎建设者的提供服务的热火朝天的景象在几年前就渐渐趋于平静。今天看到这篇新博客不能不引起我的注意:垂直搜索又有什么新点子?仔细阅读以后, 我觉得仍然没有回答一个关键问题:做垂直搜索能够创造什么样的价值?说白了怎样能够通过运营垂直搜索赚到钱。根据实践经验,如果把垂直搜索仅仅看成是综合 搜索的垂直分化,运营肯定以失败告终。搜索好比沙子里面淘金子,综合搜索虽然在搜索相关性方面没有垂直搜索那么好的体验,但是,毕竟沙子多,所以可以肯定 地推断出里面的金子的总量也多。而垂直搜索,由于沙子的总量远远少于综合搜索,怎么能够吸引淘金者?根据实践经验,靠搜索相关性带来的用户体验是远远不够 的,必须要有足够吸引用户的增值服务,例如,挖掘和推荐。从运营可获利方面考虑,该文仅仅表达一种技术思想,一种原型式的研究性的思考,但是还是能够发现 他们鼓吹的新方向的一点点线索。
该文开头对垂直搜索引擎的不同发展时期的特性进行了总结:
- 过去
- 建设索引库、检索内容数据、维持运营等需要很可观的花费
- 大部分时间花在增强搜索结果相关性上,很少有时间设计独特的用户体验
- 现在
- 未来
- 新的搜索引擎应该涉足分布式的海量数据
- 更多时间用于开发出独特的方法展现相关内容和独特的用户体验
该文用多个章节讲解了未来的新特性,虽然没有看到新颖的观点,但是可以感觉到作者似乎在推动一种第三方加盟的分布式索引库的理念。从下面三个特性的逐点讲解可以观察到作者的这个意图:
相关性
该节没有新观点,只是解释一下相关性。所谓垂直就是:
相关性的获得是因为
其他数据源
到这一节,作者可能假设当前做垂直搜索引擎的很多都是依赖于其他搜索引擎提供的API,但是,现今,有更多可用的数据源。作者在这一节用了很多文字说明维基百科的作用:Understanding User's Query Intent with Wikipedia。然后提到OpenData运动能够带来更多数据源,罗列了多个开放数据组织:
简单浏览了一下这些网站,感觉主要关注网络数据的结构化(data sets)
但是根据开发垂直搜索引擎的实践经验,笔者认为上述假设有失偏颇,除了Meta Search大量使用搜索引擎API外,当前垂直搜索引擎的数据源本来就五花八门的。
区别对待内部和外部数据源
读到这一节,更觉得是Yahoo! BOSS的推介软文,首先介绍了Yahoo! BOSS的一个特性,就是将网站数据进行内部和外部分类,只有whitelist白名单中的搜索引擎合作伙伴才能获得内部数据。然后又讲到结构化数据 (data sets)和搜索。结构化数据和搜索本来就是垂直搜索引擎的重要特性,所以难于看出作者区分内部和外部数据会给业界带来什么商业价值,但是,再结合跟帖中 的讨论,似乎看到一种第三方加盟的分布式索引库的理念。可以想象的景象是:第三方合作伙伴提供结构化数据源;搜索引擎 不再花费过多时间采集网站内容、抽取网页数据、格式化成结构化数据、建立索引库,而是直接使用第三方合作伙伴的数据源,很有可能都不用建立本地索引库(就 像一个跟帖所顾虑的:如果某个合作伙伴的数据源临时性不可访问,是否会拖累搜索引擎)