2005年09月20日 星期二 18:56
的确GDS这样躲到起用也好不错, 肯本不用去买什么google mini On 9/20/05, goopler <alang.yl at gmail.com> wrote: > > Lucene的方案,要想达到比较好的中文分词效果,还是要自己写分词实现,默认分词对中文效果不好。 > 已经有国人实现了一些针对Lucene的中文分词技术,我正在学习。 > 另外,看这一篇好文:使用Google桌面搜索构建企业搜索方案<http://www.blogcn.com/User8/flier_lu/blog/20045179.html> > 摘录: > 好在 GDS 提供了查询服务支持,我们可以通过此接口获取我们感兴趣的查询结果,并翻译成远程可用的地址链接。 > 主要流程如下: > 1.检测 GDS 的安装情况,获取其查询请求的key > 2.向 GDS 以特定格式发送查询请求 > 3.解析 GDS 返回的 XML 格式查询结果 > 4.将查询结果翻译成远程可用形式,并在门户上展示 > 原文提供的代码是java实现,网上还有另一个java实现,Java GDS API <http://gdapi.sourceforge.net/> > 我在想:做一个Python实现,问题不就解决了吗?中文全文分词、索引、搜索,全部由后台的GDS实现,展现给用户只是我定制的web页面。 > 好想法,我都要笑了。 > -------------- next part -------------- An HTML attachment was scrubbed... URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20050920/c708cbfe/attachment.html
2005年09月20日 星期二 20:12
GDS只能安装在win平台吧? 在05-9-20,panhudie <nirvana117 at gmail.com> 写道: > > 的确GDS这样躲到起用也好不错, 肯本不用去买什么google mini > > On 9/20/05, goopler <alang.yl at gmail.com> wrote: > > > > Lucene的方案,要想达到比较好的中文分词效果,还是要自己写分词实现,默认分词对中文效果不好。 > > 已经有国人实现了一些针对Lucene的中文分词技术,我正在学习。 > > 另外,看这一篇好文:使用Google桌面搜索构建企业搜索方案<http://www.blogcn.com/User8/flier_lu/blog/20045179.html> > > 摘录: > > 好在 GDS 提供了查询服务支持,我们可以通过此接口获取我们感兴趣的查询结果,并翻译成远程可用的地址链接。 > > 主要流程如下: > > 1.检测 GDS 的安装情况,获取其查询请求的key > > 2.向 GDS 以特定格式发送查询请求 > > 3.解析 GDS 返回的 XML 格式查询结果 > > 4.将查询结果翻译成远程可用形式,并在门户上展示 > > 原文提供的代码是java实现,网上还有另一个java实现,Java GDS API<http://gdapi.sourceforge.net/> > > 我在想:做一个Python实现,问题不就解决了吗?中文全文分词、索引、搜索,全部由后台的GDS实现,展现给用户只是我定制的web页面。 > > 好想法,我都要笑了。 > > > > > _______________________________________________ > python-chinese list > python-chinese at lists.python.cn > http://python.cn/mailman/listinfo/python-chinese > > > -- Blog:http://www.donews.net/changzheng -------------- next part -------------- An HTML attachment was scrubbed... URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20050920/13f0dd3e/attachment-0001.htm
2005年09月20日 星期二 21:42
> GDS只能安装在win平台吧? 网上已经有很详细的实作文章了,需要两台电脑,一台win+GDS,一台Linux+apache(+spider),轻松搞定自己的个人搜索门户。 百度的桌面搜索不行,因为据研究表明它的桌面版中文分词能力比网络版差太多,特别是长中文词,尤其差。估计Baidu是怕它的中文分词技术被人破解了吧,所以在桌面版不公开了。再说Baidu也没有api啊(印象中好像没有,说错了膜怪) 今天在网上和Google Desktop Developer Group 里面找了一些python+GDS的例子,算是了解些情况,基本上python+win32com方式,而用 Python+http/xml方式的比较少,是不是与Python的xmlrpc/Web Service处理较为麻烦、或者能力弱有关?(没有做过Web Service瞎猜)有人认为是COM方式能够控制的东西更多些,不只是Query,还可以限制GDS的indexing目录/子目录等。如果是后者,我也愿意选择COM方式。 感觉任何东西深入下去,都是有好多知识要学习啊。
2005年09月20日 星期二 21:58
我觉得基于win平台性能会不会很差?内网使用可能还好 在 05-9-20,goopler<alang.yl at gmail.com> 写道: > > GDS只能安装在win平台吧? > > 网上已经有很详细的实作文章了,需要两台电脑,一台win+GDS,一台Linux+apache(+spider),轻松搞定自己的个人搜索门户。 > > 百度的桌面搜索不行,因为据研究表明它的桌面版中文分词能力比网络版差太多,特别是长中文词,尤其差。估计Baidu是怕它的中文分词技术被人破解了吧,所以在桌面版不公开了。再说Baidu也没有api啊(印象中好像没有,说错了膜怪) > > 今天在网上和Google Desktop Developer Group > 里面找了一些python+GDS的例子,算是了解些情况,基本上python+win32com方式,而用 > Python+http/xml方式的比较少,是不是与Python的xmlrpc/Web > Service处理较为麻烦、或者能力弱有关?(没有做过Web > Service瞎猜)有人认为是COM方式能够控制的东西更多些,不只是Query,还可以限制GDS的indexing目录/子目录等。如果是后者,我也愿意选择COM方式。 > > 感觉任何东西深入下去,都是有好多知识要学习啊。 > -- Blog:http://www.donews.net/changzheng
2005年09月21日 星期三 08:37
在 05-9-20,goopler<alang.yl at gmail.com> 写道: > > GDS只能安装在win平台吧? > > 网上已经有很详细的实作文章了,需要两台电脑,一台win+GDS,一台Linux+apache(+spider),轻松搞定自己的个人搜索门户。 > > 百度的桌面搜索不行,因为据研究表明它的桌面版中文分词能力比网络版差太多,特别是长中文词,尤其差。估计Baidu是怕它的中文分词技术被人破解了吧,所以在桌面版不公开了。再说Baidu也没有api啊(印象中好像没有,说错了膜怪) > > 今天在网上和Google Desktop Developer Group > 里面找了一些python+GDS的例子,算是了解些情况,基本上python+win32com方式,而用 > Python+http/xml方式的比较少,是不是与Python的xmlrpc/Web > Service处理较为麻烦、或者能力弱有关?(没有做过Web > Service瞎猜)有人认为是COM方式能够控制的东西更多些,不只是Query,还可以限制GDS的indexing目录/子目录等。如果是后者,我也愿意选择COM方式。 > > 感觉任何东西深入下去,都是有好多知识要学习啊。 com是调用GDS的标准方法,包括sidebar。不过python在这方面的例子很少。 -- I like python! My Donews Blog: http://www.donews.net/limodou
Zeuux © 2025
京ICP备05028076号