Python论坛  - 讨论区

标题:Re: [python-chinese] Python下面有哪些好的全文检索、索引工具可用?

2005年09月20日 星期二 18:56

panhudie nirvana117 at gmail.com
Tue Sep 20 18:56:18 HKT 2005

的确GDS这样躲到起用也好不错, 肯本不用去买什么google mini

 On 9/20/05, goopler <alang.yl at gmail.com> wrote: 
> 
> Lucene的方案,要想达到比较好的中文分词效果,还是要自己写分词实现,默认分词对中文效果不好。
> 已经有国人实现了一些针对Lucene的中文分词技术,我正在学习。
>  另外,看这一篇好文:使用Google桌面搜索构建企业搜索方案<http://www.blogcn.com/User8/flier_lu/blog/20045179.html>
> 摘录:
>  好在 GDS 提供了查询服务支持,我们可以通过此接口获取我们感兴趣的查询结果,并翻译成远程可用的地址链接。
> 主要流程如下:
> 1.检测 GDS 的安装情况,获取其查询请求的key
> 2.向 GDS 以特定格式发送查询请求
> 3.解析 GDS 返回的 XML 格式查询结果
> 4.将查询结果翻译成远程可用形式,并在门户上展示 
>  原文提供的代码是java实现,网上还有另一个java实现,Java GDS API <http://gdapi.sourceforge.net/>
> 我在想:做一个Python实现,问题不就解决了吗?中文全文分词、索引、搜索,全部由后台的GDS实现,展现给用户只是我定制的web页面。
> 好想法,我都要笑了。
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20050920/c708cbfe/attachment.html

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月20日 星期二 20:12

清风 paradise.qingfeng at gmail.com
Tue Sep 20 20:12:05 HKT 2005

GDS只能安装在win平台吧?

在05-9-20,panhudie <nirvana117 at gmail.com> 写道:
> 
> 的确GDS这样躲到起用也好不错, 肯本不用去买什么google mini
> 
>  On 9/20/05, goopler <alang.yl at gmail.com> wrote: 
> > 
> > Lucene的方案,要想达到比较好的中文分词效果,还是要自己写分词实现,默认分词对中文效果不好。
> > 已经有国人实现了一些针对Lucene的中文分词技术,我正在学习。
> >  另外,看这一篇好文:使用Google桌面搜索构建企业搜索方案<http://www.blogcn.com/User8/flier_lu/blog/20045179.html>
> > 摘录:
> >  好在 GDS 提供了查询服务支持,我们可以通过此接口获取我们感兴趣的查询结果,并翻译成远程可用的地址链接。
> > 主要流程如下:
> > 1.检测 GDS 的安装情况,获取其查询请求的key
> > 2.向 GDS 以特定格式发送查询请求
> > 3.解析 GDS 返回的 XML 格式查询结果
> > 4.将查询结果翻译成远程可用形式,并在门户上展示 
> >  原文提供的代码是java实现,网上还有另一个java实现,Java GDS API<http://gdapi.sourceforge.net/>
> > 我在想:做一个Python实现,问题不就解决了吗?中文全文分词、索引、搜索,全部由后台的GDS实现,展现给用户只是我定制的web页面。
> > 好想法,我都要笑了。
> > 
> 
> 
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
> 
> 
> 


-- 
Blog:http://www.donews.net/changzheng
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20050920/13f0dd3e/attachment-0001.htm

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月20日 星期二 21:42

goopler alang.yl at gmail.com
Tue Sep 20 21:42:41 HKT 2005

> GDS只能安装在win平台吧?

网上已经有很详细的实作文章了,需要两台电脑,一台win+GDS,一台Linux+apache(+spider),轻松搞定自己的个人搜索门户。

百度的桌面搜索不行,因为据研究表明它的桌面版中文分词能力比网络版差太多,特别是长中文词,尤其差。估计Baidu是怕它的中文分词技术被人破解了吧,所以在桌面版不公开了。再说Baidu也没有api啊(印象中好像没有,说错了膜怪)

今天在网上和Google Desktop Developer Group
里面找了一些python+GDS的例子,算是了解些情况,基本上python+win32com方式,而用
Python+http/xml方式的比较少,是不是与Python的xmlrpc/Web
Service处理较为麻烦、或者能力弱有关?(没有做过Web
Service瞎猜)有人认为是COM方式能够控制的东西更多些,不只是Query,还可以限制GDS的indexing目录/子目录等。如果是后者,我也愿意选择COM方式。

感觉任何东西深入下去,都是有好多知识要学习啊。

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月20日 星期二 21:58

清风 paradise.qingfeng at gmail.com
Tue Sep 20 21:58:34 HKT 2005

我觉得基于win平台性能会不会很差?内网使用可能还好

在 05-9-20,goopler<alang.yl at gmail.com> 写道:
> > GDS只能安装在win平台吧?
> 
> 网上已经有很详细的实作文章了,需要两台电脑,一台win+GDS,一台Linux+apache(+spider),轻松搞定自己的个人搜索门户。
> 
> 百度的桌面搜索不行,因为据研究表明它的桌面版中文分词能力比网络版差太多,特别是长中文词,尤其差。估计Baidu是怕它的中文分词技术被人破解了吧,所以在桌面版不公开了。再说Baidu也没有api啊(印象中好像没有,说错了膜怪)
> 
> 今天在网上和Google Desktop Developer Group
> 里面找了一些python+GDS的例子,算是了解些情况,基本上python+win32com方式,而用
> Python+http/xml方式的比较少,是不是与Python的xmlrpc/Web
> Service处理较为麻烦、或者能力弱有关?(没有做过Web
> Service瞎猜)有人认为是COM方式能够控制的东西更多些,不只是Query,还可以限制GDS的indexing目录/子目录等。如果是后者,我也愿意选择COM方式。
> 
> 感觉任何东西深入下去,都是有好多知识要学习啊。
> 


-- 
Blog:http://www.donews.net/changzheng

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月21日 星期三 08:37

limodou limodou at gmail.com
Wed Sep 21 08:37:48 HKT 2005

在 05-9-20,goopler<alang.yl at gmail.com> 写道:
> > GDS只能安装在win平台吧?
> 
> 网上已经有很详细的实作文章了,需要两台电脑,一台win+GDS,一台Linux+apache(+spider),轻松搞定自己的个人搜索门户。
> 
> 百度的桌面搜索不行,因为据研究表明它的桌面版中文分词能力比网络版差太多,特别是长中文词,尤其差。估计Baidu是怕它的中文分词技术被人破解了吧,所以在桌面版不公开了。再说Baidu也没有api啊(印象中好像没有,说错了膜怪)
> 
> 今天在网上和Google Desktop Developer Group
> 里面找了一些python+GDS的例子,算是了解些情况,基本上python+win32com方式,而用
> Python+http/xml方式的比较少,是不是与Python的xmlrpc/Web
> Service处理较为麻烦、或者能力弱有关?(没有做过Web
> Service瞎猜)有人认为是COM方式能够控制的东西更多些,不只是Query,还可以限制GDS的indexing目录/子目录等。如果是后者,我也愿意选择COM方式。
> 
> 感觉任何东西深入下去,都是有好多知识要学习啊。

com是调用GDS的标准方法,包括sidebar。不过python在这方面的例子很少。


-- 
I like python! 
My Donews Blog: http://www.donews.net/limodou

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号