2007年11月05日 星期一 13:58
Èç¹ûÄãÏ£Íû±£Ö¤Ò»¸ö¹ØϵÐÍÊý¾Ý¿âµÄ½Ó¿Ú£¬Ò²¾ÍÊÇsqlµÄ·½Ê½£¬ÄÄômysqlµÄmast/slave¾ÍºÃÁË¡£Èç¹ûÏëÔÚmysqlÉÏÈ¡µÃ¸üºÃµÄ¶ÁÐÔÄÜMyISAMÊÇÄãÐèÒªµÄ´æ´¢engÁË¡£ Èç¹ûÄãÏ£ÍûÒ»¸ö¸ü¼òµ¥µÄ½Ó¿Ú£¬Í¬Ê±²éѯµÄËٶȸü¿ì£¬zqµÄldapÒ²ÊDz»´íµÄÖ÷Òâ¡£ÒªÖªµÀÄãËù˵µÄÓû§ÐÅÏ¢ÕâÑùµÄ¶«¶«´ó²¿·Ö¶¼ÊÇ´æ´¢ÔÚldapÉϵġ£msµÄad¾ÍÊǺܺõÄÀý×Ó¡£ :) ÒÔÉ϶¼ÊÇÒ»¸ö¹ØϵÐ͵ĸÅÄÈç¹ûÄãÊÇÒ»¸öÈ«²¿¼ìË÷µÄ·½Ê½£¬ÄÄôapacheµÄlucene¾ÍÀ´ÁË¡£Õⶫ¶«ºÃѽ£¬Ëٶȸü¿ì£¬Ê¹ÓÃËüµÄhadoop·Ö²¼Ê½µÄÎÊÌâÒ²½â¾öÁË¡£ ǰ̨ÓÃʲô¶«¶«×ö£¬pythonºÍphp¶¼ºÃÁË¡£½â¾ö×¥Õ¾µÄÎÊÌâ¾ÍҪдºÃÄãµÄrobot˵Ã÷ÂÞ¡£¡£¡£¡£ÈÏÖ¤µÇ¼ºó²éѯҲÊǺ÷½·¨£¬×Ô¼º°ÑÎÕÁË¡£ :) ÔÚ07-10-31£¬jack <blackjacksg在gmail.com> дµÀ£º > > > Êý¾Ý¿â½¨ÒéʹÓÃpostgresql¡£ > ÔÚ07-10-31£¬Hey Key <heykey4u在gmail.com> дµÀ£º > > > > лл´ó¼ÒµÄÈÈÇé»Ø¸´£¬È·ÊµÈÃÎÒѧµ½Á˲»ÉÙ¶«Î÷£¬Èç¹ûÓÐʲôÎÊÌâÔÙÉÏÀ´ ºÍ´ó¼ÒÇë½Ì > > re£ºÂí̤·ÉÑ࣬ÎÒ²»ÊÇ×öÊý¾Ý¿âÓªÏú > > > > лл´ó¼Ò£¡Ì«¸ÐлÁË£¡ > > > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request在lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- HD£¨È¼ÉÕÖеĻ𣩠ÎÒ¹¤×÷ÎÒ¿ìÀÖ£¬ÎÒÇÚ·ÜÎÒÊÕ»ñ¡£ÇëÓëÎÒÒ»Æð¿ìÀÖ£¬ÓëÎÒÒ»ÆðÊÕ»ñ¡£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20071105/0ba12229/attachment.htm
2007年11月05日 星期一 14:06
我倒对如何防止竞争对手对数据进行采集这个比较感兴趣。 On 11/5/07, HD <hdcola at gmail.com> wrote: > > > 如果你希望保证一个关系型数据库的接口,也就是sql的方式,哪么mysql的mast/slave就好了。如果想在mysql上取得更好的读性能MyISAM是你需要的存储eng了。 > 如果你希望一个更简单的接口,同时查询的速度更快,zq的ldap也是不错的主意。要知道你所说的用户信息这样的东东大部分都是存储在ldap上的。ms的ad就是很好的例子。 > :) > 以上都是一个关系型的概念,如果你是一个全部检索的方式,哪么apache的lucene就来了。这东东好呀,速度更快,使用它的hadoop分布式的问题也解决了。 > > > 前台用什么东东做,python和php都好了。解决抓站的问题就要写好你的robot说明罗。。。。认证登录后查询也是好方法,自己把握了。 :) > > > 在07-10-31,jack <blackjacksg at gmail.com > 写道: > > > > > > 数据库建议使用postgresql。 > > 在07-10-31, Hey Key <heykey4u at gmail.com> 写道: > > > > > > 谢谢大家的热情回复,确实让我学到了不少东西,如果有什么问题再上来 和大家请教 > > > re:马踏飞燕,我不是做数据库营销 > > > > > > 谢谢大家!太感谢了! > > > > > > _______________________________________________ > > > python-chinese > > > Post: send python-chinese at lists.python.cn > > > Subscribe: send subscribe to python-chinese-request at lists.python.cn > > > Unsubscribe: send unsubscribe to > > > python-chinese-request at lists.python.cn > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > _______________________________________________ > > python-chinese > > Post: send python-chinese at lists.python.cn > > Subscribe: send subscribe to python-chinese-request at lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request at lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > -- > HD(燃烧中的火) > 我工作我快乐,我勤奋我收获。请与我一起快乐,与我一起收获。 > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20071105/401f37fa/attachment.htm
2007年11月05日 星期一 14:09
用solr好了。估计是最轻松的最简单的处理方法。 如何显示屏蔽他人抓取,那是表现层的考虑了。 On 11/5/07, HD <hdcola at gmail.com> wrote: > > > 如果你希望保证一个关系型数据库的接口,也就是sql的方式,哪么mysql的mast/slave就好了。如果想在mysql上取得更好的读性能MyISAM是你需要的存储eng了。 > 如果你希望一个更简单的接口,同时查询的速度更快,zq的ldap也是不错的主意。要知道你所说的用户信息这样的东东大部分都是存储在ldap上的。ms的ad就是很好的例子。 > :) > 以上都是一个关系型的概念,如果你是一个全部检索的方式,哪么apache的lucene就来了。这东东好呀,速度更快,使用它的hadoop分布式的问题也解决了。 > > > 前台用什么东东做,python和php都好了。解决抓站的问题就要写好你的robot说明罗。。。。认证登录后查询也是好方法,自己把握了。 :) > > > 在07-10-31,jack <blackjacksg at gmail.com > 写道: > > > > > > 数据库建议使用postgresql。 > > 在07-10-31, Hey Key <heykey4u at gmail.com> 写道: > > > > > > 谢谢大家的热情回复,确实让我学到了不少东西,如果有什么问题再上来 和大家请教 > > > re:马踏飞燕,我不是做数据库营销 > > > > > > 谢谢大家!太感谢了! > > > > > > _______________________________________________ > > > python-chinese > > > Post: send python-chinese at lists.python.cn > > > Subscribe: send subscribe to python-chinese-request at lists.python.cn > > > Unsubscribe: send unsubscribe to > > > python-chinese-request at lists.python.cn > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > _______________________________________________ > > python-chinese > > Post: send python-chinese at lists.python.cn > > Subscribe: send subscribe to python-chinese-request at lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request at lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > -- > HD(燃烧中的火) > 我工作我快乐,我勤奋我收获。请与我一起快乐,与我一起收获。 > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- regards jl -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20071105/4cc5a1f3/attachment.html
2007年11月05日 星期一 14:40
solr和hadoop结合的不太好,还是推荐用hadoop+nutch+lucene的组合:) On 11/5/07, James liu <liuping.james在gmail.com> wrote: > 用solr好了。估计是最轻松的最简单的处理方法。 > > 如何显示屏蔽他人抓取,那是表现层的考虑了。 > > > On 11/5/07, HD <hdcola在gmail.com> wrote: > > > 如果你希望保证一个关系型数据库的接口,也就是sql的方式,哪么mysql的mast/slave就好了。如果想在mysql上取得更好的读性能MyISAM是你需要的存储eng了。 > > > 如果你希望一个更简单的接口,同时查询的速度更快,zq的ldap也是不错的主意。要知道你所说的用户信息这样的东东大部分都是存储在ldap上的。ms的ad就是很好的例子。 > :) > > > 以上都是一个关系型的概念,如果你是一个全部检索的方式,哪么apache的lucene就来了。这东东好呀,速度更快,使用它的hadoop分布式的问题也解决了。 > > > > > 前台用什么东东做,python和php都好了。解决抓站的问题就要写好你的robot说明罗。。。。认证登录后查询也是好方法,自己把握了。 > :) > > > > > > > > 在07-10-31,jack <blackjacksg在gmail.com > 写道: > > > > > > > > 数据库建议使用postgresql。 > > > > > > 在07-10-31, Hey Key <heykey4u在gmail.com> 写道: > > > > 谢谢大家的热情回复,确实让我学到了不少东西,如果有什么问题再上来 和大家请教 > > > > re:马踏飞燕,我不是做数据库营销 > > > > > > > > 谢谢大家!太感谢了! > > > > > > > > _______________________________________________ > > > > python-chinese > > > > Post: send python-chinese在lists.python.cn > > > > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > > > > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > > > > Detail Info: > http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > > > _______________________________________________ > > > python-chinese > > > Post: send python-chinese在lists.python.cn > > > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > > > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > > > Detail Info: > http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > -- > > HD(燃烧中的火) > > 我工作我快乐,我勤奋我收获。请与我一起快乐,与我一起收获。 > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > > Detail Info: > http://python.cn/mailman/listinfo/python-chinese > > > > > > -- > regards > jl > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > Detail Info: > http://python.cn/mailman/listinfo/python-chinese > -- http://qingfeng.ushared.com/blog/
2007年11月05日 星期一 15:13
为什么要和hadoop结合?他有数据的。 hadoop和solr的结合看下wiki。 On 11/5/07, 清风 <paradise.qingfeng at gmail.com> wrote: > > solr和hadoop结合的不太好,还是推荐用hadoop+nutch+lucene的组合:) > > On 11/5/07, James liu <liuping.james at gmail.com> wrote: > > 用solr好了。估计是最轻松的最简单的处理方法。 > > > > 如何显示屏蔽他人抓取,那是表现层的考虑了。 > > > > > > On 11/5/07, HD <hdcola at gmail.com> wrote: > > > > > > 如果你希望保证一个关系型数据库的接口,也就是sql的方式,哪么mysql的mast/slave就好了。如果想在mysql上取得更好的读性能MyISAM是你需要的存储eng了。 > > > > > > 如果你希望一个更简单的接口,同时查询的速度更快,zq的ldap也是不错的主意。要知道你所说的用户信息这样的东东大部分都是存储在ldap上的。ms的ad就是很好的例子。 > > :) > > > > > > 以上都是一个关系型的概念,如果你是一个全部检索的方式,哪么apache的lucene就来了。这东东好呀,速度更快,使用它的hadoop分布式的问题也解决了。 > > > > > > > > 前台用什么东东做,python和php都好了。解决抓站的问题就要写好你的robot说明罗。。。。认证登录后查询也是好方法,自己把握了。 > > :) > > > > > > > > > > > > 在07-10-31,jack <blackjacksg at gmail.com > 写道: > > > > > > > > > > > 数据库建议使用postgresql。 > > > > > > > > 在07-10-31, Hey Key <heykey4u at gmail.com> 写道: > > > > > 谢谢大家的热情回复,确实让我学到了不少东西,如果有什么问题再上来 和大家请教 > > > > > re:马踏飞燕,我不是做数据库营销 > > > > > > > > > > 谢谢大家!太感谢了! > > > > > > > > > > _______________________________________________ > > > > > python-chinese > > > > > Post: send python-chinese at lists.python.cn > > > > > Subscribe: send subscribe to > > python-chinese-request at lists.python.cn > > > > > Unsubscribe: send unsubscribe to > > python-chinese-request at lists.python.cn > > > > > Detail Info: > > http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > > > > > > > _______________________________________________ > > > > python-chinese > > > > Post: send python-chinese at lists.python.cn > > > > Subscribe: send subscribe to > > python-chinese-request at lists.python.cn > > > > Unsubscribe: send unsubscribe to > > python-chinese-request at lists.python.cn > > > > Detail Info: > > http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > > > > > > -- > > > HD(燃烧中的火) > > > 我工作我快乐,我勤奋我收获。请与我一起快乐,与我一起收获。 > > > _______________________________________________ > > > python-chinese > > > Post: send python-chinese at lists.python.cn > > > Subscribe: send subscribe to > > python-chinese-request at lists.python.cn > > > Unsubscribe: send unsubscribe to > > python-chinese-request at lists.python.cn > > > Detail Info: > > http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > -- > > regards > > jl > > _______________________________________________ > > python-chinese > > Post: send python-chinese at lists.python.cn > > Subscribe: send subscribe to > > python-chinese-request at lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request at lists.python.cn > > Detail Info: > > http://python.cn/mailman/listinfo/python-chinese > > > > > -- > http://qingfeng.ushared.com/blog/ > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -- regards jl -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20071105/0bc766a6/attachment.htm
2007年11月07日 星期三 16:49
лл´ó¼ÒµÄ»Ø¸´£¬ÒòΪÎÒÃÇÄ¿Ç°¶ÔÆäËûÊý¾Ý¿â»¹²»ÊǺÜÊìϤ£¬½Ó´¥×î¶àµÄ¾ÍÊÇmysql£¬±à³Ì·½ÃæÊìϤµÄ¾ÍÊÇphp¡£Ä¿Ç°¾ö¶¨ÓÃmysqlµÄÊý¾Ý¿â£¬µ½ÍøÉÏËÑmysql¶ÔÓÚÉÏÒÚÌõÊý¾ÝµÄ´¦ÀíÄÜÁ¦ÔõôÑù£¬ÖÚ˵·×ç¡£¬Ò²Ã»ÓÐËѵ½Ê²Ã´½á¹û£¬ËùÒÔÄ¿Ç°×Ô¼ºÓÃÑ»·½¨Á¢Ò»¸öÀ¬»øÊý¾Ý¿âÔÚ×ö²âÊÔ¿´¿´£¬Ê×ÏÈ¿´¿´ÏñÕâÑùµÄÒ»¸öÊý¾Ý¿âÕ¼¶àÉÙ´ÅÅ̿ռ䣬Ȼºó¿´¿´¿´»úÆ÷µÄ´¦ÀíÄÜÁ¦£¬Ä¿Ç°ÔÚwindows 2K3+ntfsÎļþϵͳµÄ»·¾³×ö²âÊÔ£¬²»¹ýÒÔºó×¼±¸ÓÃcentosϵͳÀ´×ö·þÎñÆ÷µÄϵͳ£¬ÓÐÁËÏêϸ½á¹ûÔÙÀ´ºÍ´ó¼Ò»ã±¨¡£ hdcola˵µÄluceneÊÇÔÚjava»·¾³Ïµģ¬ËäȻҲÄܺÍphp¶Ô½Ó£¬µ«ÊÇ»¹²»ÊǺÜÊìϤ£¬»¹²»ÖªµÀÔõôӦÓ㬵ȶ࿴Щ×ÊÁÏÔÙÏò´ó¼Ò½øÒ»²½Çë½Ì¡£¶àлhdcolaµÄ²»Áߴͽ̣¬Õæ³ÏµÄ¸Ðл£¡ Ä¿Ç°Ò²ÕýÔÚѧϰpostgresqlÊý¾Ý¿â£¬¶ÔÎÒÀ´Ëµ×îÖØÒªµÄ»¹ÊÇ´Óº£Á¿Êý¾ÝÖиù¾ÝÎÒÌá½»µÄ¹Ø¼ü´Ê²éѯ³öÎÒËùÐèÒªµÄÊý¾Ý£¬¹ØÓÚzoom.quiet˵µÄldap£¬ ¿´µ½ÓÃmysql×öºǫ́Êý¾Ý¿âÒ²ÊÇ¿ÉÒÔ£¬µ«¾ßÌåÔõôʵʩ»¹²»ÊǺÜÇå³þ£¬Ñ§Ï°ÖÐ ÏÖÔÚÕýÔÚÉè¼ÆÊý¾Ý¿âµÄ½á¹¹£¬Ð»Ð»´ó¼ÒµÄ°ïÖú¡£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20071107/3ae6031b/attachment.html
2007年11月07日 星期三 16:53
solr可以独立的。。否则php调用java用javabridge,,包麻烦。。 没想到在这里看到phper的同志,,兄弟你潜伏多久啦? On Nov 7, 2007 4:49 PM, Hey Key <heykey4u at gmail.com> wrote: > 谢谢大家的回复,因为我们目前对其他数据库还不是很熟悉,接触最多的就是mysql,编程方面熟悉的就是php。目前决定用mysql的数据库,到网上搜mysql对于上亿条数据的处理能力怎么样,众说纷纭,也没有搜到什么结果,所以目前自己用循环建立一个垃圾数据库在做测试看看,首先看看像这样的一个数据库占多少磁盘空间,然后看看看机器的处理能力,目前在windows > 2K3+ntfs文件系统的环境做测试,不过以后准备用centos系统来做服务器的系统,有了详细结果再来和大家汇报。 > > > hdcola说的lucene是在java环境下的,虽然也能和php对接,但是还不是很熟悉,还不知道怎么应用,等多看些资料再向大家进一步请教。多谢hdcola的不吝赐教,真诚的感谢! > > 目前也正在学习postgresql数据库,对我来说最重要的还是从海量数据中根据我提交的关键词查询出我所需要的数据, > 关于zoom.quiet说的ldap,看到用mysql做后台数据库也是可以,但具体怎么实施还不是很清楚,学习中 > > 现在正在设计数据库的结构,谢谢大家的帮助。 > > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- regards jl -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20071107/ff731b24/attachment.htm
2007年11月08日 星期四 15:27
¹þ¹þ£¬Ã»¶à¾Ã£¬Ó¦¸ÃÓÐÁ½Äê¶àÁË°É£¬¾ßÌå¼Ç²»Çå³þÁË£¬ºÍÎÒÒ»¸öͬÊÂÖªµÀÕâÀïµÄ£¬ºÜ»³ÄîÄǸöʱºòµÄʱ¹â ÔÚ07-11-7£¬James liu <liuping.james在gmail.com> дµÀ£º > > solr¿ÉÒÔ¶ÀÁ¢µÄ¡£¡£·ñÔòphpµ÷ÓÃjavaÓÃjavabridge£¬£¬°üÂé·³¡£¡£ > > ûÏëµ½ÔÚÕâÀï¿´µ½phperµÄͬ־£¬£¬ÐÖµÜÄãDZ·ü¶à¾ÃÀ²£¿ > > -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20071108/a6364d22/attachment.html
2007年11月10日 星期六 23:25
ºÇºÇ£¬Õâ¸öµ½ÊǼòµ¥ÁË£¬½«À´À©Õ¹ÆðÀ´Â鷳Щ ÔÚ07-11-5£¬James liu <liuping.james在gmail.com> дµÀ£º > > ÓÃsolrºÃÁË¡£¹À¼ÆÊÇ×îÇáËɵÄ×î¼òµ¥µÄ´¦Àí·½·¨¡£ > > ÈçºÎÏÔʾÆÁ±ÎËûÈËץȡ£¬ÄÇÊDZíÏÖ²ãµÄ¿¼ÂÇÁË¡£ > > > On 11/5/07, HD <hdcola在gmail.com> wrote: > > > > > > Èç¹ûÄãÏ£Íû±£Ö¤Ò»¸ö¹ØϵÐÍÊý¾Ý¿âµÄ½Ó¿Ú£¬Ò²¾ÍÊÇsqlµÄ·½Ê½£¬ÄÄômysqlµÄmast/slave¾ÍºÃÁË¡£Èç¹ûÏëÔÚmysqlÉÏÈ¡µÃ¸üºÃµÄ¶ÁÐÔÄÜMyISAMÊÇÄãÐèÒªµÄ´æ´¢engÁË¡£ > > Èç¹ûÄãÏ£ÍûÒ»¸ö¸ü¼òµ¥µÄ½Ó¿Ú£¬Í¬Ê±²éѯµÄËٶȸü¿ì£¬zqµÄldapÒ²ÊDz»´íµÄÖ÷Òâ¡£ÒªÖªµÀÄãËù˵µÄÓû§ÐÅÏ¢ÕâÑùµÄ¶«¶«´ó²¿·Ö¶¼ÊÇ´æ´¢ÔÚldapÉϵġ£msµÄad¾ÍÊǺܺõÄÀý×Ó¡£ > > :) > > ÒÔÉ϶¼ÊÇÒ»¸ö¹ØϵÐ͵ĸÅÄÈç¹ûÄãÊÇÒ»¸öÈ«²¿¼ìË÷µÄ·½Ê½£¬ÄÄôapacheµÄlucene¾ÍÀ´ÁË¡£Õⶫ¶«ºÃѽ£¬Ëٶȸü¿ì£¬Ê¹ÓÃËüµÄhadoop·Ö²¼Ê½µÄÎÊÌâÒ²½â¾öÁË¡£ > > > > > > ǰ̨ÓÃʲô¶«¶«×ö£¬pythonºÍphp¶¼ºÃÁË¡£½â¾ö×¥Õ¾µÄÎÊÌâ¾ÍҪдºÃÄãµÄrobot˵Ã÷ÂÞ¡£¡£¡£¡£ÈÏÖ¤µÇ¼ºó²éѯҲÊǺ÷½·¨£¬×Ô¼º°ÑÎÕÁË¡£ :) > > > > > > ÔÚ07-10-31£¬jack <blackjacksg在gmail.com > дµÀ£º > > > > > > > > > Êý¾Ý¿â½¨ÒéʹÓÃpostgresql¡£ > > > ÔÚ07-10-31£¬ Hey Key <heykey4u在gmail.com> дµÀ£º > > > > > > > > лл´ó¼ÒµÄÈÈÇé»Ø¸´£¬È·ÊµÈÃÎÒѧµ½Á˲»ÉÙ¶«Î÷£¬Èç¹ûÓÐʲôÎÊÌâÔÙÉÏÀ´ ºÍ´ó¼ÒÇë½Ì > > > > re£ºÂí̤·ÉÑ࣬ÎÒ²»ÊÇ×öÊý¾Ý¿âÓªÏú > > > > > > > > лл´ó¼Ò£¡Ì«¸ÐлÁË£¡ > > > > > > > > _______________________________________________ > > > > python-chinese > > > > Post: send python-chinese在lists.python.cn > > > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > > > Unsubscribe: send unsubscribe to > > > > python-chinese-request在lists.python.cn > > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > > > _______________________________________________ > > > python-chinese > > > Post: send python-chinese在lists.python.cn > > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > > Unsubscribe: send unsubscribe to > > > python-chinese-request在lists.python.cn > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > -- > > HD£¨È¼ÉÕÖеĻ𣩠> > ÎÒ¹¤×÷ÎÒ¿ìÀÖ£¬ÎÒÇÚ·ÜÎÒÊÕ»ñ¡£ÇëÓëÎÒÒ»Æð¿ìÀÖ£¬ÓëÎÒÒ»ÆðÊÕ»ñ¡£ > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > -- > regards > jl > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- HD£¨È¼ÉÕÖеĻ𣩠ÎÒ¹¤×÷ÎÒ¿ìÀÖ£¬ÎÒÇÚ·ÜÎÒÊÕ»ñ¡£ÇëÓëÎÒÒ»Æð¿ìÀÖ£¬ÓëÎÒÒ»ÆðÊÕ»ñ¡£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20071110/3164687a/attachment.htm
2007年11月10日 星期六 23:32
ºÇºÇ£¬Èç¹ûÊÇÉÏÒÚÌõÊý¾Ý¡£Èç¹û·ÅÔÚÒ»ÕűíÖУ¬Èç¹ûÔÙÊÇlikeµÄ²éѯ£¬Ê²Ã´Êý¾Ý¿â¶¼overÁË ÔÚ07-11-7£¬Hey Key <heykey4u在gmail.com> дµÀ£º > > лл´ó¼ÒµÄ»Ø¸´£¬ÒòΪÎÒÃÇÄ¿Ç°¶ÔÆäËûÊý¾Ý¿â»¹²»ÊǺÜÊìϤ£¬½Ó´¥×î¶àµÄ¾ÍÊÇmysql£¬±à³Ì·½ÃæÊìϤµÄ¾ÍÊÇphp¡£Ä¿Ç°¾ö¶¨ÓÃmysqlµÄÊý¾Ý¿â£¬µ½ÍøÉÏËÑmysql¶ÔÓÚÉÏÒÚÌõÊý¾ÝµÄ´¦ÀíÄÜÁ¦ÔõôÑù£¬ÖÚ˵·×ç¡£¬Ò²Ã»ÓÐËѵ½Ê²Ã´½á¹û£¬ËùÒÔÄ¿Ç°×Ô¼ºÓÃÑ»·½¨Á¢Ò»¸öÀ¬»øÊý¾Ý¿âÔÚ×ö²âÊÔ¿´¿´£¬Ê×ÏÈ¿´¿´ÏñÕâÑùµÄÒ»¸öÊý¾Ý¿âÕ¼¶àÉÙ´ÅÅ̿ռ䣬Ȼºó¿´¿´¿´»úÆ÷µÄ´¦ÀíÄÜÁ¦£¬Ä¿Ç°ÔÚwindows > 2K3+ntfsÎļþϵͳµÄ»·¾³×ö²âÊÔ£¬²»¹ýÒÔºó×¼±¸ÓÃcentosϵͳÀ´×ö·þÎñÆ÷µÄϵͳ£¬ÓÐÁËÏêϸ½á¹ûÔÙÀ´ºÍ´ó¼Ò»ã±¨¡£ > > > hdcola˵µÄluceneÊÇÔÚjava»·¾³Ïµģ¬ËäȻҲÄܺÍphp¶Ô½Ó£¬µ«ÊÇ»¹²»ÊǺÜÊìϤ£¬»¹²»ÖªµÀÔõôӦÓ㬵ȶ࿴Щ×ÊÁÏÔÙÏò´ó¼Ò½øÒ»²½Çë½Ì¡£¶àлhdcolaµÄ²»Áߴͽ̣¬Õæ³ÏµÄ¸Ðл£¡ > > Ä¿Ç°Ò²ÕýÔÚѧϰpostgresqlÊý¾Ý¿â£¬¶ÔÎÒÀ´Ëµ×îÖØÒªµÄ»¹ÊÇ´Óº£Á¿Êý¾ÝÖиù¾ÝÎÒÌá½»µÄ¹Ø¼ü´Ê²éѯ³öÎÒËùÐèÒªµÄÊý¾Ý£¬ > ¹ØÓÚzoom.quiet˵µÄldap£¬¿´µ½ÓÃmysql×öºǫ́Êý¾Ý¿âÒ²ÊÇ¿ÉÒÔ£¬µ«¾ßÌåÔõôʵʩ»¹²»ÊǺÜÇå³þ£¬Ñ§Ï°ÖÐ > > ÏÖÔÚÕýÔÚÉè¼ÆÊý¾Ý¿âµÄ½á¹¹£¬Ð»Ð»´ó¼ÒµÄ°ïÖú¡£ > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- HD£¨È¼ÉÕÖеĻ𣩠ÎÒ¹¤×÷ÎÒ¿ìÀÖ£¬ÎÒÇÚ·ÜÎÒÊÕ»ñ¡£ÇëÓëÎÒÒ»Æð¿ìÀÖ£¬ÓëÎÒÒ»ÆðÊÕ»ñ¡£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20071110/9164e80b/attachment.htm
2007年11月11日 星期日 00:02
那,不如去看看 apache 的人干的 hadoop/HDFS 和 nutch, 有分布式能力的搜索引擎,
2007年11月11日 星期日 10:02
还行。。我做的数据比他多很多。 On Nov 10, 2007 11:25 PM, HD <hdcola at gmail.com> wrote: > 呵呵,这个到是简单了,将来扩展起来麻烦些 > > 在07-11-5,James liu <liuping.james at gmail.com> 写道: > > > 用solr好了。估计是最轻松的最简单的处理方法。 > > > > 如何显示屏蔽他人抓取,那是表现层的考虑了。 > > > > > > On 11/5/07, HD <hdcola at gmail.com > wrote: > > > > > > 如果你希望保证一个关系型数据库的接口,也就是sql的方式,哪么mysql的mast/slave就好了。如果想在mysql上取得更好的读性能MyISAM是你需要的存储eng了。 > > > > > > 如果你希望一个更简单的接口,同时查询的速度更快,zq的ldap也是不错的主意。要知道你所说的用户信息这样的东东大部分都是存储在ldap上的。ms的ad就是很好的例子。 > > > :) > > > 以上都是一个关系型的概念,如果你是一个全部检索的方式,哪么apache的lucene就来了。这东东好呀,速度更快,使用它的hadoop分布式的问题也解决了。 > > > > > > > > > 前台用什么东东做,python和php都好了。解决抓站的问题就要写好你的robot说明罗。。。。认证登录后查询也是好方法,自己把握了。 :) > > > > > > > > > 在07-10-31,jack <blackjacksg at gmail.com > 写道: > > > > > > > > > > > > 数据库建议使用postgresql。 > > > > 在07-10-31, Hey Key <heykey4u at gmail.com> 写道: > > > > > > > > > > 谢谢大家的热情回复,确实让我学到了不少东西,如果有什么问题再上来 和大家请教 > > > > > re:马踏飞燕,我不是做数据库营销 > > > > > > > > > > 谢谢大家!太感谢了! > > > > > > > > > > _______________________________________________ > > > > > python-chinese > > > > > Post: send python-chinese at lists.python.cn > > > > > Subscribe: send subscribe to > > > > > python-chinese-request at lists.python.cn > > > > > Unsubscribe: send unsubscribe to > > > > > python-chinese-request at lists.python.cn > > > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > > > > > > > _______________________________________________ > > > > python-chinese > > > > Post: send python-chinese at lists.python.cn > > > > Subscribe: send subscribe to python-chinese-request at lists.python.cn > > > > Unsubscribe: send unsubscribe to > > > > python-chinese-request at lists.python.cn > > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > > > > > > -- > > > HD(燃烧中的火) > > > 我工作我快乐,我勤奋我收获。请与我一起快乐,与我一起收获。 > > > _______________________________________________ > > > python-chinese > > > Post: send python-chinese at lists.python.cn > > > Subscribe: send subscribe to python-chinese-request at lists.python.cn > > > Unsubscribe: send unsubscribe to > > > python-chinese-request at lists.python.cn > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > > > > > > -- > > regards > > jl > > _______________________________________________ > > python-chinese > > Post: send python-chinese at lists.python.cn > > Subscribe: send subscribe to python-chinese-request at lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request at lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > -- > HD(燃烧中的火) > 我工作我快乐,我勤奋我收获。请与我一起快乐,与我一起收获。 > > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- regards jl -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20071111/ded91a29/attachment.html
Zeuux © 2025
京ICP备05028076号