2006年02月09日 星期四 16:51
小弟有点蒙,大家都来说说 :-) -------------- next part -------------- An HTML attachment was scrubbed... URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20060209/70803116/attachment.htm
2006年02月09日 星期四 17:20
简单说,就是顺着链接把网站抓回来,如果要抓取特定内容,看一看正则表达式相关内容。 On 2/9/06, Steve Chu <devforum at gmail.com> wrote: > 小弟有点蒙,大家都来说说 :-) > > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to > python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request at lists.python.cn > Detail Info: > http://python.cn/mailman/listinfo/python-chinese > > -- Blog:http://qingfeng.ushared.com/blog/
2006年02月09日 星期四 17:22
On 2/9/06, Steve Chu <devforum at gmail.com> wrote: > 小弟有点蒙,大家都来说说 :-) > 我以前写过一个Crawl 可以从 http://pyrecord.freezope.org/download/crawl.zip/down 主要是使用htmllib分析网页,使用多线程来抓取。 -- I like python! My Blog: http://www.donews.net/limodou NewEdit Maillist: http://groups.google.com/group/NewEdit
Zeuux © 2025
京ICP备05028076号