2006年11月12日 星期日 11:53
问一个比较弱的问题, import urllib page=urllib.urlopen('http://acm.hit.edu.cn/ojs/authorstatus.php?Author=AndyWang&Contestid;=0') page.read() 用这这三行代码为什么不能正确提取出来这个页面?服务器提示说禁止访问。而用 浏览器可以正常打开。
2006年11月12日 星期日 12:03
我这里没有问题哦。一切正常。 一开始发现抓到的html不完整,用浏览器打开url一看,那页面的html本来就不完整!! = ="" -- http://codeplayer.blogspot.com/ -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20061112/99d4f2ea/attachment.html
2006年11月12日 星期日 12:06
On 11/12/06, wxx <wangxinxi在cs.hit.edu.cn> wrote: > 问一个比较弱的问题, > > import urllib > page=urllib.urlopen('http://acm.hit.edu.cn/ojs/authorstatus.php?Author=AndyWang&Contestid;=0') > page.read() > 用这这三行代码为什么不能正确提取出来这个页面?服务器提示说禁止访问。而用 > 浏览器可以正常打开。 认证问题,啄木鸟中的高人早就解答了: http://wiki.woodpecker.org.cn/moin/PythonClientCookie 咔咔咔……………… > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -- """Time is unimportant, only life important! blog@ http://blog.zoomquiet.org/pyblosxom/ wiki@ http://wiki.woodpecker.org.cn/moin/ZoomQuiet douban@ http://www.douban.com/people/zoomq/ ____________________________________ Please use OpenOffice.org to stand for M$ office. Please use 7-zip to stand for WinRAR. You can get realy freedom from software. """
Zeuux © 2025
京ICP备05028076号