Python论坛  - 讨论区

标题:[python-chinese] 大家来看看这样的网站如何提取页面内容

2006年05月09日 星期二 08:17

邓作霖 pse-dengzl at pegasus.tj.cn
Tue May 9 08:17:24 HKT 2006

大家好;

https://info.edinet.go.jp
这个网站浏览的时候需要装JAVA运行时环境,我想使用Python来提取页面的内容, 
但是通过直接的URL请求没法获取需要的页面,大家看看对这样的网站如何获取页 
面内容。谢谢。

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年05月09日 星期二 14:03

bird devdoer devdoer at gmail.com
Tue May 9 14:03:01 HKT 2006

没法提取,除非模拟java运行环境.对这样的网站搜索引擎是不去抓取的.

2006/5/9, 邓作霖 <pse-dengzl at pegasus.tj.cn>:
> 大家好;
>
> https://info.edinet.go.jp
> 这个网站浏览的时候需要装JAVA运行时环境,我想使用Python来提取页面的内容,
> 但是通过直接的URL请求没法获取需要的页面,大家看看对这样的网站如何获取页
> 面内容。谢谢。
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>


--
devdoer
devdoer at gmail.com
http://project.mytianwang.cn/cgi-bin/blog

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年05月09日 星期二 14:12

尹祥龙 yinxianglong at gmail.com
Tue May 9 14:12:28 HKT 2006

用PAMIE试试吧!

在06-5-9,bird devdoer <devdoer at gmail.com> 写道:
>
> 没法提取,除非模拟java运行环境.对这样的网站搜索引擎是不去抓取的.
>
> 2006/5/9, 邓作霖 <pse-dengzl at pegasus.tj.cn>:
> > 大家好;
> >
> > https://info.edinet.go.jp
> > 这个网站浏览的时候需要装JAVA运行时环境,我想使用Python来提取页面的内容,
> > 但是通过直接的URL请求没法获取需要的页面,大家看看对这样的网站如何获取页
> > 面内容。谢谢。
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese at lists.python.cn
> > Subscribe: send subscribe to python-chinese-request at lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> >
>
>
> --
> devdoer
> devdoer at gmail.com
> http://project.mytianwang.cn/cgi-bin/blog
>
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20060509/c3928b74/attachment.html

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号