Python论坛  - 讨论区

标题:[python-chinese] 用PYTHON判断一个网站是否更新的方法!!!

2007年04月05日 星期四 00:10

email在gzemail.cn email在gzemail.cn
星期四 四月 5 00:10:02 HKT 2007

大家好,目前想用python判断一个网站是否有更新,大家有什么好方法呢?
目前我想到的只是利用ETag和last-modified去判断,不知道有没有更好的办法?请知会一下,谢谢!!!


----------------------------------------------
欢迎使用市民电子邮局



[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月10日 星期二 20:46

hutuworm hutuworm在gmail.com
星期二 四月 10 20:46:14 HKT 2007

求页面源码的 md5sum
比如:
localhost ~ # lynx -source http://www.python.org |md5sum
c1a61a393f1afc2d6903deaf1bac240c  -
localhost ~ # lynx -source http://www.python.org |md5sum
c1a61a393f1afc2d6903deaf1bac240c  -
localhost ~ # lynx -source http://www.python.cn |md5sum
88245f4950bb3f3d20d5228c8b49afff  -

On 4/5/07, email在gzemail.cn <email在gzemail.cn> wrote:
> 大家好,目前想用python判断一个网站是否有更新,大家有什么好方法呢?
> 目前我想到的只是利用ETag和last-modified去判断,不知道有没有更好的办法?请知会一下,谢谢!!!
>
>
> ----------------------------------------------
> 欢迎使用市民电子邮局
>
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese


-- 
In doG We Trust

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月10日 星期二 23:38

散漫酷男孩 17mxnet在gmail.com
星期二 四月 10 23:38:09 HKT 2007

如果页面有个报时呢。。。

在 07-4-10,hutuworm<hutuworm在gmail.com> 写道:
> 求页面源码的 md5sum
> 比如:
> localhost ~ # lynx -source http://www.python.org |md5sum
> c1a61a393f1afc2d6903deaf1bac240c  -
> localhost ~ # lynx -source http://www.python.org |md5sum
> c1a61a393f1afc2d6903deaf1bac240c  -
> localhost ~ # lynx -source http://www.python.cn |md5sum
> 88245f4950bb3f3d20d5228c8b49afff  -
>
> On 4/5/07, email在gzemail.cn <email在gzemail.cn> wrote:
> > 大家好,目前想用python判断一个网站是否有更新,大家有什么好方法呢?
> > 目前我想到的只是利用ETag和last-modified去判断,不知道有没有更好的办法?请知会一下,谢谢!!!
> >
> >
> > ----------------------------------------------
> > 欢迎使用市民电子邮局
> >
> >
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
> --
> In doG We Trust
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 09:17

Marco marco在waven.com
星期三 四月 11 09:17:52 HKT 2007

最标准的办法是用RSS啦。

否则只能分析你要的页面。

On 4/10/07, 散漫酷男孩 <17mxnet在gmail.com> wrote:
> 如果页面有个报时呢。。。
>
> 在 07-4-10,hutuworm<hutuworm在gmail.com> 写道:
> > 求页面源码的 md5sum
> > 比如:
> > localhost ~ # lynx -source http://www.python.org |md5sum
> > c1a61a393f1afc2d6903deaf1bac240c  -
> > localhost ~ # lynx -source http://www.python.org |md5sum
> > c1a61a393f1afc2d6903deaf1bac240c  -
> > localhost ~ # lynx -source http://www.python.cn |md5sum
> > 88245f4950bb3f3d20d5228c8b49afff  -
> >
> > On 4/5/07, email在gzemail.cn <email在gzemail.cn> wrote:
> > > 大家好,目前想用python判断一个网站是否有更新,大家有什么好方法呢?
> > > 目前我想到的只是利用ETag和last-modified去判断,不知道有没有更好的办法?请知会一下,谢谢!!!
> > >
> > >
> > > ----------------------------------------------
> > > 欢迎使用市民电子邮局
> > >
> > >
> > > _______________________________________________
> > > python-chinese
> > > Post: send python-chinese在lists.python.cn
> > > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> >
> >
> > --
> > In doG We Trust
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese


-- 
LinuX Power

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 09:23

hutuworm hutuworm在gmail.com
星期三 四月 11 09:23:35 HKT 2007

RSS依赖于服务端是否提供更新

关键是你如何定义"更新",若"更新"包含首页任何一个字符的更新,那么报时部分显然要算;若"更新"只是指功能部件或者某一块内容的更新,那么也简单,页面做一些预处理之后再求md5sum。

On 4/11/07, Marco <marco在waven.com> wrote:
> 最标准的办法是用RSS啦。
>
> 否则只能分析你要的页面。
>
> On 4/10/07, 散漫酷男孩 <17mxnet在gmail.com> wrote:
> > 如果页面有个报时呢。。。
> >
> > 在 07-4-10,hutuworm<hutuworm在gmail.com> 写道:
> > > 求页面源码的 md5sum
> > > 比如:
> > > localhost ~ # lynx -source http://www.python.org |md5sum
> > > c1a61a393f1afc2d6903deaf1bac240c  -
> > > localhost ~ # lynx -source http://www.python.org |md5sum
> > > c1a61a393f1afc2d6903deaf1bac240c  -
> > > localhost ~ # lynx -source http://www.python.cn |md5sum
> > > 88245f4950bb3f3d20d5228c8b49afff  -
> > >
> > > On 4/5/07, email在gzemail.cn <email在gzemail.cn> wrote:
> > > > 大家好,目前想用python判断一个网站是否有更新,大家有什么好方法呢?
> > > > 目前我想到的只是利用ETag和last-modified去判断,不知道有没有更好的办法?请知会一下,谢谢!!!
> > > >
> > > >
> > > > ----------------------------------------------
> > > > 欢迎使用市民电子邮局
> > > >
> > > >
> > > > _______________________________________________
> > > > python-chinese
> > > > Post: send python-chinese在lists.python.cn
> > > > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > > > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > > > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> > >
> > >
> > > --
> > > In doG We Trust
> > > _______________________________________________
> > > python-chinese
> > > Post: send python-chinese在lists.python.cn
> > > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
> --
> LinuX Power
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese


-- 
In doG We Trust

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号