Python论坛  - 讨论区

标题:[python-chinese] [散活] 网络爬虫需求/20061201

2006年12月01日 星期五 17:02

NewBoyTim newboytim在163.com
星期五 十二月 1 17:02:37 HKT 2006

如果不说价钱完全当一个开源项目来做的话

是非常的好的新手都去试做做这个项目

 

 

 

----------------------------------------------------------------
NewBoyTim
E-mail:NewBoyTim at 163.com
Blog:Http://Blog.PartyWind.Com
Python新手
----------------------------------------------------------------
  

  _____  

From: python-chinese-bounces at lists.python.cn
[mailto:python-chinese-bounces at lists.python.cn] On Behalf Of bird devdoer
Sent: Friday, December 01, 2006 4:41 PM
To: python-chinese at lists.python.cn
Subject: Re: [python-chinese][散活] 网络爬虫需求/20061201

 

好像也没有谁说粗口 或者什么不当的 ,农民工这个词不知道为什么有些人这么反感
说这个词的人未必就蔑视什么人,只是说明技术含量就不一样,用不着那么敏感。

另外出价低(非常低),是明显的事实,只是说出来而已,犯不着做什么正人君子,表
面上很清高。

倒是提醒大家尊重自己的能力,尊重自己的劳动成果,不要太小看自己。

 

2006/12/1, IQDoctor <huanghao.c at gmail.com>: 

嗯, 在理, 支持.

Dreamingk(天成) 写道:
> 请各位回复的时候注意自己的回复语气和用词,不要用 粗口 和 蔑视的 态度,
> 还有不用把 "农民" 和 "民工"扯进来,不论Liyu的出价合不合理。 
>
> 邮件列表的气氛和氛围要大家细心的维持,所以请大家在交流的时候尽量的尊重
> 别人。 谢谢
>
> On 12/1/06, *gashero* < harry.python at gmail.com
> harry.python at gmail.com harry.python at gmail.com> >> wrote:
>
>     嘿嘿,哥几个别骂了,这孩子估计也是公司的活压下来,自己做的不顺,又
>     不想错失机会,所以才来求助的。恐怕也是同行。
>     不过大家既然对价格不满意,何不找几个哥们自己写一个贴到网上去自己开
>     网站呢。做的成熟了自然会有人竞相出大价钱收购的。不知哪位有兴趣。如 
>     果要做算我一个,我还小,对项目管理之类没有经验,还请大家指导呢。
>     _______________________________________________
>     python-chinese
>     Post: send python-chinese at lists.python.cn
python-chinese at lists.python.cn> 
>     python-chinese at lists.python.cn>
>     Subscribe: send subscribe to
>     python-chinese-request at lists.python.cn
>     python-chinese-request at lists.python.cn>
>     Unsubscribe: send unsubscribe to
>     python-chinese-request at lists.python.cn
>     python-chinese-request at lists.python.cn> 
>     Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
>
>
> --
> Dreamingk (tc, 天成)
> email: 
>     dreamingk at gmail.com dreamingk at gmail.com>
>     tc at exoweb.net tc at exoweb.net>
> website:
>     http://www.exoweb.net
>      http://python.cn
>     http://django.cn
>     http://zope.cn
> Exoweb (北京轩辕互动科技有限公司)
>   北京市朝阳区金台路甜水园东街2号
>   甜水园商务中心A505  100026
> Python, I love this language.
> ------------------------------------------------------------------------ 
>
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn 
> Detail Info: http://python.cn/mailman/listinfo/python-chinese

_______________________________________________
python-chinese
Post: send python-chinese at lists.python.cn
Subscribe: send subscribe to python-chinese-request at lists.python.cn
Unsubscribe: send unsubscribe to   python-chinese-request at lists.python.cn
Detail Info: http://python.cn/mailman/listinfo/python-chinese 




-- 
devdoer
devdoer at gmail.com
http://project.mytianwang.cn/cgi-bin/blog 

-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20061201/d4d13682/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月01日 星期五 18:23

Dreamingk(天成) dreamingk在gmail.com
星期五 十二月 1 18:23:18 HKT 2006

首先,我不希望把这个"农民工"这个词扯进来,不想对此有任何评价,我的意思是尽量少说这种 "容易" 引起 "误解" 和争论的词,无其他的意思。
其次低与不低是相对而言。如果是我上学的时候,能有一个项目来练习,然后有一点报酬的话,我想我愿意来作。当然现在我也觉得低,但是我可以选择不作,我不评价就是了。

谢谢你的提醒。

On 12/1/06, bird devdoer <devdoer在gmail.com> wrote:
>
> 好像也没有谁说粗口 或者什么不当的 ,农民工这个词不知道为什么有些人这么反感
> 说这个词的人未必就蔑视什么人,只是说明技术含量就不一样,用不着那么敏感。
> 另外出价低(非常低),是明显的事实,只是说出来而已,犯不着做什么正人君子,表面上很清高。
> 倒是提醒大家尊重自己的能力,尊重自己的劳动成果,不要太小看自己。
>
>
> 2006/12/1, IQDoctor <huanghao.c在gmail.com>:
> >
> > 嗯, 在理, 支持.
> >
> > Dreamingk(天成) 写道:
> > > 请各位回复的时候注意自己的回复语气和用词,不要用 粗口 和 蔑视的 态度,
> > > 还有不用把 "农民" 和 "民工"扯进来,不论Liyu的出价合不合理。
> > >
> > > 邮件列表的气氛和氛围要大家细心的维持,所以请大家在交流的时候尽量的尊重
> > > 别人。 谢谢
> > >
> > > On 12/1/06, *gashero* < harry.python在gmail.com
> > > harry.python在gmail.com>> wrote:
> > >
> > >     嘿嘿,哥几个别骂了,这孩子估计也是公司的活压下来,自己做的不顺,又
> > >     不想错失机会,所以才来求助的。恐怕也是同行。
> > >     不过大家既然对价格不满意,何不找几个哥们自己写一个贴到网上去自己开
> > >     网站呢。做的成熟了自然会有人竞相出大价钱收购的。不知哪位有兴趣。如
> > >     果要做算我一个,我还小,对项目管理之类没有经验,还请大家指导呢。
> > >     _______________________________________________
> > >     python-chinese
> > >     Post: send python-chinese在lists.python.cn
> > >     python-chinese在lists.python.cn>
> > >     Subscribe: send subscribe to
> > >     python-chinese-request在lists.python.cn
> > >     python-chinese-request在lists.python.cn>
> > >     Unsubscribe: send unsubscribe to
> > >     python-chinese-request在lists.python.cn
> > >     python-chinese-request在lists.python.cn>
> > >     Detail Info: http://python.cn/mailman/listinfo/python-chinese
> > >
> > >
> > >
> > >
> > > --
> > > Dreamingk (tc, 天成)
> > > email:
> > >     dreamingk在gmail.com dreamingk在gmail.com>
> > >     tc在exoweb.net tc在exoweb.net>
> > > website:
> > >     http://www.exoweb.net
> > >      http://python.cn
> > >     http://django.cn
> > >     http://zope.cn
> > > Exoweb (北京轩辕互动科技有限公司)
> > >   北京市朝阳区金台路甜水园东街2号
> > >   甜水园商务中心A505  100026
> > > Python, I love this language.
> > >
> > ------------------------------------------------------------------------
> > >
> > > _______________________________________________
> > > python-chinese
> > > Post: send python-chinese在lists.python.cn
> > > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> >
> > > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> >
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to
> > python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
>
>
> --
> devdoer
> devdoer在gmail.com
> http://project.mytianwang.cn/cgi-bin/blog
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



-- 
Dreamingk (tc, 天成)
email:
    dreamingk在gmail.com
    tc在exoweb.net
website:
    http://www.exoweb.net
    http://python.cn
    http://django.cn
    http://zope.cn
Exoweb (北京轩辕互动科技有限公司)
  北京市朝阳区金台路甜水园东街2号
  甜水园商务中心A505  100026
Python, I love this language.
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20061201/26dc173f/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月01日 星期五 18:25

nicran在gmail.com nicran在gmail.com
星期五 十二月 1 18:25:47 HKT 2006

的确报酬太低
Sent from my BlackBerry® wireless handheld  

-----Original Message-----
From: "NewBoyTim" <newboytim在163.com>
Date: Fri, 1 Dec 2006 13:30:46 
To:<python-chinese在lists.python.cn>
Subject: Re: [python-chinese]
	[散活] 网络爬虫需求/2006120 1

我不知道python程序的市场价是到什么地方
不过用别的做的话,这个的要求不小于三千

----------------------------------------------------------------
NewBoyTim
E-mail:NewBoyTim在163.com
Blog:Http://Blog.PartyWind.Com
Python新手
----------------------------------------------------------------
 
-----Original Message-----
From: python-chinese-bounces在lists.python.cn
[mailto:python-chinese-bounces在lists.python.cn] On Behalf Of Liyu
Sent: Friday, December 01, 2006 1:07 PM
To: python-chinese在lists.python.cn
Cc: li.monan在gmail.com
Subject: [python-chinese] [散活] 网络爬虫需求/20061201


打扰打扰,代朋友发一封垃圾邮件,想捞点外快的兄弟试试吧。

网络爬虫需求/20061201

总体目标:
        
        快速获取15个知名视频网站上的视频元信息。


具体要求:
        1、给定一个视频网站上的入口URL,自动分析判断其站点所有公开视频的
URL。
        2、视频格式不限,至少包括flash/wma/rm/mpeg等。
        3、元信息至少包括:题目、介绍、作者、发布日期、其他、评论次数、
观看次数、HTML嵌入代码、BBS嵌入代码、Blog嵌入代码、来源、URL。但不包括视
频本身。
        4、将获得的元信息提交至MYSQL的DB。
        5、开放源代码,最好用Python实现,这里可提供一个范例程序
(python),以供参考。。
        6、性能要求:大于20000条/每天。
        
报酬及其它要求:
    
        1、要求北京见面,因为以上为概要需求,更详细的需要面谈。
        2、10-15天内全部完成,前5个收到后,付400RMB,其余600RMB全部收到
后付清。
       
回复邮件地址:

        有兴趣的朋友,请联系:
        email: li.monan%gmail.com

_______________________________________________
python-chinese
Post: send python-chinese在lists.python.cn
Subscribe: send subscribe to python-chinese-request在lists.python.cn
Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
Detail Info: http://python.cn/mailman/listinfo/python-chinese
_______________________________________________
python-chinese
Post: send python-chinese在lists.python.cn
Subscribe: send subscribe to python-chinese-request在lists.python.cn
Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
Detail Info: http://python.cn/mailman/listinfo/python-chinese

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月02日 星期六 21:45

彭涛 pt4200在gmail.com
星期六 十二月 2 21:45:08 HKT 2006

ºÜ¶àÊÓƵվÊÇÓÐ×öÈÕÖ¾·ÖÎöµÄ£¬Í¬Ò»IPÅÀÌ«¶à»á×Ô¶¯KµôµÄ¡£
Áí£º1000ÔªÅÀ15¸öÕ¾Ò²±ãÒËÁ˵ã


2006/12/1, Liyu <liyu在ccoss.com.cn>:
>
>
> ´òÈÅ´òÈÅ£¬´úÅóÓÑ·¢Ò»·âÀ¬»øÓʼþ£¬ÏëÀ̵ãÍâ¿ìµÄÐÖµÜÊÔÊÔ°É¡£
>
> ÍøÂçÅÀ³æÐèÇó/20061201
>
> ×ÜÌåÄ¿±ê£º
>
>        ¿ìËÙ»ñÈ¡15¸öÖªÃûÊÓƵÍøÕ¾ÉϵÄÊÓƵԪÐÅÏ¢¡£
>
>
> ¾ßÌåÒªÇó£º
>        1¡¢¸ø¶¨Ò»¸öÊÓƵÍøÕ¾ÉϵÄÈë¿ÚURL£¬×Ô¶¯·ÖÎöÅжÏÆäÕ¾µãËùÓй«¿ªÊÓƵµÄ
> URL¡£
>        2¡¢ÊÓƵ¸ñʽ²»ÏÞ£¬ÖÁÉÙ°üÀ¨flash/wma/rm/mpegµÈ¡£
>        3¡¢ÔªÐÅÏ¢ÖÁÉÙ°üÀ¨£ºÌâÄ¿¡¢½éÉÜ¡¢×÷Õß¡¢·¢²¼ÈÕÆÚ¡¢ÆäËû¡¢ÆÀÂÛ´ÎÊý¡¢
> ¹Û¿´´ÎÊý¡¢HTMLǶÈë´úÂë¡¢BBSǶÈë´úÂë¡¢BlogǶÈë´úÂë¡¢À´Ô´¡¢URL¡£µ«²»°üÀ¨ÊÓ
> Ƶ±¾Éí¡£
>        4¡¢½«»ñµÃµÄÔªÐÅÏ¢Ìá½»ÖÁMYSQLµÄDB¡£
>        5¡¢¿ª·ÅÔ´´úÂ룬×îºÃÓÃPythonʵÏÖ£¬ÕâÀï¿ÉÌṩһ¸ö·¶Àý³ÌÐò
> (python)£¬ÒÔ¹©²Î¿¼¡£¡£
>        6¡¢ÐÔÄÜÒªÇ󣺴óÓÚ20000Ìõ£¯Ã¿Ìì¡£
>
> ±¨³ê¼°ÆäËüÒªÇó£º
>
>        1¡¢ÒªÇó±±¾©¼ûÃ棬ÒòΪÒÔÉÏΪ¸ÅÒªÐèÇ󣬸üÏêϸµÄÐèÒªÃæ̸¡£
>        2¡¢10-15ÌìÄÚÈ«²¿Íê³É£¬Ç°5¸öÊÕµ½ºó£¬¸¶400RMB£¬ÆäÓà600RMBÈ«²¿ÊÕµ½
> ºó¸¶Çå¡£
>
> »Ø¸´ÓʼþµØÖ·£º
>
>        ÓÐÐËȤµÄÅóÓÑ£¬ÇëÁªÏµ£º
>        email: li.monan%gmail.com
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20061202/2517d392/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月03日 星期日 05:52

shhgs shhgs.efhilt在gmail.com
星期日 十二月 3 05:52:01 HKT 2006

这个项目的难度不大。




On 12/2/06, 彭涛 <pt4200在gmail.com> wrote:
> 很多视频站是有做日志分析的,同一IP爬太多会自动K掉的。
> 另:1000元爬15个站也便宜了点
>
>
> 2006/12/1, Liyu <liyu在ccoss.com.cn>:
> >
> > 打扰打扰,代朋友发一封垃圾邮件,想捞点外快的兄弟试试吧。
> >
> > 网络爬虫需求/20061201
> >
> > 总体目标:
> >
> >        快速获取15个知名视频网站上的视频元信息。
> >
> >
> > 具体要求:
> >        1、给定一个视频网站上的入口URL,自动分析判断其站点所有公开视频的
> > URL。
> >        2、视频格式不限,至少包括flash/wma/rm/mpeg等。
> >        3、元信息至少包括:题目、介绍、作者、发布日期、其他、评论次数、
> > 观看次数、HTML嵌入代码、BBS嵌入代码、Blog嵌入代码、来源、URL。但不包括视
> > 频本身。
> >        4、将获得的元信息提交至MYSQL的DB。
> >        5、开放源代码,最好用Python实现,这里可提供一个范例程序
> > (python),以供参考。。
> >        6、性能要求:大于20000条/每天。
> >
> > 报酬及其它要求:
> >
> >        1、要求北京见面,因为以上为概要需求,更详细的需要面谈。
> >        2、10-15天内全部完成,前5个收到后,付400RMB,其余600RMB全部收到
> > 后付清。
> >
> > 回复邮件地址:
> >
> >        有兴趣的朋友,请联系:
> >        email: li.monan%gmail.com
> >
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to
> python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to
> python-chinese-request在lists.python.cn
> > Detail Info:
> http://python.cn/mailman/listinfo/python-chinese
>
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to
> python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to
> python-chinese-request在lists.python.cn
> Detail Info:
> http://python.cn/mailman/listinfo/python-chinese
>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月03日 星期日 15:15

Davies Liu davies.liu在gmail.com
星期日 十二月 3 15:15:38 HKT 2006

前阵子刚做过一个类似的项目,不过是爬电影票房和评论的相关内容,涉及到站点有上百个
一个星期完成基本内容,完善用了三个星期,提高数据的完整性和准确性
详细的内容写在我的blog上:
http://blog.daviesliu.net/article/entry20061201-204335
原本贴出来了代码和数据,后来应甲方的要求把他们撤下来了

Davies Liu

On 12/1/06, Liyu <liyu在ccoss.com.cn> wrote:
>
> 打扰打扰,代朋友发一封垃圾邮件,想捞点外快的兄弟试试吧。
>
> 网络爬虫需求/20061201
>
> 总体目标:
>
>         快速获取15个知名视频网站上的视频元信息。
>
>
> 具体要求:
>         1、给定一个视频网站上的入口URL,自动分析判断其站点所有公开视频的
> URL。
>         2、视频格式不限,至少包括flash/wma/rm/mpeg等。
>         3、元信息至少包括:题目、介绍、作者、发布日期、其他、评论次数、
> 观看次数、HTML嵌入代码、BBS嵌入代码、Blog嵌入代码、来源、URL。但不包括视
> 频本身。
>         4、将获得的元信息提交至MYSQL的DB。
>         5、开放源代码,最好用Python实现,这里可提供一个范例程序
> (python),以供参考。。
>         6、性能要求:大于20000条/每天。
>
> 报酬及其它要求:
>
>         1、要求北京见面,因为以上为概要需求,更详细的需要面谈。
>         2、10-15天内全部完成,前5个收到后,付400RMB,其余600RMB全部收到
> 后付清。
>
> 回复邮件地址:
>
>         有兴趣的朋友,请联系:
>         email: li.monan%gmail.com
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese


-- 
Davies Liu
My Blog: http://blog.daviesliu.net/

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月06日 星期三 09:07

Lajos Zhou duoduoluck在163.com
星期三 十二月 6 09:07:49 HKT 2006

确实太低了!人家激动也是正常的。





limodou 写道:
> On 12/1/06, bird devdoer <devdoer在gmail.com> wrote:
>   
>> 钱太少 就算按你说的10天完成, 每天200 还2000元呢
>> 这种帖子别来侮辱程序员了
>>
>>     
> 没必要这么激动,不满意可以再谈,不行可以不做。
>
>   



[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月06日 星期三 09:24

limodou limodou在gmail.com
星期三 十二月 6 09:24:54 HKT 2006

On 12/6/06, Lajos Zhou <duoduoluck在163.com> wrote:
> 确实太低了!人家激动也是正常的。
>
但情况并不是做完了之后的抱怨,而还没有开始呢。而且这事认为不行可以谈啊。

-- 
I like python!
UliPad <>: http://wiki.woodpecker.org.cn/moin/UliPad
My Blog: http://www.donews.net/limodou

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年12月06日 星期三 09:47

Zoom.Quiet zoom.quiet在gmail.com
星期三 十二月 6 09:47:01 HKT 2006

On 12/6/06, limodou <limodou在gmail.com> wrote:
> On 12/6/06, Lajos Zhou <duoduoluck在163.com> wrote:
> > 确实太低了!人家激动也是正常的。
> >
> 但情况并不是做完了之后的抱怨,而还没有开始呢。而且这事认为不行可以谈啊。
>

在 Linux 上构建 Web spider
http://www-128.ibm.com/developerworks/cn/linux/l-spider/index.html?ca=dwcn-newsletter-linux

资料是丰富的,调试是辛苦的,知识是自个儿的

> --
> I like python!
> UliPad <>: http://wiki.woodpecker.org.cn/moin/UliPad
> My Blog: http://www.donews.net/limodou
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese


-- 
'''Time is unimportant, only life important!
blog@  http://blog.zoomquiet.org/pyblosxom/
wiki@    http://wiki.woodpecker.org.cn/moin/ZoomQuiet
douban@ http://www.douban.com/people/zoomq/
____________________________________
Please use OpenOffice.org to replace M$ office.
     http://zh.openoffice.org
Please use 7-zip to replace WinRAR/WinZip.
     http://7-zip.org/zh-cn/
You can get the truely Freedom from software.
'''

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号