2007年06月15日 星期五 13:37
ææ³å°"http://www.economics.utoronto.ca/index.php/index/person/faculty/"ç½é¡µä¸çææä»»å½ä»¥åè称对åºèµ·æ¥å¹¶çæCSVè¾åºãæ¯è¡çæ ¼å¼ä¸ºï¼[人åï¼è称]ãç¨æ£å表达å¼æ¥æ¾ä¿¡æ¯ï¼ç¨åºå¦ä¸ï¼ import urllib,re,csv url = "http://www.economics.utoronto.ca/index.php/index/person/faculty/" sock = urllib.urlopen(url) htmlSource = sock.read() sock.close() namePattern = re.compile(r'class="name">(.*)') titlePattern = re.compile(r', (.*)\s*') name = namePattern.findall(htmlSource) title_temp = titlePattern.findall(htmlSource) title =[] for item in title_temp: item_new=" ".join(item.split()) #å缩è称信æ¯ä¸ä¹é´çç©ºæ ¼ï¼ä½¿è¾åºä¿¡æ¯åå¾ç®æ´ã title.extend([item_new]) output =[] for i in range(len(name)): output.insert(i,[name[i],title[i]]) #å°äººåä¸è称ä¸ä¸å¯¹åºèµ·æ¥ï¼çælist writer = csv.writer(open("professor.csv", "wb")) writer.writerows(output) #è¾åºCSVæ件 é®é¢ï¼ 1.以ä¸ç¨åºæ¯å设æ¯ä¸ªææé½æè称信æ¯ãä¸æ¦ä»»ä½ä¸ä¸ªäººæ²¡æè称信æ¯ï¼åå ¶åç人å½ä¸è称åä¼éä½ã请é®å¦ä½æ¹åæè½ä½¿äººå对åºçè称å¯ä»¥ä¸ºç©ºï¼ 2.æ没æå ¶ä»ç¼ç¨æ¹å¼å¯ä»¥æ´å ç®åå°è¾¾å°æçç®çï¼ 3.å¦å¤è¿æä¸ä¸ªå°é®é¢ãcsv模åæå¼çæ件("professor.csv")æ¯å¦éè¦å ³éï¼å¦ä½å ³éï¼ å¤è°¢ï¼ Jackie --------------------------------- Be smarter than spam. See how smart SpamGuard is at giving junk email the boot with the All-new Yahoo! Mail -------------- ä¸ä¸é¨å -------------- ??HTML?????... URL: http://python.cn/pipermail/python-chinese/attachments/20070615/3aa4fcba/attachment.htm
2007年06月15日 星期五 13:43
正则式不方便的话可以考虑使用beautifulsoup模块。 -- I like python! UliPad <>: http://wiki.woodpecker.org.cn/moin/UliPad My Blog: http://www.donews.net/limodou
2007年06月16日 星期六 13:03
Ni hao I posted an article about Calling Windows API in Python on my blog, http://pyarticles.blogspot.com/ , Let's see it Any comments are welcome Thank you _________________________________________________________________ Make every IM count. Download Windows Live Messenger and join the i’m Initiative now. It’s free. http://im.live.com/messenger/im/home/?source=TAGWL_June07 -------------- 下一部分 -------------- ??HTML?????... URL: http://python.cn/pipermail/python-chinese/attachments/20070616/cec2f87a/attachment.html
2007年06月16日 星期六 13:44
²»´í°¡£¬ÎÒÃǵÄÓʼþÁбíÀïÃ滹ÓÐÀÏÍâ°¡~~ 2007/6/16, Eiwot <eiwot在hotmail.com>: > > Ni hao > I posted an article about Calling Windows API in Python on my blog, > http://pyarticles.blogspot.com/ , Let's see it > > Any comments are welcome > > Thank you > > ------------------------------ > Make every IM count. Download Windows Live Messenger and join the i'm > Initiative now. It's free. Make it count!<http://im.live.com/messenger/im/home/?source=TAGWL_June07> > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070616/1c8ebeb1/attachment.html
2007年06月16日 星期六 21:30
ÔÚ07-6-16£¬klutz chump <chumpklutz在gmail.com> дµÀ£º > > ²»´í°¡£¬ÎÒÃǵÄÓʼþÁбíÀïÃ滹ÓÐÀÏÍâ°¡~~ ¶¥£¬»á˵Ni haoµÄÀÏÍâ¡£ºÜÇ¿°¡¡£¡£¡£ ºÃÏñ¿´ÀÏÍâµÄ²©¿Í»¹µÃÓôúÀí²ÅÐС£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070616/2802caf9/attachment.html
2007年06月17日 星期日 08:25
在学校里面看不了啊不能上国外网,代理又慢,建议能上的发到邮件列表里面。当然要得到作者的同意了,呵呵~ -------------- 涓嬩竴閮ㄥ垎 -------------- 一个HTML附件被移除... URL: http://python.cn/pipermail/python-chinese/attachments/20070617/48be4b34/attachment.html
2007年06月17日 星期日 12:05
> > 在学校里面看不了啊 > 不能上国外网,代理又慢,建议能上的发到邮件列表里面。当然要得到作者的同意了,呵呵~ > 我也是校园网可以访问国外网站啊。 冲破对 blogspot 的封锁,有许多方法,网上搜一下很多。 不过基本利用的都是一个原理,就是 blogspot.com 有两个 ip ,gwf只封一个,所以只要手动在相关文件里加上 72.14.219.191 pyarticles.blogspot.com 就可以访问了。 -- http://codeplayer.blogspot.com/ -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20070617/e6e81555/attachment.htm
Zeuux © 2025
京ICP备05028076号