Python论坛  - 讨论区

标题:[python-chinese] SGMLParser的start_a方法怎么获得值

2006年08月10日 星期四 13:25

Mars Lenjoy mars.lenjoy at gmail.com
Thu Aug 10 13:25:52 HKT 2006

http://www.cn">onepage

这样的html,怎么获得onepage?

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年08月10日 星期四 13:52

bird devdoer devdoer at gmail.com
Thu Aug 10 13:52:57 HKT 2006

 def start_a(self,attrs):
  #print 'start_a'
  for attr,val in attrs:
   if attr=='href':

    self.__curAnchorLink=val
    self.__inA=True
 def handle_data(self,data):
  data=data.strip()

  if self.__inA:
   self.__curAnchorText+=data
 def end_a(self):
  if self.__inA:
   self.__anchorTexts.append((self.__curAnchorLink,self.__curAnchorText))
   self.__curAnchorText=''
  self.__inA=False
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20060810/19a5b386/attachment.html

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年08月10日 星期四 14:22

Mars Lenjoy mars.lenjoy at gmail.com
Thu Aug 10 14:22:06 HKT 2006

thanks very much~~
原来handle_data那么牛的~~

2006/8/10, bird devdoer <devdoer at gmail.com>:
>  def start_a(self,attrs):
>   #print 'start_a'
>   for attr,val in attrs:
>    if attr=='href':
>
>     self.__curAnchorLink=val
>     self.__inA=True
>  def handle_data(self,data):
>   data=data.strip()
>
>   if self.__inA:
>    self.__curAnchorText+=data
>  def end_a(self):
>   if self.__inA:
>
> self.__anchorTexts.append((self.__curAnchorLink,self.__curAnchorText))
>    self.__curAnchorText=''
>   self.__inA=False
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to
> python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to
> python-chinese-request at lists.python.cn
> Detail Info:
> http://python.cn/mailman/listinfo/python-chinese
>
>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号