Python论坛  - 讨论区

标题:[python-chinese] 如何提取锚文本的信息?

2007年09月11日 星期二 10:07

shaying shaying在software.ict.ac.cn
星期二 九月 11 10:07:35 HKT 2007

python-chinese,您好!

     如:  中国人民银行 
       我想提取 "中国人民银行“,但是htmlparser, beautifulsoup都
       是提取 href信息的,
       只能用正则表达式吗?
       谢谢!


        致
礼!
 				
              shaying
              shaying在software.ict.ac.cn
                 2007-09-11

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年09月11日 星期二 10:12

Tian askfor在gmail.com
星期二 九月 11 10:12:41 HKT 2007

ºÃÏñÓиö.stringÊôÐÔ¡£

On 9/11/07, shaying <shaying在software.ict.ac.cn> wrote:
>
> python-chinese£¬ÄúºÃ£¡
>
>   È磺  ÖйúÈËÃñÒøÐÐ 
>       ÎÒÏëÌáÈ¡ "ÖйúÈËÃñÒøÐÐ"£¬µ«ÊÇhtmlparser, beautifulsoup¶¼
>       ÊÇÌáÈ¡ hrefÐÅÏ¢µÄ£¬
>       Ö»ÄÜÓÃÕýÔò±í´ïʽÂð£¿
>       лл£¡
>
>
> ÖÂ
> Àñ£¡
>
> shaying
> shaying在software.ict.ac.cn
> 2007-09-11
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070911/b1a1ec69/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年09月11日 星期二 10:35

cao max_cao cmaxcao在gmail.com
星期二 九月 11 10:35:03 HKT 2007

beautifulsoup ¿ÉÒԸ㶨Ëü

***.find('a', {'':''; '':''}).contents[0]

»¹Óв»ÉÙÓ÷¨Äã¿´¿´Îĵµ£¬ »òÕß×Ô¼ºtryÒ»ÏÂ

ÔÚ07-9-11£¬Tian <askfor在gmail.com> дµÀ£º
>
> ºÃÏñÓиö.stringÊôÐÔ¡£
>
> On 9/11/07, shaying <shaying在software.ict.ac.cn> wrote:
> >
> > python-chinese£¬ÄúºÃ£¡
> >
> >   È磺  ÖйúÈËÃñÒøÐÐ 
> >       ÎÒÏëÌáÈ¡ "ÖйúÈËÃñÒøÐÐ"£¬µ«ÊÇhtmlparser, beautifulsoup¶¼
> >       ÊÇÌáÈ¡ hrefÐÅÏ¢µÄ£¬
> >       Ö»ÄÜÓÃÕýÔò±í´ïʽÂð£¿
> >       лл£¡
> >
> >
> > ÖÂ
> > Àñ£¡
> >
> > shaying
> > shaying在software.ict.ac.cn
> > 2007-09-11
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070911/ce6525d3/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号