2007年05月26日 星期六 14:02
目前了解的: Beautiful Soup 不太喜欢它的函数调用方式,还是比较喜欢标准的DOM函数。而且据说执行效率不高(原作者说他是为了提高工作效率,不是为了提高执行效率。。。) elementTree 据说是c实现的,现在是python的lib库里面了,也有相关的文档。它ElementTree XML API miniDOM,这个是倒是实现了DOM API,但是只支持DOM1,0 以及2.0的一些功能。。。。 sax2 这个就不了解了。 感觉挺乱,不知道哪个更好用一点。目前就一个简单的需求,读取 CDATA节点中的内容。 大家用过的都来说说各个的优缺点吧,知道一点说一点,互相学习一下。 -- 明天是美好的。
2007年05月26日 星期六 14:45
ÎÒҲϲ»¶±ê×¼µÄDOMº¯Êý ½âÊÍhtml¾ÍÓôÃÆÁË¡£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070526/fe4316e3/attachment.htm
2007年05月26日 星期六 14:57
解析html郁闷是因为很多html写的都不规范吧。 我觉得用DOM API可以更清晰的理解doc的结构。 -- 明天是美好的。 On 5/26/07, jessinio smith <jessinio在gmail.com> wrote: > 我也喜欢标准的DOM函数 > > 解释html就郁闷了。 > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > Detail Info: > http://python.cn/mailman/listinfo/python-chinese >
2007年05月26日 星期六 15:00
¿ÉÒÔÓÐdom½âÊÍhtmlµÄ£¿£¿£¿ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070526/1109b7d6/attachment.htm
2007年05月26日 星期六 15:01
Beautiful Soup 可以用来解析那些不规范的html页面的。 剩下的都是针对标准xml的吧,主要是两种api,一种是把xml文档都加载进内存形成一棵树;另一种是基于事件的(sax),解析的过程不断产生事件(比如节点开始等),然后你去处理这些事件,不需要把xml文档全部加载进来。 > 目前就一个简单的需求,读取 CDATA节点中的内容。 sax应该比较合适。 On 5/26/07, ljpsfree <caifen1985 at gmail.com> wrote: > > 目前了解的: > > Beautiful Soup > 不太喜欢它的函数调用方式,还是比较喜欢标准的DOM函数。而且据说执行效率不高(原作者说他是为了提高工作效率,不是为了提高执行效率。。。) > > elementTree 据说是c实现的,现在是python的lib库里面了,也有相关的文档。它ElementTree XML API > > miniDOM,这个是倒是实现了DOM API,但是只支持DOM1,0 以及2.0的一些功能。。。。 > > sax2 这个就不了解了。 > > 感觉挺乱,不知道哪个更好用一点。目前就一个简单的需求,读取 CDATA节点中的内容。 > > 大家用过的都来说说各个的优缺点吧,知道一点说一点,互相学习一下。 > > > > -- > 明天是美好的。 > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -- http://codeplayer.blogspot.com/ -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20070526/b1c402d8/attachment.html
2007年05月26日 星期六 15:43
Beautiful Soup 不是按照DOM定义来处理的,它把元素归成了两类: Tag objects, which correspond to tags like thetag and the tags NavigableString objects, which correspond to strings like "Page title" and "This is paragraph".There are also some subclasses of NavigableString (CData, Comment, Declaration, and ProcessingInstruction), which correspond to special XML constructs. 我觉得python的各种解析器提供了不同的解析方式,不仅仅是DOM跟SAX了。我用过java的DOM跟SAX的解析器,也用过.net里面的DOM跟SAX解析器,感觉他们是大同小异,感念上是一致的。但是到了python这,看了几种xml的解析器,感觉就都不一样了。 我不知道Etree API是个什么东西,elementTree用了这个东西。 为什么python官方不提供一个完全实现DOM API的工具呢? -- 明天是美好的。 On 5/26/07, 黄毅 <yi.codeplayer在gmail.com> wrote: > Beautiful Soup 可以用来解析那些不规范的html页面的。 > 剩下的都是针对标准xml的吧,主要是两种api,一种是把xml文档都加载进内存形成一棵树;另一种是基于事件的(sax),解析的过程不断产生事件(比如节点开始等),然后你去处理这些事件,不需要把xml文档全部加载进来。 > > > 目前就一个简单的需求,读取 CDATA节点中的内容。 > > > sax应该比较合适。 > > > On 5/26/07, ljpsfree <caifen1985在gmail.com> wrote: > > > > 目前了解的: > > > > Beautiful Soup > 不太喜欢它的函数调用方式,还是比较喜欢标准的DOM函数。而且据说执行效率不高(原作者说他是为了提高工作效率,不是为了提高执行效率。。。) > > > > elementTree > 据说是c实现的,现在是python的lib库里面了,也有相关的文档。它ElementTree XML API > > > > miniDOM,这个是倒是实现了DOM API,但是只支持DOM1,0 以及2.0的一些功能。。。。 > > > > sax2 这个就不了解了。 > > > > 感觉挺乱,不知道哪个更好用一点。目前就一个简单的需求,读取 CDATA节点中的内容。 > > > > 大家用过的都来说说各个的优缺点吧,知道一点说一点,互相学习一下。 > > > > > > > > -- > > 明天是美好的。 > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > > Detail Info: > http://python.cn/mailman/listinfo/python-chinese > > > > -- > http://codeplayer.blogspot.com/ > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > Detail Info: > http://python.cn/mailman/listinfo/python-chinese >
2007年05月26日 星期六 15:43
web2.0中的html应该是符合dom定义的吧。 -- 明天是美好的。 On 5/26/07, jessinio smith <jessinio在gmail.com> wrote: > 可以有dom解释html的??? > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > Detail Info: > http://python.cn/mailman/listinfo/python-chinese >
2007年05月26日 星期六 16:03
> > 还是比较喜欢标准的DOM函数 *xml.dom* Python mapping of the API is substantially based on the DOM Level 2 recommendation. The mapping of the Level 3 specification, currently only available in draft form, -- http://codeplayer.blogspot.com/ -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20070526/ad224503/attachment.htm
2007年05月26日 星期六 16:22
xml.dom 确实不错,刚看到,呵呵。 意外收获:PyXML The PyXML package is a collection of libraries to process XML with Python. It contains, among other things * xmlproc: a validating XML parser. * Expat: a fast non-validating parser. * sgmlop: a C helper module that can speed-up xmllib.py and sgmllib.py by a factor of 5. * PySAX: SAX 1 and SAX2 libraries with drivers for most of the parsers. * 4DOM: A fully compliant DOM Level 2 implementation * javadom: An adapter from Java DOM implementations to the standard Python DOM binding. * pulldom: a DOM implementation that supports lazy instantiation of nodes. * marshal: a module with several options for serializing Python objects to XML, including WDDX and XML-RPC. -- 明天是美好的。 On 5/26/07, 黄毅 <yi.codeplayer在gmail.com> wrote: > > > 还是比较喜欢标准的DOM函数 > > > xml.dom > > Python mapping of the API is substantially based on the DOM Level 2 > recommendation. The mapping of the Level 3 specification, currently only > available in draft form, > > -- > http://codeplayer.blogspot.com/ > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > Detail Info: > http://python.cn/mailman/listinfo/python-chinese >
2007年05月26日 星期六 18:51
ljpsfree 写道: > 目前了解的: > > Beautiful Soup 不太喜欢它的函数调用方式,还是比较喜欢标准的DOM函数。而且据说执行效率不高(原作者说他是为了提高工作效率,不是为了提高执行效率。。。) > > elementTree 据说是c实现的,现在是python的lib库里面了,也有相关的文档。它ElementTree XML API > > miniDOM,这个是倒是实现了DOM API,但是只支持DOM1,0 以及2.0的一些功能。。。。 > > sax2 这个就不了解了。 > > 感觉挺乱,不知道哪个更好用一点。目前就一个简单的需求,读取 CDATA节点中的内容。 > > 大家用过的都来说说各个的优缺点吧,知道一点说一点,互相学习一下。 > > > > 如果你只想读CDATA节点中的内容,不操作XML从效率上讲SAX最合适,因为是流式 的,其他的都要在内存中建立Dom树,占用内存及效率肯定不及他。如果需要操作 的话,首先就是DOM。
2007年05月26日 星期六 22:57
谁介绍一下Etree API? -- 明天是美好的。
2007年05月27日 星期日 04:11
elementTree 里边的xml.etree.cElementTree比较常用。 到官方上就什么都可以有了。 http://effbot.org/zone/element-index.htm 2007/5/26, ljpsfree <caifen1985 at gmail.com>: > 谁介绍一下Etree API? > > -- > 明天是美好的。 > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -- 花开邑大,漫步心月湖。 http://www.ewyu.com/
2007年05月28日 星期一 08:59
ljpsfree 写道: > 目前了解的: > > Beautiful Soup 不太喜欢它的函数调用方式,还是比较喜欢标准的DOM函数。而且据说执行效率不高(原作者说他是为了提高工作效率,不是为了提高执行效率。。。) > > elementTree 据说是c实现的,现在是python的lib库里面了,也有相关的文档。它ElementTree XML API > > miniDOM,这个是倒是实现了DOM API,但是只支持DOM1,0 以及2.0的一些功能。。。。 > > sax2 这个就不了解了。 > > 感觉挺乱,不知道哪个更好用一点。目前就一个简单的需求,读取 CDATA节点中的内容。 > > 大家用过的都来说说各个的优缺点吧,知道一点说一点,互相学习一下。 不知道有没有人用过4suite? 这个库在python and xml这本书里提到过,速度比较 快,对于读取节点,4suite提供了xpath语法支持,个人感觉很方便。这是地址: http: //4suite.org/index.xhtml
2007年05月28日 星期一 10:29
用过dom4j的xpath,确实很好用~ 在07-5-28,eric <glitch.wang在gmail.com> 写道: > > ljpsfree 写道: > > 目前了解的: > > > > Beautiful Soup > 不太喜欢它的函数调用方式,还是比较喜欢标准的DOM函数。而且据说执行效率不高(原作者说他是为了提高工作效率,不是为了提高执行效率。。。) > > > > elementTree 据说是c实现的,现在是python的lib库里面了,也有相关的文档。它ElementTree XML API > > > > miniDOM,这个是倒是实现了DOM API,但是只支持DOM1,0 以及2.0的一些功能。。。。 > > > > sax2 这个就不了解了。 > > > > 感觉挺乱,不知道哪个更好用一点。目前就一个简单的需求,读取 CDATA节点中的内容。 > > > > 大家用过的都来说说各个的优缺点吧,知道一点说一点,互相学习一下。 > 不知道有没有人用过4suite? 这个库在python and xml这本书里提到过,速度比较 > 快,对于读取节点,4suite提供了xpath语法支持,个人感觉很方便。这是地址: > http: //4suite.org/index.xhtml > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -- Best Regards! Ace Strong ================================================== Nanjing University of Aeronautics and Astronautics. College of Civil Aviation Tao Cheng E-mail: acestrong在gmail.com ;acestrong在nuaa.edu.cn Tel: 86-025-84892273 ================================================== -------------- 下一部分 -------------- 一个HTML附件被移除... URL: http://python.cn/pipermail/python-chinese/attachments/20070528/d08593fd/attachment.html
2007年05月29日 星期二 15:24
大家好像都在讨论用python写web程序的啊? 我想问问怎么创建自定义的对话框啊?最好只用Tkinter。 谢谢
2007年05月29日 星期二 15:29
wxpython ºÃÏñҪǿ´óºÜ¶à¡£ ¶øÇÒÓв»ÉÙÀý×Ó¡£ wang_zheng_yong 2007-05-29 ·¢¼þÈË£º Edward ·¢ËÍʱ¼ä£º 2007-05-29 15:25:18 ÊÕ¼þÈË£º python-chinese在lists.python.cn ³ËÍ£º Ö÷Ì⣺ [python-chinese]Ôõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿ ´ó¼ÒºÃÏñ¶¼ÔÚÌÖÂÛÓÃpythonдweb³ÌÐòµÄ°¡£¿ ÎÒÏëÎÊÎÊÔõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿×îºÃÖ»ÓÃTkinter¡£ лл _______________________________________________ python-chinese Post: send python-chinese在lists.python.cn Subscribe: send subscribe to python-chinese-request在lists.python.cn Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn Detail Info: http://python.cn/mailman/listinfo/python-chinese -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070529/867b9cfa/attachment.html
2007年05月29日 星期二 18:35
ÎÒ¾ÍÒªÓÃTkinter°¡£¬ÎªÁËÕâôһ¸öС¶«Î÷ÓÖ×°Ò»¸ö°ü£¬²»Ë¬¡£ Äܲ»ÄÜ×öµÃµ½µÄ£¿ ÔÚ 2007-5-29£¬ÏÂÎç3:29£¬wang_zheng_yong дµÀ£º > wxpython ºÃÏñҪǿ´óºÜ¶à¡£ > > ¶øÇÒÓв»ÉÙÀý×Ó¡£ > > wang_zheng_yong > 2007-05-29 > ·¢¼þÈË£º Edward > ·¢ËÍʱ¼ä£º 2007-05-29 15:25:18 > ÊÕ¼þÈË£º python-chinese在lists.python.cn > ³ËÍ£º > Ö÷Ì⣺ [python-chinese]Ôõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿ > > ´ó¼ÒºÃÏñ¶¼ÔÚÌÖÂÛÓÃpythonдweb³ÌÐòµÄ°¡£¿ > ÎÒÏëÎÊÎÊÔõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿×îºÃÖ»ÓÃTkinter¡£ > > лл > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese- > request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese- > request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070529/61bae5d3/attachment-0001.htm
2007年05月29日 星期二 18:38
Èç¹ûÄãËÑһϹýÈ¥µÄÓʼþ£¬ÎÒºÜÔçµÄʱºò¾Í·Å³ö¹ýÒ»¸öTK BookµÄURL£º http://effbot.org/tkinterbook/ ÔÚ07-5-29£¬Edward <zjut.1st在126.com> дµÀ£º > > ÎÒ¾ÍÒªÓÃTkinter°¡£¬ÎªÁËÕâôһ¸öС¶«Î÷ÓÖ×°Ò»¸ö°ü£¬²»Ë¬¡£Äܲ»ÄÜ×öµÃµ½µÄ£¿ > > > ÔÚ 2007-5-29£¬ÏÂÎç3:29£¬wang_zheng_yong дµÀ£º > > wxpython ºÃÏñҪǿ´óºÜ¶à¡£ > > ¶øÇÒÓв»ÉÙÀý×Ó¡£ > > ------------------------------ > wang_zheng_yong > 2007-05-29 > ------------------------------ > *·¢¼þÈË£º* Edward > *·¢ËÍʱ¼ä£º* 2007-05-29 15:25:18 > *ÊÕ¼þÈË£º* python-chinese在lists.python.cn > *³ËÍ£º* > *Ö÷Ì⣺* [python-chinese]Ôõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿ > > ´ó¼ÒºÃÏñ¶¼ÔÚÌÖÂÛÓÃpythonдweb³ÌÐòµÄ°¡£¿ > ÎÒÏëÎÊÎÊÔõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿×îºÃÖ»ÓÃTkinter¡£ > > лл > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- µÇɽÕßÈ¥µÇɽ£¬ÒòΪɽÔÚÄÇÀï ÎÒÔÚ˼¿¼£¬ÒòΪÎÊÌâÔÚÄÇÀï ÁõöÎ March.Liu -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070529/8113af64/attachment.htm
2007年05月29日 星期二 18:45
лл£¬°ïÁË´óæÁË¡£ ÎҸղμÓÕâ¸öÉçÇø£¬²»´ó»áÓÃÓʼþÁÐ±í¡£ ÔÚ 2007-5-29£¬ÏÂÎç6:38£¬ÁõöΠдµÀ£º > Èç¹ûÄãËÑһϹýÈ¥µÄÓʼþ£¬ÎÒºÜÔçµÄʱºò¾Í·Å³ö¹ýÒ»¸öTK BookµÄURL£º > http://effbot.org/tkinterbook/ > > ÔÚ07-5-29£¬Edward < zjut.1st在126.com> дµÀ£º > ÎÒ¾ÍÒªÓÃTkinter°¡£¬ÎªÁËÕâôһ¸öС¶«Î÷ÓÖ×°Ò»¸ö°ü£¬²»Ë¬¡£ > Äܲ»ÄÜ×öµÃµ½µÄ£¿ > > > ÔÚ 2007-5-29£¬ÏÂÎç3:29£¬wang_zheng_yong дµÀ£º > >> wxpython ºÃÏñҪǿ´óºÜ¶à¡£ >> >> ¶øÇÒÓв»ÉÙÀý×Ó¡£ >> >> wang_zheng_yong >> 2007-05-29 >> ·¢¼þÈË£º Edward >> ·¢ËÍʱ¼ä£º 2007-05-29 15:25:18 >> ÊÕ¼þÈË£º python-chinese在lists.python.cn >> ³ËÍ£º >> Ö÷Ì⣺ [python-chinese]Ôõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿ >> >> ´ó¼ÒºÃÏñ¶¼ÔÚÌÖÂÛÓÃpythonдweb³ÌÐòµÄ°¡£¿ >> ÎÒÏëÎÊÎÊÔõô´´½¨×Ô¶¨ÒåµÄ¶Ô»°¿ò°¡£¿×îºÃÖ»ÓÃTkinter¡£ >> >> лл >> _______________________________________________ >> python-chinese >> Post: send python-chinese在lists.python.cn >> Subscribe: send subscribe to python-chinese-request在lists.python.cn >> Unsubscribe: send unsubscribe to python-chinese- >> request在lists.python.cn >> Detail Info: http://python.cn/mailman/listinfo/python-chinese >> _______________________________________________ >> python-chinese >> Post: send python-chinese在lists.python.cn >> Subscribe: send subscribe to python-chinese-request在lists.python.cn >> Unsubscribe: send unsubscribe to python-chinese- >> request在lists.python.cn >> Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese- > request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > -- > µÇɽÕßÈ¥µÇɽ£¬ÒòΪɽÔÚÄÇÀï > ÎÒÔÚ˼¿¼£¬ÒòΪÎÊÌâÔÚÄÇÀï > > ÁõöÎ > March.Liu > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese- > request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070529/a0807549/attachment.html
Zeuux © 2025
京ICP备05028076号