2006年10月12日 星期四 11:37
Hong Yuan,您好! 谢谢。我大概看了一下,好象没有LINUX的,只有源码,估计在LINUX下要自己封装TIDYLIB。 我先研究研究 在 2006-10-11 11:36:00 您写道: >我是在Windows下使用的,Linux下应该也没有问题。是否能够生成xml倒是不太清 >楚,我是用来生成html的。下面是使用要点和 sample代码。 > >uTidyLib(http://utidylib.berlios.de/) 提供了对从python中调用tidylib的途径。 > >从python程序中调用该库有以下一些注意事项: > > * utidylib依赖于ctypes包。其主页上提供的binary版本比较旧,其自带的 > prv_ctypes无法在python2.4下正常运行,必须安装最新的ctypes包; > * tidy.parseString只能接受str对象。从wxPython控件中返回的文本多为 > unicode对象,需要先使用encode ('utf8')转换为string对象; > * item_description中的内容并不是完整的html代码,只是中的一个片 > 断。默认情况下tidylib 将自动补上html文档头,这时需要设置show-body- > only选项为1,使其只输出部分的内容; > * > 规定,将< body>中所有的> 在格式化后的< body>中,还需要使用regular expression从将这些 > 代码提取出来,和拼在一起。 > >实现上述功能的代码片断如下: > >options = {'wrap': 0, > 'show_body_only': 0, > 'indent': 'auto', > 'char_encoding': 'utf8'} ># tidy only accepts string objects as input >html = some_html_string_in_unicode.encode('utf8') > ># A small trick: ># tidy will move all ># want to leave them in the body. So we first extract the ># from the header section and then repeat the parse showing only the ># tidied html body >styles = '\n'.join(re.findall('', > str(tidy.parseString(html, **options)), > re.S)) > >options['show_body_only'] = 1 >if styles: > new_html = styles + '\n' + str(tidy.parseString(html, **options)) >else: > new_html = str(tidy.parseString(html, **options)) > > >cry 写道: >> Hong Yuan,您好! >> >> uTidyLib怎么用的呢?WINDOWS/LINUX下都可以吗?输出还是HTML?没有转成XML吧? >> >> 谢谢。 >> >> 在 2006-10-09 13:01:00 您写道: >> >>> mxTidy好像很久没有人维护了。现在我使用uTidyLib。 >>> >>> cry 写道: >>> >>>> python,您好! >>>> >>>> 有人用过mxTidy吗?怎么使用呢? >>>> >>>> 谢谢 >>>> >>>> 致 >>>> 礼! >>>> >>>> cry >>>> zyqmail在tom.com >>>> >>>> >>>> _______________________________________________ >>>> python-chinese >>>> Post: send python-chinese在lists.python.cn >>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn >>>> Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn >>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese >>>> >>> -- >>> >>> 大管家网上建材超市 >>> 装修买建材 上网找大管家 >>> http://www.homemaster.cn >>> Tel: 0086-21-34240987 >>> Fax: 0086-21-64692422 >>> >>> _______________________________________________ >>> python-chinese >>> Post: send python-chinese在lists.python.cn >>> Subscribe: send subscribe to python-chinese-request在lists.python.cn >>> Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn >>> Detail Info: http://python.cn/mailman/listinfo/python-chinese >>> >> >> 致 >> 礼! >> >> cry >> zyqmail在tom.com >> >> >> _______________________________________________ >> python-chinese >> Post: send python-chinese在lists.python.cn >> Subscribe: send subscribe to python-chinese-request在lists.python.cn >> Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn >> Detail Info: http://python.cn/mailman/listinfo/python-chinese > > >-- > >大管家网上建材超市 >装修买建材 上网找大管家 >http://www.homemaster.cn >Tel: 0086-21-34240987 >Fax: 0086-21-64692422 > >_______________________________________________ >python-chinese >Post: send python-chinese在lists.python.cn >Subscribe: send subscribe to python-chinese-request在lists.python.cn >Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn >Detail Info: http://python.cn/mailman/listinfo/python-chinese 致 礼! cry zyqmail在tom.com
2006年10月12日 星期四 12:17
Debian下可以使用 wajig install python-utidylib 自动安装所需的包(包括libtidy-0.99-0,python-ctypes和tidy)。 cry 写道: > Hong Yuan,您好! > > 谢谢。我大概看了一下,好象没有LINUX的,只有源码,估计在LINUX下要自己封装TIDYLIB。 > 我先研究研究 > > 在 2006-10-11 11:36:00 您写道: > >> 我是在Windows下使用的,Linux下应该也没有问题。是否能够生成xml倒是不太清 >> 楚,我是用来生成html的。下面是使用要点和 sample代码。 >> >> uTidyLib(http://utidylib.berlios.de/) 提供了对从python中调用tidylib的途径。 >> >> 从python程序中调用该库有以下一些注意事项: >> >> * utidylib依赖于ctypes包。其主页上提供的binary版本比较旧,其自带的 >> prv_ctypes无法在python2.4下正常运行,必须安装最新的ctypes包; >> * tidy.parseString只能接受str对象。从wxPython控件中返回的文本多为 >> unicode对象,需要先使用encode ('utf8')转换为string对象; >> * item_description中的内容并不是完整的html代码,只是中的一个片 >> 断。默认情况下tidylib 将自动补上html文档头,这时需要设置show-body- >> only选项为1,使其只输出部分的内容; >> * >> 规定,将< body>中所有的>> 在格式化后的< body>中,还需要使用regular expression从将这些 >> 代码提取出来,和拼在一起。 >> >> 实现上述功能的代码片断如下: >> >> options = {'wrap': 0, >> 'show_body_only': 0, >> 'indent': 'auto', >> 'char_encoding': 'utf8'} >> # tidy only accepts string objects as input >> html = some_html_string_in_unicode.encode('utf8') >> >> # A small trick: >> # tidy will move all >> # want to leave them in the body. So we first extract the >> # from the header section and then repeat the parse showing only the >> # tidied html body >> styles = '\n'.join(re.findall('', >> str(tidy.parseString(html, **options)), >> re.S)) >> >> options['show_body_only'] = 1 >> if styles: >> new_html = styles + '\n' + str(tidy.parseString(html, **options)) >> else: >> new_html = str(tidy.parseString(html, **options)) >> >> >> cry 写道: >> >>> Hong Yuan,您好! >>> >>> uTidyLib怎么用的呢?WINDOWS/LINUX下都可以吗?输出还是HTML?没有转成XML吧? >>> >>> 谢谢。 >>> >>> 在 2006-10-09 13:01:00 您写道: >>> >>> >>>> mxTidy好像很久没有人维护了。现在我使用uTidyLib。 >>>> >>>> cry 写道: >>>> >>>> >>>>> python,您好! >>>>> >>>>> 有人用过mxTidy吗?怎么使用呢? >>>>> >>>>> 谢谢 >>>>> >>>>> 致 >>>>> 礼! >>>>> >>>>> cry >>>>> zyqmail在tom.com >>>>> >>>>> >>>>> _______________________________________________ >>>>> python-chinese >>>>> Post: send python-chinese在lists.python.cn >>>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn >>>>> Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn >>>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese >>>>> >>>>> >>>> -- >>>> >>>> 大管家网上建材超市 >>>> 装修买建材 上网找大管家 >>>> http://www.homemaster.cn >>>> Tel: 0086-21-34240987 >>>> Fax: 0086-21-64692422 >>>> >>>> _______________________________________________ >>>> python-chinese >>>> Post: send python-chinese在lists.python.cn >>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn >>>> Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn >>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese >>>> >>>> >>> 致 >>> 礼! >>> >>> cry >>> zyqmail在tom.com >>> >>> >>> _______________________________________________ >>> python-chinese >>> Post: send python-chinese在lists.python.cn >>> Subscribe: send subscribe to python-chinese-request在lists.python.cn >>> Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn >>> Detail Info: http://python.cn/mailman/listinfo/python-chinese >>> > > -- 大管家网上建材超市 装修买建材 上网找大管家 http://www.homemaster.cn Tel: 0086-21-34240987 Fax: 0086-21-64692422
Zeuux © 2025
京ICP备05028076号