Python论坛  - 讨论区

标题:[python-chinese] mxtidy

2006年10月12日 星期四 11:37

cry zyqmail在tom.com
星期四 十月 12 11:37:10 HKT 2006

Hong Yuan,您好!

谢谢。我大概看了一下,好象没有LINUX的,只有源码,估计在LINUX下要自己封装TIDYLIB。
我先研究研究

在 2006-10-11 11:36:00 您写道:
>我是在Windows下使用的,Linux下应该也没有问题。是否能够生成xml倒是不太清 
>楚,我是用来生成html的。下面是使用要点和 sample代码。
>
>uTidyLib(http://utidylib.berlios.de/) 提供了对从python中调用tidylib的途径。
>
>从python程序中调用该库有以下一些注意事项:
>
>    * utidylib依赖于ctypes包。其主页上提供的binary版本比较旧,其自带的
>      prv_ctypes无法在python2.4下正常运行,必须安装最新的ctypes包;
>    * tidy.parseString只能接受str对象。从wxPython控件中返回的文本多为
>      unicode对象,需要先使用encode ('utf8')转换为string对象;
>    * item_description中的内容并不是完整的html代码,只是中的一个片
>      断。默认情况下tidylib 将自动补上html文档头,这时需要设置show-body-
>      only选项为1,使其只输出部分的内容;
>    * >      规定,将< body>中所有的>      在格式化后的< body>中,还需要使用regular expression从将这些
>      代码提取出来,和拼在一起。
>
>实现上述功能的代码片断如下:
>
>options = {'wrap': 0,
>           'show_body_only': 0,
>           'indent': 'auto',
>           'char_encoding': 'utf8'}
># tidy only accepts string objects as input
>html = some_html_string_in_unicode.encode('utf8')
>
># A small trick:
># tidy will move all ># want to leave them in the body. So we first extract the ># from the header section and then repeat the parse showing only the
># tidied html body
>styles = '\n'.join(re.findall('',
>                              str(tidy.parseString(html, **options)),
>                              re.S))
>
>options['show_body_only'] = 1
>if styles:
>    new_html = styles + '\n' + str(tidy.parseString(html, **options))
>else:
>    new_html = str(tidy.parseString(html, **options))
>
>
>cry 写道:
>> Hong Yuan,您好!
>>
>> uTidyLib怎么用的呢?WINDOWS/LINUX下都可以吗?输出还是HTML?没有转成XML吧?
>>
>> 谢谢。
>>
>> 在 2006-10-09 13:01:00 您写道:
>>   
>>> mxTidy好像很久没有人维护了。现在我使用uTidyLib。
>>>
>>> cry 写道:
>>>     
>>>> python,您好!
>>>>
>>>> 有人用过mxTidy吗?怎么使用呢?
>>>>
>>>> 谢谢
>>>>
>>>>>>>> 礼!
>>>>
>>>>             cry
>>>>             zyqmail在tom.com
>>>>
>>>>
>>>> _______________________________________________
>>>> python-chinese
>>>> Post: send python-chinese在lists.python.cn
>>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn
>>>> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
>>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>>>>       
>>> -- 
>>>
>>> 大管家网上建材超市
>>> 装修买建材 上网找大管家
>>> http://www.homemaster.cn
>>> Tel: 0086-21-34240987
>>> Fax: 0086-21-64692422
>>>
>>> _______________________________________________
>>> python-chinese
>>> Post: send python-chinese在lists.python.cn
>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn
>>> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>>>     
>>
>>>> 礼!
>>
>>             cry
>>             zyqmail在tom.com
>>
>>
>> _______________________________________________
>> python-chinese
>> Post: send python-chinese在lists.python.cn
>> Subscribe: send subscribe to python-chinese-request在lists.python.cn
>> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
>> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
>-- 
>
>大管家网上建材超市
>装修买建材 上网找大管家
>http://www.homemaster.cn
>Tel: 0086-21-34240987
>Fax: 0086-21-64692422
>
>_______________________________________________
>python-chinese
>Post: send python-chinese在lists.python.cn
>Subscribe: send subscribe to python-chinese-request在lists.python.cn
>Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
>Detail Info: http://python.cn/mailman/listinfo/python-chinese

                    致
礼!

            cry
            zyqmail在tom.com



[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年10月12日 星期四 12:17

Hong Yuan hongyuan在homemaster.cn
星期四 十月 12 12:17:03 HKT 2006

Debian下可以使用

wajig install python-utidylib

自动安装所需的包(包括libtidy-0.99-0,python-ctypes和tidy)。

cry 写道:
> Hong Yuan,您好!
>
> 谢谢。我大概看了一下,好象没有LINUX的,只有源码,估计在LINUX下要自己封装TIDYLIB。
> 我先研究研究
>
> 在 2006-10-11 11:36:00 您写道:
>   
>> 我是在Windows下使用的,Linux下应该也没有问题。是否能够生成xml倒是不太清 
>> 楚,我是用来生成html的。下面是使用要点和 sample代码。
>>
>> uTidyLib(http://utidylib.berlios.de/) 提供了对从python中调用tidylib的途径。
>>
>> 从python程序中调用该库有以下一些注意事项:
>>
>>    * utidylib依赖于ctypes包。其主页上提供的binary版本比较旧,其自带的
>>      prv_ctypes无法在python2.4下正常运行,必须安装最新的ctypes包;
>>    * tidy.parseString只能接受str对象。从wxPython控件中返回的文本多为
>>      unicode对象,需要先使用encode ('utf8')转换为string对象;
>>    * item_description中的内容并不是完整的html代码,只是中的一个片
>>      断。默认情况下tidylib 将自动补上html文档头,这时需要设置show-body-
>>      only选项为1,使其只输出部分的内容;
>>    * >>      规定,将< body>中所有的>>      在格式化后的< body>中,还需要使用regular expression从将这些
>>      代码提取出来,和拼在一起。
>>
>> 实现上述功能的代码片断如下:
>>
>> options = {'wrap': 0,
>>           'show_body_only': 0,
>>           'indent': 'auto',
>>           'char_encoding': 'utf8'}
>> # tidy only accepts string objects as input
>> html = some_html_string_in_unicode.encode('utf8')
>>
>> # A small trick:
>> # tidy will move all >> # want to leave them in the body. So we first extract the >> # from the header section and then repeat the parse showing only the
>> # tidied html body
>> styles = '\n'.join(re.findall('',
>>                              str(tidy.parseString(html, **options)),
>>                              re.S))
>>
>> options['show_body_only'] = 1
>> if styles:
>>    new_html = styles + '\n' + str(tidy.parseString(html, **options))
>> else:
>>    new_html = str(tidy.parseString(html, **options))
>>
>>
>> cry 写道:
>>     
>>> Hong Yuan,您好!
>>>
>>> uTidyLib怎么用的呢?WINDOWS/LINUX下都可以吗?输出还是HTML?没有转成XML吧?
>>>
>>> 谢谢。
>>>
>>> 在 2006-10-09 13:01:00 您写道:
>>>   
>>>       
>>>> mxTidy好像很久没有人维护了。现在我使用uTidyLib。
>>>>
>>>> cry 写道:
>>>>     
>>>>         
>>>>> python,您好!
>>>>>
>>>>> 有人用过mxTidy吗?怎么使用呢?
>>>>>
>>>>> 谢谢
>>>>>
>>>>>>>>>> 礼!
>>>>>
>>>>>             cry
>>>>>             zyqmail在tom.com
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> python-chinese
>>>>> Post: send python-chinese在lists.python.cn
>>>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn
>>>>> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
>>>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>>>>>       
>>>>>           
>>>> -- 
>>>>
>>>> 大管家网上建材超市
>>>> 装修买建材 上网找大管家
>>>> http://www.homemaster.cn
>>>> Tel: 0086-21-34240987
>>>> Fax: 0086-21-64692422
>>>>
>>>> _______________________________________________
>>>> python-chinese
>>>> Post: send python-chinese在lists.python.cn
>>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn
>>>> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
>>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>>>>     
>>>>         
>>>>>> 礼!
>>>
>>>             cry
>>>             zyqmail在tom.com
>>>
>>>
>>> _______________________________________________
>>> python-chinese
>>> Post: send python-chinese在lists.python.cn
>>> Subscribe: send subscribe to python-chinese-request在lists.python.cn
>>> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
>>> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>>>       
>  
>   
-- 

大管家网上建材超市
装修买建材 上网找大管家
http://www.homemaster.cn
Tel: 0086-21-34240987
Fax: 0086-21-64692422


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号