Python论坛  - 讨论区

标题:[python-chinese] 请推荐能很好处理中文的xml库

2006年11月08日 星期三 18:53

Brightman fenyon在126.com
星期三 十一月 8 18:53:54 HKT 2006

лл£¡
minidomÖ»ÄÜÖ§³ÖUTF-8
elementTreeÄÜÖ§³ÖÖÐÎÄô£¿ËÑË÷ÁËÒ»ÏÂûÕÒµ½È·ÇеĴð°¸




Brightman
2006-11-08
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20061108/34a6e855/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 01:30

Xupeng Yun recordus在gmail.com
星期四 十一月 9 01:30:49 HKT 2006

在06-11-8,Brightman <fenyon at 126.com> 写道:
>
>  谢谢!
> minidom只能支持UTF-8
> elementTree能支持中文么?搜索了一下没找到确切的答案
>

把xml专程UTF-8编码的吧,方便些
-- 
I like Python & Linux.
Blog: http://recordus.cublog.cn
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/f12723c3/attachment-0001.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 16:17

fdcn fdcn64在gmail.com
星期四 十一月 9 16:17:14 HKT 2006

建议就用utf-8,
gb2312,gbk,gb13080,big5之类的编码麻烦多。

On 11/8/06, Brightman <fenyon在126.com> wrote:
>
>  谢谢!
> minidom只能支持UTF-8
> elementTree能支持中文么?搜索了一下没找到确切的答案
>
>  ------------------------------
>  Brightman
> 2006-11-08
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/25ed967a/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 18:05

Brightman fenyon在126.com
星期四 十一月 9 18:05:13 HKT 2006

Îļþת»»³ÉUTF-8ÁË£¬µ«ÊÇxmlÖÐÓУ¬ËùÒÔminidom»¹ÊDz»ÄÜ´¦Àí¡£°ÑGB2312Ì滻ΪUTF-8£¬Ì«Î¯ËöÁË£¬¿ÉÄÜÖ»ÓÐÕâÑù£¿




Brightman
2006-11-09



·¢¼þÈË£º Xupeng Yun
·¢ËÍʱ¼ä£º 2006-11-09 01:31:00
ÊÕ¼þÈË£º python-chinese在lists.python.cn
³­ËÍ£º 
Ö÷Ì⣺ Re: [python-chinese]ÇëÍƼöÄܺܺô¦ÀíÖÐÎĵÄxml¿â

ÔÚ06-11-8£¬Brightman <fenyon在126.com> дµÀ£º
лл£¡
minidomÖ»ÄÜÖ§³ÖUTF-8
elementTreeÄÜÖ§³ÖÖÐÎÄô£¿ËÑË÷ÁËÒ»ÏÂûÕÒµ½È·ÇеĴð°¸

°Ñxmlר³ÌUTF-8±àÂëµÄ°É£¬·½±ãЩ
-- 
I like Python & Linux.
Blog: http://recordus.cublog.cn 
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/0d729db9/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 18:07

Xupeng Yun recordus在gmail.com
星期四 十一月 9 18:07:35 HKT 2006

在06-11-9,Brightman <fenyon at 126.com> 写道:
>
>  文件转换成UTF-8了,但是xml中有> encoding="GB2312"?>,所以minidom还是不能处理。把GB2312替换为UTF-8,太委琐了,可能只有这样?
>

的确有点猥琐,不过也只好这样了,UTF-8处理才方便。

-- 
I like Python & Linux.
Blog: http://recordus.cublog.cn
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/c9543246/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 18:13

Bruce Wang number5在gmail.com
星期四 十一月 9 18:13:41 HKT 2006

On 11/9/06, Brightman <fenyon在126.com> wrote:
>
>  Îļþת»»³ÉUTF-8ÁË£¬µ«ÊÇxmlÖÐÓÐ> encoding="GB2312"?>£¬ËùÒÔminidom»¹ÊDz»ÄÜ´¦Àí¡£°ÑGB2312Ì滻ΪUTF-8£¬Ì«Î¯ËöÁË£¬¿ÉÄÜÖ»ÓÐÕâÑù£¿
>


xml±ê×¼ÀïÃæ, encoding Ö»Ö§³ÖUTF-8 ºÍ ISO-8859-1 Á½ÖÖ±àÂë, ÓÃÆäËû±àÂ붼ÊÇInvalidµÄ
·ûºÏ±ê×¼µÄxml parser¶¼»á³ö´í

-- 
simple is good
http://brucewang.net
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/d915f7f7/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 18:14

Linker Lin linkerlin88在gmail.com
星期四 十一月 9 18:14:13 HKT 2006

在程序的如口文件头部加上
import sys
reload(sys)
sys.setdefaultencoding('gbk')

这样也许就行了.

On 11/8/06, Brightman <fenyon在126.com> wrote:
>
>  谢谢!
> minidom只能支持UTF-8
> elementTree能支持中文么?搜索了一下没找到确切的答案
>
>  ------------------------------
>  Brightman
> 2006-11-08
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



-- 
Linker M Lin
linkerlin88在gmail.com
  ※※※※※※※※※
  ※※我思故我在※※
  ※※※※※※※※※
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/f084ca4b/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 18:14

Davies Liu davies.liu在gmail.com
星期四 十一月 9 18:14:32 HKT 2006

On 11/9/06, Brightman <fenyon在126.com> wrote:
>
>  Îļþת»»³ÉUTF-8ÁË£¬µ«ÊÇxmlÖÐÓÐ> encoding="GB2312"?>£¬ËùÒÔminidom»¹ÊDz»ÄÜ´¦Àí¡£°ÑGB2312Ì滻ΪUTF-8£¬Ì«Î¯ËöÁË£¬¿ÉÄÜÖ»ÓÐÕâÑù£¿
>

ÎļþÖеÄencodingµ±È»µÃ¸úʵ¼ÊµÄ±àÂëÆ¥ÅäÀ²~

------------------------------
>  Brightman
> 2006-11-09
>  ------------------------------
>  *·¢¼þÈË£º* Xupeng Yun
> *·¢ËÍʱ¼ä£º* 2006-11-09 01:31:00
> *ÊÕ¼þÈË£º* python-chinese在lists.python.cn
> *³­ËÍ£º*
> *Ö÷Ì⣺* Re: [python-chinese]ÇëÍƼöÄܺܺô¦ÀíÖÐÎĵÄxml¿â
>
> ÔÚ06-11-8£¬Brightman <fenyon在126.com> дµÀ£º
> >
> >  лл£¡
> > minidomÖ»ÄÜÖ§³ÖUTF-8
> > elementTreeÄÜÖ§³ÖÖÐÎÄô£¿ËÑË÷ÁËÒ»ÏÂûÕÒµ½È·ÇеĴð°¸
> >
>
> °Ñxmlר³ÌUTF-8±àÂëµÄ°É£¬·½±ãЩ
> --
> I like Python & Linux.
> Blog: http://recordus.cublog.cn
>
>
>
-- 
Davies Liu
My Blog: http://blog.daviesliu.net/
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/0cbaf610/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 21:05

fdu.xiaojf在gmail.com fdu.xiaojf在gmail.com
星期四 十一月 9 21:05:09 HKT 2006

Brightman wrote:
> 文件转换成UTF-8了,但是xml中有 > "GB2312"?>,所以minidom还是不能处理。把GB2312替换为UTF-8,太委琐了,可
> 能只有这样?
> ------------------------------------------------------------------------
> Brightman
> 2006-11-09
> ------------------------------------------------------------------------
> *发件人:* Xupeng Yun
> *发送时间:* 2006-11-09 01:31:00
> *收件人:* python-chinese在lists.python.cn
> *抄送:*
> *主题:* Re: [python-chinese]请推荐能很好处理中文的xml库
> 在06-11-8,*Brightman* <fenyon在126.com fenyon在126.com>> 写道:
>
>     谢谢!
>     minidom只能支持UTF-8
>     elementTree能支持中文么?搜索了一下没找到确切的答案
>
>
> 把xml专程UTF-8编码的吧,方便些
> -- 
我处理过一次中文xml,文件里面虽然声明是gb2312,但是其实编码是gbk的,所以我
是先把文件读进来,然后字符串替换把"gb2312"换成 "gbk"(比较笨),然后再用
elementtree处理的.

elementtree处理xml还是很方便的,感觉比minidom好用的多.

xiaojf


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月09日 星期四 23:58

Xupeng Yun recordus在gmail.com
星期四 十一月 9 23:58:38 HKT 2006

我处理过chinaunix博客的RSS,它就是gb2312编码,当时使用minidom来处理就是把它转换为UTF-8编码,再把"GB2312"替换成"UTF-8",郁闷了好一会儿,这么做的确有些猥琐。

-- 
I like Python & Linux.
Blog: http://recordus.cublog.cn
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20061109/2f7c1ff2/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月10日 星期五 13:54

sun baole sun_able在kinca.cn
星期五 十一月 10 13:54:45 HKT 2006

GBK编码是兼容GB2312的。

fdu.xiaojf at gmail.com wrote:
> Brightman wrote:
>   
>> 文件转换成UTF-8了,但是xml中有 >> "GB2312"?>,所以minidom还是不能处理。把GB2312替换为UTF-8,太委琐了,可
>> 能只有这样?
>> ------------------------------------------------------------------------
>> Brightman
>> 2006-11-09
>> ------------------------------------------------------------------------
>> *发件人:* Xupeng Yun
>> *发送时间:* 2006-11-09 01:31:00
>> *收件人:* python-chinese at lists.python.cn
>> *抄送:*
>> *主题:* Re: [python-chinese]请推荐能很好处理中文的xml库
>> 在06-11-8,*Brightman* <fenyon at 126.com fenyon at 126.com>> 写道:
>>
>>     谢谢!
>>     minidom只能支持UTF-8
>>     elementTree能支持中文么?搜索了一下没找到确切的答案
>>
>>
>> 把xml专程UTF-8编码的吧,方便些
>> -- 
>>     
> 我处理过一次中文xml,文件里面虽然声明是gb2312,但是其实编码是gbk的,所以我
> 是先把文件读进来,然后字符串替换把"gb2312"换成 "gbk"(比较笨),然后再用
> elementtree处理的.
>
> elementtree处理xml还是很方便的,感觉比minidom好用的多.
>
> xiaojf
>
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号