2005年02月17日 星期四 21:23
真正的汉字在处理时都是使用某种编码,如: '\xd6\xd0\xce\xc4\xb2\xe2\xca\xd4' 或使用unicode。我们看到的是汉字编码对应的字型,并不是真正的汉字编码。只要知道目标系统支持何种编码,再知道当前要处理的汉字是什么编码,根据需要进行转换即可。光看字型你根本就无法知识它到底是gb2312编码呢?还是utf-8编码呢?还是unicode编码呢? On Thu, 17 Feb 2005 21:16:45 +0800, jian wang <wangjian5748 at 163.com> wrote: > Hong Yuan,您好! > > 这是pythonWin解释器的编码的问题(不是python的编码问题),我觉得也没必要怎么去搞的怎么深入, > 在解释器中直接用print就可以得到,使用示例: > >>> print "中文测试" > 中文测试 > >>> str = "中文测试" > >>> str > '\xd6\xd0\xce\xc4\xb2\xe2\xca\xd4' > >>> print '\xd6\xd0\xce\xc4\xb2\xe2\xca\xd4' > 中文测试 > >>> > > ======= 2005-02-17 16:27:23 您在来信中写道:======= > > >关键是要把字符串转换成正确的(终端支持的)编码输出。如果是中文Windows下的 > >命令行运行的,可以使用encode('mbcs'),如下面的小例子: > > > >#!/usr/bin/env python > ># -*- coding: utf-8 -*- > > > >print "中文测试".encode('mbcs') > > > > > >ldj wrote: > > > >>python-chinese at lists.python.cn,您好! > >> > >> 我安装了ActivePython进行学习,编写了小程序,读取文件,然后在终端输出。但中文都变成" > >>\xa9\xa6"之类的字符。请指教! > >> > >>致 > >>礼! > >> > >> > >>ldj > >>hnsxldj at 163.com > >>2005-02-17 > >> > >> > >>------------------------------------------------------------------------ > >> > >>_______________________________________________ > >>python-chinese list > >>python-chinese at lists.python.cn > >>http://python.cn/mailman/listinfo/python-chinese > >> > >> > > > >-- > >HONG Yuan > >Homemaster Trading Co., Ltd. > >No. 601, Bldg. 41, 288 Shuangyang Rd. (N) > >Shanghai 200433, P.R.C. > >Tel: +86 21 55056553 > >Fax: +86 21 55067325 > >E-mail: hongyuan at homemaster.cn > > > >_______________________________________________ > >python-chinese list > >python-chinese at lists.python.cn > >http://python.cn/mailman/listinfo/python-chinese > > > > = = = = = = = = = = = = = = = = = = = = > > 致 > 礼! > > > jian wang > wangjian5748 at 163.com > 2005-02-17 > > > _______________________________________________ > python-chinese list > python-chinese at lists.python.cn > http://python.cn/mailman/listinfo/python-chinese > > > -- I like python! My Blog: http://www.donews.net/limodou New Maillist: http://groups-beta.google.com/group/python-cn
2005年02月17日 星期四 22:44
有谁知道pyhton中的中文正则表达式怎么写,比如: >>> import re >>> re.match('我', '我') <_sre.SRE_Match object at 0x016D43A0> >>> re.match('\w', '我') >>> re.match('\w+', '我') 文档中说需要设置 LOCALE 和 UNICODE,不知到怎么设置? 致 礼! jian wang wangjian5748 at 163.com 2005-02-17
Zeuux © 2025
京ICP备05028076号