Python论坛  - 讨论区

标题:[python-chinese] unicode是两个字符的,还是变长的(双字节的倍数)?

2007年04月10日 星期二 11:48

黄毅 yi.codeplayer在gmail.com
星期二 四月 10 11:48:42 HKT 2007

On 4/10/07, 麦田守望者 <qcxhome at gmail.com> wrote:
>
> On 4/9/07, 黄毅 <yi.codeplayer at gmail.com> wrote:
> > python 的 unicode 对象和 python 的 string 也完全不同,它不以某种特定的编码保存字符串,所以 unicode
> 对象也不能像string 那样当作字节流来用
>
> 什么是unicode对象?我个人认为,没有必要把unicode对象和字符串分开来对象。
> 字符串是一个抽象的概念。对于不同的需求,在字符串中,一个字符可以是一个字节,也可一个unicode字符。它们都是字符串。
>
>
> 在unicode出现之后,字符和字符串的概念有了双重含义。一个字节不一定是一个字符,反之亦然。字符应该理解为真实世界中的一个文字,比如英文的"P"和中文的"中"。
>
>
> 在网络中传输字符串的时候,操作系统只认识字节,并不知道它们代表的含义。所以需要把字符串编码(encode)成字节序列在进行传输,接收方必须再解码(decode)才能把"无意义"一堆字节还原成人可以看得懂的一堆字符,即一段文字。
>
> --
> GoogleTalk: qcxhome at gmail.com
> MSN: qcxhome at hotmail.com
> My Space: tkdchen.spaces.live.com
> BOINC: boinc.berkeley.edu
> 中国分布式计算总站: www.equn.com


python3000 中就可以不用区分 unicode 对象和字符串了,到时候的字符串就是现在的 unicode 对象,到时候的
*bytes *类型等于是现在的
str 类型。

-- 
http://codeplayer.blogspot.com/
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20070410/ee6d1b96/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月10日 星期二 12:07

jessinio smith jessinio在gmail.com
星期二 四月 10 12:07:17 HKT 2007

´Óhttp://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx¿´µ½£º

ºÜ¶àÈË»¹´æÔÚÕâÑùµÄÎó½â£º Unicode ½ö½öÊÇ 16 λµÄÕâô¼òµ¥£¬Ã¿¸ö×Ö·ûÕ¼ 16 룬ËùÒÔÒ»¹²ÓÐ 65536 ¸ö¿ÉÄܵÄ×Ö·û¡£
È»¶ø£¬ÕâÊÇ´íÎóµÄ¡£²»¹ý²»Òª½ô£¬ÒòΪÕâÊǴ󲿷ÖÈ˶¼»á·¸µÄÒ»¸öÆÕ±éµÄ´íÎó¡£

ʵ¼ÊÉÏ£¬Unicode Àí½â×Ö·ûµÄ·½Ê½ÊǽØÈ»²»Í¬µÄ£¬¶øÕâÊÇÎÒÃDZØÐëÁ˽âµÄ¡£
µ½Ä¿Ç°ÎªÖ¹£¬ÎÒÃǶ¼Ôø¾­ÈÏΪ£ºÒ»¸ö×Ö·û¶ÔÓ¦µ½Ò»Ð©ÔÚ´ÅÅÌÉÏ»òÄÚ´æÖд¢´æµÄ루bits£©. È磺 A -> 0100 0001

¶øÔÚ Unicode ÖУ¬ Ò»¸ö×Ö·ûʵ¼ÊÉ϶ÔÓ¦Ò»ÖÖ½Ð×ö code point µÄ¶«Î÷¡£

ÿһ¸ö×Öĸ±íÖеÄÿһ¸ö³éÏóµÄ×Öĸ£¬¶¼±»¸³ÓèÁËÒ»¸öÊý×Ö£¬±ÈÈç U+0645. Õâ¸ö½Ð×ö code point.

On 4/10/07, Neil(ľҰºü) <chenrong2003在gmail.com> wrote:
>
> ºÜ¾Ã֮ǰÎÒ·­ÒëµÄÒ»¸ö£º
> http://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx
>
> ÔÚ 07-4-10£¬jessinio smith<jessinio在gmail.com> дµÀ£º
> > ÕâЩÎÒ¶¼ÖªµÀ¡£
> >
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese




-- 
×¢ÒâÉíÌ壬ÉíÌåÊǸïÃüµÄ±¾Ç®£¡£¡
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070410/7482c7a9/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月10日 星期二 12:29

Mingzhe Huang archerzz在gmail.com
星期二 四月 10 12:29:18 HKT 2007

如何把code point表示出来,就是encoding和decoding的问题了,所以就会有UTF-8, UTF-16和UTF-32。

On 4/10/07, jessinio smith <jessinio在gmail.com> wrote:
>
>http://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx看到:
>
> 很多人还存在这样的误解: Unicode 仅仅是 16 位的这么简单,每个字符占 16 位,所以一共有 65536 个可能的字符。
> 然而,这是错误的。不过不要紧,因为这是大部分人都会犯的一个普遍的错误。
>
> 实际上,Unicode 理解字符的方式是截然不同的,而这是我们必须了解的。
> 到目前为止,我们都曾经认为:一个字符对应到一些在磁盘上或内存中储存的位(bits). 如: A -> 0100 0001
>
> 而在 Unicode 中, 一个字符实际上对应一种叫做 code point 的东西。
>
> 每一个字母表中的每一个抽象的字母,都被赋予了一个数字,比如 U+0645. 这个叫做 code point.
>
> On 4/10/07, Neil(木野狐) <chenrong2003在gmail.com> wrote:
> >
> > 很久之前我翻译的一个:
> > http://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx
> >
> > 在 07-4-10,jessinio smith<jessinio在gmail.com > 写道:
> > > 这些我都知道。
> > >
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> >
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
>
>
> --
> 注意身体,身体是革命的本钱!!
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



-- 
Best Regards,

Archer

Ming Zhe Huang
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20070410/86cf6f03/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月10日 星期二 15:12

mvfirst mvfirst在126.com
星期二 四月 10 15:12:27 HKT 2007

c02e在mail.gmail.com> <7a051ed70704092107r3f6fbb7cq3f2a401dcc753f1a在mail.gmail.com>
Subject: =?gb2312?B?x/PW+qO6yKu+1rHkwb/Oyszi?=
Message-ID: <200704101512269538351在126.com>
X-mailer: Foxmail 6, 4, 104, 20 [cn]
Mime-Version: 1.0
Content-Type: multipart/alternative;
	boundary="=====003_Dragon333732337222_====="
X-Coremail-Antispam: 1U3Yxn0WfASr-VFAUDIcSsGvfJ-N4xvF2IEb7IF0Fy264kE64
	k0F24l7I0Y64k_M4xvF2IEb7IF0Fy26I8I3I1lx4CEj282c2IF4VAI2VCY07xJMxCjnVAq
	n7xvrwAv7VC2z280aVAFwI0_Jr0_Gr1lc2xSY4AK67AK6r4xM7AC8VAFwI0_Jr0_Gr1lYx
	0E2Ix0cI8IcVAFwI0_JrI_Jrylb4IE77IF4wAFIxvE14AKwVWUJVWUGwAqx4xG6xAIxVCF
	xsxG0wAYjsxI4VWUJjkaLaAFLSUrUUUUjjvjm3AaLaJ3UjIFyTuYvj4RKjg4DUUUUUAaLa
	Jafrg_Aw18uF1xJF1xtw1DCF1xuw45p5X_GF1xWoW0grW2gr4IgFy8J3Z5KrW5u3y2yasr
	XFyxtr1qga9FyF9xJrn5X34UJa92qFyUGFyxW3yj9ws5Kr45tr1DArW8=


This is a multi-part message in MIME format.

--=====003_Dragon333732337222_=====
Content-Type: text/plain;
	charset="gb2312"
Content-Transfer-Encoding: base64

1f3OxKO6DQogIM7S1NphLnB5tqjS5cHL0ru49sirvtax5MG/Z1VzZXIsZ1VzZXLU2mHW0LG7uLPW
taGjDQogINTaYi5wedbQo7oNCiAgZnJvbSBhIGltcG9ydCBnVXNlcg0KICC0y8qxo6xnVXNlctPQ
yrG1yNPa1Nph1tC4s7XE1rWjrNPQyrHOqr/VoaMNCg0KICDO0rXExL+1xMrH1Nq24Lj2cHnW0Lmy
z+3Su7j2yKu+1rHkwb+how0KICDO0tLR19DPuNTEtsHHsLy4zOy52NPatMvOyszitcTM1sLbo6yy
os60veK+9s7KzOKhow0KDQogINC70Luhow0KICANCg0KDQoNCg0KbXZmaXJzdA0KMjAwNy0wNC0x
MA0KDQoNCg0Kt6K8/sjLo7ogamVzc2luaW8gc21pdGgNCreiy83Ksbzko7ogMjAwNy0wNC0xMCAx
MjowNzoyOQ0KytW8/sjLo7ogcHl0aG9uLWNoaW5lc2VAbGlzdHMucHl0aG9uLmNuDQqzrcvNo7og
DQrW98zio7ogUmU6IFtweXRob24tY2hpbmVzZV11bmljb2RlysfBvbj219a3+7XEo6y7ucrHseSz
pLXEo6jLq9fWvdq1xLG2yv2jqaO/DQoNCrTTaHR0cDovL2Jsb2cuY3Nkbi5uZXQvaW5lbG0vYXJj
aGl2ZS8yMDA0LzExLzI5LzE5NzQ2Ni5hc3B4v7S1vaO6DQoNCrrctuDIy7u5tObU2tXi0fm1xM7z
veKjuiBVbmljb2RlIL32vfbKxyAxNiDOu7XE1eLDtLzytaWjrMO/uPbX1rf71bwgMTYgzrujrMv5
0tTSu7my09AgNjU1MzYguPa/ycTctcTX1rf7oaMNCsi7tvijrNXiyse07c7ztcSho7K7uf2yu9Kq
vfSjrNLyzqrV4srHtPOyv7fWyMu2vLvht7i1xNK7uPbG1bHptcS07c7zoaMgDQoNCsq1vMrJz6Os
VW5pY29kZSDA7b3i19a3+7XEt73KvcrHvdjIu7K7zay1xKOstvjV4srHztLDx7HY0OvBy73itcSh
ow0Ktb3Ev8ewzqrWuaOsztLDx7a81Pi+rcjPzqqjutK7uPbX1rf7ttTTprW90rvQqdTatMXFzMnP
u/LE2rTm1tC0orTmtcTOu6OoYml0c6OpLiDI56O6IEEgLT4gMDEwMCAwMDAxDQoNCrb41NogVW5p
Y29kZSDW0KOsINK7uPbX1rf7yrW8ysnPttTTptK71ta90Nf2IGNvZGUgcG9pbnQgtcS2q873oaMN
Cg0Kw7/Su7j219bEuLHt1tC1xMO/0ru49rPpz/O1xNfWxLijrLa8sbu4s9PowcvSu7j2yv3X1qOs
scjI5yBVKzA2NDUuINXiuPa90Nf2IGNvZGUgcG9pbnQuIA0KDQoNCk9uIDQvMTAvMDcsIE5laWwo
xL7SsLr8KSA8Y2hlbnJvbmcyMDAzQGdtYWlsLmNvbT4gd3JvdGU6DQq63L7D1q7HsM7St63S67XE
0ru49qO6DQpodHRwOi8vYmxvZy5jc2RuLm5ldC9pbmVsbS9hcmNoaXZlLzIwMDQvMTEvMjkvMTk3
NDY2LmFzcHgNCg0K1NogMDctNC0xMKOsamVzc2luaW8gc21pdGg8amVzc2luaW9AZ21haWwuY29t
ID4g0LS1wKO6DQo+INXi0KnO0ra81qq1wKGjDQo+DQpfX19fX19fX19fX19fX19fX19fX19fX19f
X19fX19fX19fX19fX19fX19fX19fXw0KcHl0aG9uLWNoaW5lc2UNClBvc3Q6IHNlbmQgcHl0aG9u
LWNoaW5lc2VAbGlzdHMucHl0aG9uLmNuDQpTdWJzY3JpYmU6IHNlbmQgc3Vic2NyaWJlIHRvIHB5
dGhvbi1jaGluZXNlLXJlcXVlc3RAbGlzdHMucHl0aG9uLmNuDQpVbnN1YnNjcmliZTogc2VuZCB1
bnN1YnNjcmliZSB0byAgcHl0aG9uLWNoaW5lc2UtcmVxdWVzdEBsaXN0cy5weXRob24uY24gDQpE
ZXRhaWwgSW5mbzogaHR0cDovL3B5dGhvbi5jbi9tYWlsbWFuL2xpc3RpbmZvL3B5dGhvbi1jaGlu
ZXNlDQoNCg0KDQotLSANCtei0uLJ7czlo6zJ7czlyse478P8tcSxvseuo6GjoSANCg==

--=====003_Dragon333732337222_=====
Content-Type: text/html;
	charset="gb2312"
Content-Transfer-Encoding: base64

PCFET0NUWVBFIEhUTUwgUFVCTElDICItLy9XM0MvL0RURCBIVE1MIDQuMCBUcmFuc2l0aW9uYWwv
L0VOIj4NCjxIVE1MPjxIRUFEPg0KPE1FVEEgaHR0cC1lcXVpdj1Db250ZW50LVR5cGUgY29udGVu
dD0idGV4dC9odG1sOyBjaGFyc2V0PWdiMjMxMiI+DQo8TUVUQSBjb250ZW50PSJNU0hUTUwgNi4w
MC42MDAwLjE2NDE0IiBuYW1lPUdFTkVSQVRPUj4NCjxTVFlMRT4NCjwhLS0NCiAvKiBGb250IERl
ZmluaXRpb25zICovDQogQGZvbnQtZmFjZQ0KCXtmb250LWZhbWlseTrLzszlOw0KCXBhbm9zZS0x
OjIgMSA2IDAgMyAxIDEgMSAxIDE7fQ0KQGZvbnQtZmFjZQ0KCXtmb250LWZhbWlseTpWZXJkYW5h
Ow0KCXBhbm9zZS0xOjIgMTEgNiA0IDMgNSA0IDQgMiA0O30NCkBmb250LWZhY2UNCgl7Zm9udC1m
YW1pbHk6IlxAy87M5SI7DQoJcGFub3NlLTE6MiAxIDYgMCAzIDEgMSAxIDEgMTt9DQogLyogU3R5
bGUgRGVmaW5pdGlvbnMgKi8NCiBwLk1zb05vcm1hbCwgbGkuTXNvTm9ybWFsLCBkaXYuTXNvTm9y
bWFsDQoJe21hcmdpbjowY207DQoJbWFyZ2luLWJvdHRvbTouMDAwMXB0Ow0KCXRleHQtYWxpZ246
anVzdGlmeTsNCgl0ZXh0LWp1c3RpZnk6aW50ZXItaWRlb2dyYXBoOw0KCWZvbnQtc2l6ZToxMC41
cHQ7DQoJZm9udC1mYW1pbHk6IlRpbWVzIE5ldyBSb21hbiI7fQ0KYTpsaW5rLCBzcGFuLk1zb0h5
cGVybGluaw0KCXtjb2xvcjpibHVlOw0KCXRleHQtZGVjb3JhdGlvbjp1bmRlcmxpbmU7fQ0KYTp2
aXNpdGVkLCBzcGFuLk1zb0h5cGVybGlua0ZvbGxvd2VkDQoJe2NvbG9yOnB1cnBsZTsNCgl0ZXh0
LWRlY29yYXRpb246dW5kZXJsaW5lO30NCnNwYW4uRW1haWxTdHlsZTE3DQoJe21zby1zdHlsZS10
eXBlOnBlcnNvbmFsLWNvbXBvc2U7DQoJZm9udC1mYW1pbHk6VmVyZGFuYTsNCgljb2xvcjp3aW5k
b3d0ZXh0Ow0KCWZvbnQtd2VpZ2h0Om5vcm1hbDsNCglmb250LXN0eWxlOm5vcm1hbDsNCgl0ZXh0
LWRlY29yYXRpb246bm9uZSBub25lO30NCiAvKiBQYWdlIERlZmluaXRpb25zICovDQogQHBhZ2Ug
U2VjdGlvbjENCgl7c2l6ZTo1OTUuM3B0IDg0MS45cHQ7DQoJbWFyZ2luOjcyLjBwdCA5MC4wcHQg
NzIuMHB0IDkwLjBwdDsNCglsYXlvdXQtZ3JpZDoxNS42cHQ7fQ0KZGl2LlNlY3Rpb24xDQoJe3Bh
Z2U6U2VjdGlvbjE7fQ0KLS0+DQo8L1NUWUxFPg0KPC9IRUFEPg0KPEJPRFk+DQo8RElWPjxGT05U
IGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj7V/c7Eo7o8L0ZPTlQ+PC9ESVY+DQo8
RElWPjxGT05UIGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj4mbmJzcDsgDQrO0tTa
YS5webao0uXBy9K7uPbIq77WseTBv2dVc2VyLGdVc2Vy1Nph1tCxu7iz1rWhozwvRk9OVD48L0RJ
Vj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPiZuYnNwOyDU
2mIucHnW0KO6PC9GT05UPjwvRElWPg0KPERJVj48Rk9OVCBmYWNlPVZlcmRhbmEgY29sb3I9IzAw
MDBmZiBzaXplPTI+Jm5ic3A7IGZyb20gYSBpbXBvcnQgDQpnVXNlcjwvRk9OVD48L0RJVj4NCjxE
SVY+PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPiZuYnNwOyANCrTLyrGj
rGdVc2Vy09DKsbXI09rU2mHW0LiztcTWtaOs09DKsc6qv9WhozwvRk9OVD48L0RJVj4NCjxESVY+
PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPjwvRk9OVD4mbmJzcDs8L0RJ
Vj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPiZuYnNwOyAN
Cs7StcTEv7XEysfU2rbguPZwedbQubLP7dK7uPbIq77WseTBv6GjPC9GT05UPjwvRElWPg0KPERJ
Vj48Rk9OVCBmYWNlPVZlcmRhbmEgY29sb3I9IzAwMDBmZiBzaXplPTI+Jm5ic3A7IA0KztLS0dfQ
z7jUxLbBx7C8uMzsudjT2rTLzsrM4rXEzNbC26OssqLOtL3ivvbOyszioaM8L0ZPTlQ+PC9ESVY+
DQo8RElWPjxGT05UIGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj48L0ZPTlQ+Jm5i
c3A7PC9ESVY+DQo8RElWPjxGT05UIGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj4m
bmJzcDsg0LvQu6GjPC9GT05UPjwvRElWPg0KPERJVj48Rk9OVCBmYWNlPVZlcmRhbmEgY29sb3I9
IzAwMDBmZiBzaXplPTI+Jm5ic3A7IDwvRk9OVD48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJk
YW5hIHNpemU9Mj48L0ZPTlQ+Jm5ic3A7PC9ESVY+DQo8RElWIGFsaWduPWxlZnQ+DQo8RElWIGFs
aWduPWxlZnQ+PEZPTlQgZmFjZT1WZXJkYW5hIHNpemU9Mj4NCjxIUiBzdHlsZT0iV0lEVEg6IDEy
MnB4OyBIRUlHSFQ6IDJweCIgU0laRT0yPg0KPC9GT05UPjwvRElWPg0KPERJVj48Rk9OVCBjb2xv
cj0jYzBjMGMwPjxGT05UIGZhY2U9VmVyZGFuYSBzaXplPTI+bXZmaXJzdDwvRk9OVD48L0RJVj4N
CjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIHNpemU9Mj4yMDA3LTA0LTEwPC9GT05UPjwvRk9OVD48
L0RJVj48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIHNpemU9Mj4NCjxIUj4NCjwvRk9O
VD48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hPjxGT05UIHNpemU9Mj48U1RST05HPrei
vP7Iy6O6PC9TVFJPTkc+IGplc3NpbmlvIA0Kc21pdGg8L0ZPTlQ+PC9GT05UPjwvRElWPg0KPERJ
Vj48Rk9OVCBmYWNlPVZlcmRhbmE+PEZPTlQgc2l6ZT0yPjxTVFJPTkc+t6LLzcqxvOSjujwvU1RS
T05HPiANCjIwMDctMDQtMTAmbmJzcDsxMjowNzoyOTwvRk9OVD48L0ZPTlQ+PC9ESVY+DQo8RElW
PjxGT05UIGZhY2U9VmVyZGFuYT48Rk9OVCBzaXplPTI+PFNUUk9ORz7K1bz+yMujujwvU1RST05H
PiANCnB5dGhvbi1jaGluZXNlQGxpc3RzLnB5dGhvbi5jbjwvRk9OVD48L0ZPTlQ+PC9ESVY+DQo8
RElWPjxGT05UIGZhY2U9VmVyZGFuYT48Rk9OVCBzaXplPTI+PFNUUk9ORz6zrcvNo7o8L1NUUk9O
Rz4gPC9GT05UPjwvRk9OVD48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hPjxGT05UIHNp
emU9Mj48U1RST05HPtb3zOKjujwvU1RST05HPiBSZTogDQpbcHl0aG9uLWNoaW5lc2VddW5pY29k
ZcrHwb249tfWt/u1xKOsu7nKx7Hks6S1xKOoy6vX1r3atcSxtsr9o6mjvzwvRk9OVD48L0ZPTlQ+
PC9ESVY+DQo8RElWPjxGT05UIGZhY2U9VmVyZGFuYSBzaXplPTI+PC9GT05UPiZuYnNwOzwvRElW
Pg0KPERJVj48Rk9OVCBmYWNlPVZlcmRhbmEgc2l6ZT0yPrTTPEEgDQpocmVmPSJodHRwOi8vYmxv
Zy5jc2RuLm5ldC9pbmVsbS9hcmNoaXZlLzIwMDQvMTEvMjkvMTk3NDY2LmFzcHgiPmh0dHA6Ly9i
bG9nLmNzZG4ubmV0L2luZWxtL2FyY2hpdmUvMjAwNC8xMS8yOS8xOTc0NjYuYXNweDwvQT6/tLW9
o7o8QlI+PEJSPrrctuDIy7u5tObU2tXi0fm1xM7zveKjuiANClVuaWNvZGUgvfa99srHIDE2IM67
tcTV4sO0vPK1paOsw7+49tfWt/vVvCAxNiDOu6Osy/nS1NK7ubLT0CA2NTUzNiANCrj2v8nE3LXE
19a3+6GjPEJSPsi7tvijrNXiyse07c7ztcSho7K7uf2yu9KqvfSjrNLyzqrV4srHtPOyv7fWyMu2
vLvht7i1xNK7uPbG1bHptcS07c7zoaMgPEJSPjxCUj7KtbzKyc+jrFVuaWNvZGUgDQrA7b3i19a3
+7XEt73KvcrHvdjIu7K7zay1xKOstvjV4srHztLDx7HY0OvBy73itcShozxCUj61vcS/x7DOqta5
o6zO0sPHtrzU+L6tyM/OqqO60ru49tfWt/u21NOmtb3Su9Cp1Nq0xcXMyc+78sTatObW0LSitOa1
xM67o6hiaXRzo6kuIMjno7ogQSANCi0mZ3Q7IDAxMDAgMDAwMTxCUj48QlI+tvjU2iBVbmljb2Rl
INbQo6wg0ru49tfWt/vKtbzKyc+21NOm0rvW1r3Q1/YgY29kZSBwb2ludCANCrXEtqvO96GjPEJS
PjxCUj7Dv9K7uPbX1sS4se3W0LXEw7/Su7j2s+nP87XE19bEuKOstryxu7iz0+jBy9K7uPbK/dfW
o6yxyMjnIFUrMDY0NS4g1eK49r3Q1/YgY29kZSBwb2ludC4gPEJSPjxCUj4NCjxESVY+PFNQQU4g
Y2xhc3M9Z21haWxfcXVvdGU+T24gNC8xMC8wNywgPEIgY2xhc3M9Z21haWxfc2VuZGVybmFtZT5O
ZWlsKMS+0rC6/Ck8L0I+IA0KJmx0OzxBIGhyZWY9Im1haWx0bzpjaGVucm9uZzIwMDNAZ21haWwu
Y29tIj5jaGVucm9uZzIwMDNAZ21haWwuY29tPC9BPiZndDsgDQp3cm90ZTo8L1NQQU4+DQo8QkxP
Q0tRVU9URSBjbGFzcz1nbWFpbF9xdW90ZSANCnN0eWxlPSJQQURESU5HLUxFRlQ6IDFleDsgTUFS
R0lOOiAwcHQgMHB0IDBwdCAwLjhleDsgQk9SREVSLUxFRlQ6IHJnYigyMDQsMjA0LDIwNCkgMXB4
IHNvbGlkIj663L7D1q7HsM7St63S67XE0ru49qO6PEJSPjxBIA0KICBocmVmPSJodHRwOi8vYmxv
Zy5jc2RuLm5ldC9pbmVsbS9hcmNoaXZlLzIwMDQvMTEvMjkvMTk3NDY2LmFzcHgiPmh0dHA6Ly9i
bG9nLmNzZG4ubmV0L2luZWxtL2FyY2hpdmUvMjAwNC8xMS8yOS8xOTc0NjYuYXNweDwvQT48QlI+
PEJSPtTaIA0KICAwNy00LTEwo6xqZXNzaW5pbyBzbWl0aCZsdDs8QSANCiAgaHJlZj0ibWFpbHRv
Omplc3NpbmlvQGdtYWlsLmNvbSI+amVzc2luaW9AZ21haWwuY29tIDwvQT4mZ3Q7INC0tcCjujxC
Uj4mZ3Q7IA0KICDV4tCpztK2vNaqtcChozxCUj4mZ3Q7PEJSPl9fX19fX19fX19fX19fX19fX19f
X19fX19fX19fX19fX19fX19fX19fX19fX19fPEJSPnB5dGhvbi1jaGluZXNlPEJSPlBvc3Q6IA0K
ICBzZW5kIDxBIA0KICBocmVmPSJtYWlsdG86cHl0aG9uLWNoaW5lc2VAbGlzdHMucHl0aG9uLmNu
Ij5weXRob24tY2hpbmVzZUBsaXN0cy5weXRob24uY248L0E+PEJSPlN1YnNjcmliZTogDQogIHNl
bmQgc3Vic2NyaWJlIHRvIDxBIA0KICBocmVmPSJtYWlsdG86cHl0aG9uLWNoaW5lc2UtcmVxdWVz
dEBsaXN0cy5weXRob24uY24iPnB5dGhvbi1jaGluZXNlLXJlcXVlc3RAbGlzdHMucHl0aG9uLmNu
PC9BPjxCUj5VbnN1YnNjcmliZTogDQogIHNlbmQgdW5zdWJzY3JpYmUgdG8mbmJzcDsmbmJzcDs8
QSANCiAgaHJlZj0ibWFpbHRvOnB5dGhvbi1jaGluZXNlLXJlcXVlc3RAbGlzdHMucHl0aG9uLmNu
Ij5weXRob24tY2hpbmVzZS1yZXF1ZXN0QGxpc3RzLnB5dGhvbi5jbiANCiAgPC9BPjxCUj5EZXRh
aWwgSW5mbzogPEEgDQogIGhyZWY9Imh0dHA6Ly9weXRob24uY24vbWFpbG1hbi9saXN0aW5mby9w
eXRob24tY2hpbmVzZSI+aHR0cDovL3B5dGhvbi5jbi9tYWlsbWFuL2xpc3RpbmZvL3B5dGhvbi1j
aGluZXNlPC9BPjwvQkxPQ0tRVU9URT48L0RJVj48QlI+PEJSIA0KY2xlYXI9YWxsPjxCUj4tLSA8
QlI+16LS4sntzOWjrMntzOXKx7jvw/y1xLG+x66joaOhIDwvRk9OVD48L0RJVj48L0JPRFk+PC9I
VE1MPg0K

--=====003_Dragon333732337222_=====--



[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月10日 星期二 15:28

Adieu adieu在adieu.cn
星期二 四月 10 15:28:29 HKT 2007

²åÁ½¾ä×ì¡£¿ÉÒÔÕâÑùÀí½âunicode£º

ÊÀ½çÉÏËùÓеÄÎÄ×Ö¶¼ÊÇÒ»ÖÖ·ûºÅ£¬unicode¾ÍÊÇÒ»¸öµç×Ó»¯µÄºÍÎÄ×Ö·ûºÅÒ»¶ÔÒ»µÄÖ¸Ïò¡£
¾ÍºÃ±ÈÊÀ½çÉϵÄËùÓÐÈËÆäʵ¶¼ÊÇÈË£¬ÈËÃǽ¨Á¢ÁËÒ»ÖÖµç×Ó»¯µÄºÍÿ¸öÈ˶ÔÓ¦µÄÒ»¶ÔÒ»Ö¸Ïò¡£

ÕâÑù¾Í½âÊÍÁËunicode¶¼ÊÇ1µÄÎÊÌ⣬ÒòΪ²»¹ÜÊÇÖ¸ÏòÒ»¸ö·ûºÅ£¬»¹ÊÇÖ¸ÏòÒ»¸öÈË£¬¶¼ÊÇÒ»¶ÔÒ»µÄ¹ý³Ì¡£

utf8£¬gbkµÈ±àÂë¾ÍºÃ±ÈÈ˵IJ»Í¬µÄÃû×Ö£¬ËûÓпÉÄܽÐjessinio smith£¬ÄÇôÕâ¸öÃû×Ö¾ÍÕ¼14룬ËûÓпÉÄÜÓиöÖÐÎÄÃû×Ö£¬ÄÇô¾ÍÕ¼2µ½3λ¡£

ËùÒÔunicodeµ½µ×Õ¼¼¸Î»Æäʵ²»ÖØÒª£¬¹ÜËüÔÚÄÚ´æÖÐÊÇÔõô´æµÄ£¬·´Õýÿ¸ö×ÖÓиö¶ÔÓ³µÄunicode±àÂë¾Í¿ÉÒÔÁË£¬Ö»Òª±£Ö¤Ò»¶ÔÒ»¾ÍûÓÐÎÊÌâ

È»ºóÎÒÃÇÔÚʹÓõÄʱºòÍùÍùÊǽ«unicode½øÐбàÂ룬Êä³ö³ÉÒ»¸öÎÒÃÇ¿´µÃ¶®µÄ±íÏÖÐÎʽÀ´²é¿´

On 4/10/07, jessinio smith <jessinio在gmail.com> wrote:
>
> ´Óhttp://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx¿´µ½£º
>
> ºÜ¶àÈË»¹´æÔÚÕâÑùµÄÎó½â£º Unicode ½ö½öÊÇ 16 λµÄÕâô¼òµ¥£¬Ã¿¸ö×Ö·ûÕ¼ 16 룬ËùÒÔÒ»¹²ÓÐ 65536 ¸ö¿ÉÄܵÄ×Ö·û¡£
> È»¶ø£¬ÕâÊÇ´íÎóµÄ¡£²»¹ý²»Òª½ô£¬ÒòΪÕâÊǴ󲿷ÖÈ˶¼»á·¸µÄÒ»¸öÆÕ±éµÄ´íÎó¡£
>
> ʵ¼ÊÉÏ£¬Unicode Àí½â×Ö·ûµÄ·½Ê½ÊǽØÈ»²»Í¬µÄ£¬¶øÕâÊÇÎÒÃDZØÐëÁ˽âµÄ¡£
> µ½Ä¿Ç°ÎªÖ¹£¬ÎÒÃǶ¼Ôø¾­ÈÏΪ£ºÒ»¸ö×Ö·û¶ÔÓ¦µ½Ò»Ð©ÔÚ´ÅÅÌÉÏ»òÄÚ´æÖд¢´æµÄ루bits£©. È磺 A -> 0100 0001
>
> ¶øÔÚ Unicode ÖУ¬ Ò»¸ö×Ö·ûʵ¼ÊÉ϶ÔÓ¦Ò»ÖÖ½Ð×ö code point µÄ¶«Î÷¡£
>
> ÿһ¸ö×Öĸ±íÖеÄÿһ¸ö³éÏóµÄ×Öĸ£¬¶¼±»¸³ÓèÁËÒ»¸öÊý×Ö£¬±ÈÈç U+0645. Õâ¸ö½Ð×ö code point.
>
> On 4/10/07, Neil(ľҰºü) <chenrong2003在gmail.com> wrote:
> >
> > ºÜ¾Ã֮ǰÎÒ·­ÒëµÄÒ»¸ö£º
> > http://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx
> >
> > ÔÚ 07-4-10£¬jessinio smith<jessinio在gmail.com > дµÀ£º
> > > ÕâЩÎÒ¶¼ÖªµÀ¡£
> > >
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> >
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
>
>
>
> --
> ×¢ÒâÉíÌ壬ÉíÌåÊǸïÃüµÄ±¾Ç®£¡£¡
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070410/c6763a36/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 09:42

mvfirst mvfirst在126.com
星期三 四月 11 09:42:38 HKT 2007

Subject: =?gb2312?B?x/PW+qO6yKu+1rHkwb/OysziKNPDubLP7cDg0rLKp7DcwcujqQ==?=
Message-ID: <200704110942376718992在126.com>
X-mailer: Foxmail 6, 4, 104, 20 [cn]
Mime-Version: 1.0
Content-Type: multipart/alternative;
	boundary="=====003_Dragon868348755161_====="


This is a multi-part message in MIME format.

--=====003_Dragon868348755161_=====
Content-Type: text/plain;
	charset="gb2312"
Content-Transfer-Encoding: base64

1f3OxKO6DQogIM7S1NphLnB5tqjS5cHL0ru49sirvtax5MG/Z1VzZXIsZ1VzZXLU2mHW0LG7uLPW
taGjDQogINTaYi5wedbQo7oNCiAgZnJvbSBhIGltcG9ydCBnVXNlcg0KICC0y8qxo6xnVXNlctPQ
yrG1yNPa1Nph1tC4s7XE1rWjrNPQyrHOqr/VoaMNCg0KICDO0rXExL+1xMrH1Nq24Lj2cHnW0Lmy
z+3Su7j2yKu+1rHkwb+how0KICDO0tLR19DPuNTEtsHHsLy4zOy52NPatMvOyszitcTM1sLbo6yy
os60veK+9s7KzOKhow0KDQogINC70Luhow0KICANCg0KDQoNCg0KbXZmaXJzdA0KMjAwNy0wNC0x
MA0KDQoNCg0Kt6K8/sjLo7ogamVzc2luaW8gc21pdGgNCreiy83Ksbzko7ogMjAwNy0wNC0xMCAx
MjowNzoyOQ0KytW8/sjLo7ogcHl0aG9uLWNoaW5lc2VAbGlzdHMucHl0aG9uLmNuDQqzrcvNo7og
DQrW98zio7ogUmU6IFtweXRob24tY2hpbmVzZV11bmljb2RlysfBvbj219a3+7XEo6y7ucrHseSz
pLXEo6jLq9fWvdq1xLG2yv2jqaO/DQoNCrTTaHR0cDovL2Jsb2cuY3Nkbi5uZXQvaW5lbG0vYXJj
aGl2ZS8yMDA0LzExLzI5LzE5NzQ2Ni5hc3B4v7S1vaO6DQoNCrrctuDIy7u5tObU2tXi0fm1xM7z
veKjuiBVbmljb2RlIL32vfbKxyAxNiDOu7XE1eLDtLzytaWjrMO/uPbX1rf71bwgMTYgzrujrMv5
0tTSu7my09AgNjU1MzYguPa/ycTctcTX1rf7oaMNCsi7tvijrNXiyse07c7ztcSho7K7uf2yu9Kq
vfSjrNLyzqrV4srHtPOyv7fWyMu2vLvht7i1xNK7uPbG1bHptcS07c7zoaMgDQoNCsq1vMrJz6Os
VW5pY29kZSDA7b3i19a3+7XEt73KvcrHvdjIu7K7zay1xKOstvjV4srHztLDx7HY0OvBy73itcSh
ow0Ktb3Ev8ewzqrWuaOsztLDx7a81Pi+rcjPzqqjutK7uPbX1rf7ttTTprW90rvQqdTatMXFzMnP
u/LE2rTm1tC0orTmtcTOu6OoYml0c6OpLiDI56O6IEEgLT4gMDEwMCAwMDAxDQoNCrb41NogVW5p
Y29kZSDW0KOsINK7uPbX1rf7yrW8ysnPttTTptK71ta90Nf2IGNvZGUgcG9pbnQgtcS2q873oaMN
Cg0Kw7/Su7j219bEuLHt1tC1xMO/0ru49rPpz/O1xNfWxLijrLa8sbu4s9PowcvSu7j2yv3X1qOs
scjI5yBVKzA2NDUuINXiuPa90Nf2IGNvZGUgcG9pbnQuIA0KDQoNCk9uIDQvMTAvMDcsIE5laWwo
xL7SsLr8KSA8Y2hlbnJvbmcyMDAzQGdtYWlsLmNvbT4gd3JvdGU6IA0Kuty+w9aux7DO0ret0uu1
xNK7uPajug0KaHR0cDovL2Jsb2cuY3Nkbi5uZXQvaW5lbG0vYXJjaGl2ZS8yMDA0LzExLzI5LzE5
NzQ2Ni5hc3B4DQoNCtTaIDA3LTQtMTCjrGplc3NpbmlvIHNtaXRoPGplc3NpbmlvQGdtYWlsLmNv
bSA+INC0tcCjug0KPiDV4tCpztK2vNaqtcChow0KPg0KX19fX19fX19fX19fX19fX19fX19fX19f
X19fX19fX19fX19fX19fX19fX19fX18NCnB5dGhvbi1jaGluZXNlDQpQb3N0OiBzZW5kIHB5dGhv
bi1jaGluZXNlQGxpc3RzLnB5dGhvbi5jbg0KU3Vic2NyaWJlOiBzZW5kIHN1YnNjcmliZSB0byBw
eXRob24tY2hpbmVzZS1yZXF1ZXN0QGxpc3RzLnB5dGhvbi5jbg0KVW5zdWJzY3JpYmU6IHNlbmQg
dW5zdWJzY3JpYmUgdG8gIHB5dGhvbi1jaGluZXNlLXJlcXVlc3RAbGlzdHMucHl0aG9uLmNuIA0K
RGV0YWlsIEluZm86IGh0dHA6Ly9weXRob24uY24vbWFpbG1hbi9saXN0aW5mby9weXRob24tY2hp
bmVzZQ0KDQoNCg0KLS0gDQrXotLiye3M5aOsye3M5crHuO/D/LXEsb7HrqOho6EgDQo=

--=====003_Dragon868348755161_=====
Content-Type: text/html;
	charset="gb2312"
Content-Transfer-Encoding: base64

PCFET0NUWVBFIEhUTUwgUFVCTElDICItLy9XM0MvL0RURCBIVE1MIDQuMCBUcmFuc2l0aW9uYWwv
L0VOIj4NCjxIVE1MPjxIRUFEPg0KPE1FVEEgaHR0cC1lcXVpdj1Db250ZW50LVR5cGUgY29udGVu
dD0idGV4dC9odG1sOyBjaGFyc2V0PWdiMjMxMiI+DQo8TUVUQSBjb250ZW50PSJNU0hUTUwgNi4w
MC42MDAwLjE2NDE0IiBuYW1lPUdFTkVSQVRPUj4NCjxTVFlMRT4NCjwhLS0NCiAvKiBGb250IERl
ZmluaXRpb25zICovDQogQGZvbnQtZmFjZQ0KCXtmb250LWZhbWlseTrLzszlOw0KCXBhbm9zZS0x
OjIgMSA2IDAgMyAxIDEgMSAxIDE7fQ0KQGZvbnQtZmFjZQ0KCXtmb250LWZhbWlseTpWZXJkYW5h
Ow0KCXBhbm9zZS0xOjIgMTEgNiA0IDMgNSA0IDQgMiA0O30NCkBmb250LWZhY2UNCgl7Zm9udC1m
YW1pbHk6IlxAy87M5SI7DQoJcGFub3NlLTE6MiAxIDYgMCAzIDEgMSAxIDEgMTt9DQogLyogU3R5
bGUgRGVmaW5pdGlvbnMgKi8NCiBwLk1zb05vcm1hbCwgbGkuTXNvTm9ybWFsLCBkaXYuTXNvTm9y
bWFsDQoJe21hcmdpbjowY207DQoJbWFyZ2luLWJvdHRvbTouMDAwMXB0Ow0KCXRleHQtYWxpZ246
anVzdGlmeTsNCgl0ZXh0LWp1c3RpZnk6aW50ZXItaWRlb2dyYXBoOw0KCWZvbnQtc2l6ZToxMC41
cHQ7DQoJZm9udC1mYW1pbHk6IlRpbWVzIE5ldyBSb21hbiI7fQ0KYTpsaW5rLCBzcGFuLk1zb0h5
cGVybGluaw0KCXtjb2xvcjpibHVlOw0KCXRleHQtZGVjb3JhdGlvbjp1bmRlcmxpbmU7fQ0KYTp2
aXNpdGVkLCBzcGFuLk1zb0h5cGVybGlua0ZvbGxvd2VkDQoJe2NvbG9yOnB1cnBsZTsNCgl0ZXh0
LWRlY29yYXRpb246dW5kZXJsaW5lO30NCnNwYW4uRW1haWxTdHlsZTE3DQoJe21zby1zdHlsZS10
eXBlOnBlcnNvbmFsLWNvbXBvc2U7DQoJZm9udC1mYW1pbHk6VmVyZGFuYTsNCgljb2xvcjp3aW5k
b3d0ZXh0Ow0KCWZvbnQtd2VpZ2h0Om5vcm1hbDsNCglmb250LXN0eWxlOm5vcm1hbDsNCgl0ZXh0
LWRlY29yYXRpb246bm9uZSBub25lO30NCiAvKiBQYWdlIERlZmluaXRpb25zICovDQogQHBhZ2Ug
U2VjdGlvbjENCgl7c2l6ZTo1OTUuM3B0IDg0MS45cHQ7DQoJbWFyZ2luOjcyLjBwdCA5MC4wcHQg
NzIuMHB0IDkwLjBwdDsNCglsYXlvdXQtZ3JpZDoxNS42cHQ7fQ0KZGl2LlNlY3Rpb24xDQoJe3Bh
Z2U6U2VjdGlvbjE7fQ0KLS0+DQo8L1NUWUxFPg0KPC9IRUFEPg0KPEJPRFk+DQo8RElWPjxGT05U
IGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj7V/c7Eo7o8L0ZPTlQ+PC9ESVY+DQo8
RElWPjxGT05UIGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj4mbmJzcDsgDQrO0tTa
YS5webao0uXBy9K7uPbIq77WseTBv2dVc2VyLGdVc2Vy1Nph1tCxu7iz1rWhozwvRk9OVD48L0RJ
Vj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPiZuYnNwOyDU
2mIucHnW0KO6PC9GT05UPjwvRElWPg0KPERJVj48Rk9OVCBmYWNlPVZlcmRhbmEgY29sb3I9IzAw
MDBmZiBzaXplPTI+Jm5ic3A7IGZyb20gYSBpbXBvcnQgDQpnVXNlcjwvRk9OVD48L0RJVj4NCjxE
SVY+PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPiZuYnNwOyANCrTLyrGj
rGdVc2Vy09DKsbXI09rU2mHW0LiztcTWtaOs09DKsc6qv9WhozwvRk9OVD48L0RJVj4NCjxESVY+
PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPjwvRk9OVD4mbmJzcDs8L0RJ
Vj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIGNvbG9yPSMwMDAwZmYgc2l6ZT0yPiZuYnNwOyAN
Cs7StcTEv7XEysfU2rbguPZwedbQubLP7dK7uPbIq77WseTBv6GjPC9GT05UPjwvRElWPg0KPERJ
Vj48Rk9OVCBmYWNlPVZlcmRhbmEgY29sb3I9IzAwMDBmZiBzaXplPTI+Jm5ic3A7IA0KztLS0dfQ
z7jUxLbBx7C8uMzsudjT2rTLzsrM4rXEzNbC26OssqLOtL3ivvbOyszioaM8L0ZPTlQ+PC9ESVY+
DQo8RElWPjxGT05UIGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj48L0ZPTlQ+Jm5i
c3A7PC9ESVY+DQo8RElWPjxGT05UIGZhY2U9VmVyZGFuYSBjb2xvcj0jMDAwMGZmIHNpemU9Mj4m
bmJzcDsg0LvQu6GjPC9GT05UPjwvRElWPg0KPERJVj48Rk9OVCBmYWNlPVZlcmRhbmEgY29sb3I9
IzAwMDBmZiBzaXplPTI+Jm5ic3A7IDwvRk9OVD48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJk
YW5hIHNpemU9Mj48L0ZPTlQ+Jm5ic3A7PC9ESVY+DQo8RElWIGFsaWduPWxlZnQ+DQo8RElWIGFs
aWduPWxlZnQ+PEZPTlQgZmFjZT1WZXJkYW5hIHNpemU9Mj4NCjxIUiBzdHlsZT0iV0lEVEg6IDEy
MnB4OyBIRUlHSFQ6IDJweCIgU0laRT0yPg0KPC9GT05UPjwvRElWPg0KPERJVj48Rk9OVCBjb2xv
cj0jYzBjMGMwPjxGT05UIGZhY2U9VmVyZGFuYSBzaXplPTI+bXZmaXJzdDwvRk9OVD48L0RJVj4N
CjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIHNpemU9Mj4yMDA3LTA0LTEwPC9GT05UPjwvRk9OVD48
L0RJVj48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hIHNpemU9Mj4NCjxIUj4NCjwvRk9O
VD48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hPjxGT05UIHNpemU9Mj48U1RST05HPrei
vP7Iy6O6PC9TVFJPTkc+IGplc3NpbmlvIA0Kc21pdGg8L0ZPTlQ+PC9GT05UPjwvRElWPg0KPERJ
Vj48Rk9OVCBmYWNlPVZlcmRhbmE+PEZPTlQgc2l6ZT0yPjxTVFJPTkc+t6LLzcqxvOSjujwvU1RS
T05HPiANCjIwMDctMDQtMTAmbmJzcDsxMjowNzoyOTwvRk9OVD48L0ZPTlQ+PC9ESVY+DQo8RElW
PjxGT05UIGZhY2U9VmVyZGFuYT48Rk9OVCBzaXplPTI+PFNUUk9ORz7K1bz+yMujujwvU1RST05H
PiANCnB5dGhvbi1jaGluZXNlQGxpc3RzLnB5dGhvbi5jbjwvRk9OVD48L0ZPTlQ+PC9ESVY+DQo8
RElWPjxGT05UIGZhY2U9VmVyZGFuYT48Rk9OVCBzaXplPTI+PFNUUk9ORz6zrcvNo7o8L1NUUk9O
Rz4gPC9GT05UPjwvRk9OVD48L0RJVj4NCjxESVY+PEZPTlQgZmFjZT1WZXJkYW5hPjxGT05UIHNp
emU9Mj48U1RST05HPtb3zOKjujwvU1RST05HPiBSZTogDQpbcHl0aG9uLWNoaW5lc2VddW5pY29k
ZcrHwb249tfWt/u1xKOsu7nKx7Hks6S1xKOoy6vX1r3atcSxtsr9o6mjvzwvRk9OVD48L0ZPTlQ+
PC9ESVY+DQo8RElWPjxGT05UIGZhY2U9VmVyZGFuYSBzaXplPTI+PC9GT05UPiZuYnNwOzwvRElW
Pg0KPERJVj48Rk9OVCBmYWNlPVZlcmRhbmEgc2l6ZT0yPrTTPEEgDQpocmVmPSJodHRwOi8vYmxv
Zy5jc2RuLm5ldC9pbmVsbS9hcmNoaXZlLzIwMDQvMTEvMjkvMTk3NDY2LmFzcHgiPmh0dHA6Ly9i
bG9nLmNzZG4ubmV0L2luZWxtL2FyY2hpdmUvMjAwNC8xMS8yOS8xOTc0NjYuYXNweDwvQT6/tLW9
o7o8QlI+PEJSPrrctuDIy7u5tObU2tXi0fm1xM7zveKjuiANClVuaWNvZGUgvfa99srHIDE2IM67
tcTV4sO0vPK1paOsw7+49tfWt/vVvCAxNiDOu6Osy/nS1NK7ubLT0CA2NTUzNiANCrj2v8nE3LXE
19a3+6GjPEJSPsi7tvijrNXiyse07c7ztcSho7K7uf2yu9KqvfSjrNLyzqrV4srHtPOyv7fWyMu2
vLvht7i1xNK7uPbG1bHptcS07c7zoaMgPEJSPjxCUj7KtbzKyc+jrFVuaWNvZGUgDQrA7b3i19a3
+7XEt73KvcrHvdjIu7K7zay1xKOstvjV4srHztLDx7HY0OvBy73itcShozxCUj61vcS/x7DOqta5
o6zO0sPHtrzU+L6tyM/OqqO60ru49tfWt/u21NOmtb3Su9Cp1Nq0xcXMyc+78sTatObW0LSitOa1
xM67o6hiaXRzo6kuIMjno7ogQSANCi0mZ3Q7IDAxMDAgMDAwMTxCUj48QlI+tvjU2iBVbmljb2Rl
INbQo6wg0ru49tfWt/vKtbzKyc+21NOm0rvW1r3Q1/YgY29kZSBwb2ludCANCrXEtqvO96GjPEJS
PjxCUj7Dv9K7uPbX1sS4se3W0LXEw7/Su7j2s+nP87XE19bEuKOstryxu7iz0+jBy9K7uPbK/dfW
o6yxyMjnIFUrMDY0NS4g1eK49r3Q1/YgY29kZSBwb2ludC4gPEJSPjxCUj4NCjxESVY+PFNQQU4g
Y2xhc3M9Z21haWxfcXVvdGU+T24gNC8xMC8wNywgPEIgY2xhc3M9Z21haWxfc2VuZGVybmFtZT5O
ZWlsKMS+0rC6/Ck8L0I+IA0KJmx0OzxBIGhyZWY9Im1haWx0bzpjaGVucm9uZzIwMDNAZ21haWwu
Y29tIj5jaGVucm9uZzIwMDNAZ21haWwuY29tPC9BPiZndDsgDQp3cm90ZTo8L1NQQU4+IA0KPEJM
T0NLUVVPVEUgY2xhc3M9Z21haWxfcXVvdGUgDQpzdHlsZT0iUEFERElORy1MRUZUOiAxZXg7IE1B
UkdJTjogMHB0IDBwdCAwcHQgMC44ZXg7IEJPUkRFUi1MRUZUOiByZ2IoMjA0LDIwNCwyMDQpIDFw
eCBzb2xpZCI+uty+w9aux7DO0ret0uu1xNK7uPajujxCUj48QSANCiAgaHJlZj0iaHR0cDovL2Js
b2cuY3Nkbi5uZXQvaW5lbG0vYXJjaGl2ZS8yMDA0LzExLzI5LzE5NzQ2Ni5hc3B4Ij5odHRwOi8v
YmxvZy5jc2RuLm5ldC9pbmVsbS9hcmNoaXZlLzIwMDQvMTEvMjkvMTk3NDY2LmFzcHg8L0E+PEJS
PjxCUj7U2iANCiAgMDctNC0xMKOsamVzc2luaW8gc21pdGgmbHQ7PEEgDQogIGhyZWY9Im1haWx0
bzpqZXNzaW5pb0BnbWFpbC5jb20iPmplc3NpbmlvQGdtYWlsLmNvbSA8L0E+Jmd0OyDQtLXAo7o8
QlI+Jmd0OyANCiAg1eLQqc7StrzWqrXAoaM8QlI+Jmd0OzxCUj5fX19fX19fX19fX19fX19fX19f
X19fX19fX19fX19fX19fX19fX19fX19fX19fXzxCUj5weXRob24tY2hpbmVzZTxCUj5Qb3N0OiAN
CiAgc2VuZCA8QSANCiAgaHJlZj0ibWFpbHRvOnB5dGhvbi1jaGluZXNlQGxpc3RzLnB5dGhvbi5j
biI+cHl0aG9uLWNoaW5lc2VAbGlzdHMucHl0aG9uLmNuPC9BPjxCUj5TdWJzY3JpYmU6IA0KICBz
ZW5kIHN1YnNjcmliZSB0byA8QSANCiAgaHJlZj0ibWFpbHRvOnB5dGhvbi1jaGluZXNlLXJlcXVl
c3RAbGlzdHMucHl0aG9uLmNuIj5weXRob24tY2hpbmVzZS1yZXF1ZXN0QGxpc3RzLnB5dGhvbi5j
bjwvQT48QlI+VW5zdWJzY3JpYmU6IA0KICBzZW5kIHVuc3Vic2NyaWJlIHRvJm5ic3A7Jm5ic3A7
PEEgDQogIGhyZWY9Im1haWx0bzpweXRob24tY2hpbmVzZS1yZXF1ZXN0QGxpc3RzLnB5dGhvbi5j
biI+cHl0aG9uLWNoaW5lc2UtcmVxdWVzdEBsaXN0cy5weXRob24uY24gDQogIDwvQT48QlI+RGV0
YWlsIEluZm86IDxBIA0KICBocmVmPSJodHRwOi8vcHl0aG9uLmNuL21haWxtYW4vbGlzdGluZm8v
cHl0aG9uLWNoaW5lc2UiPmh0dHA6Ly9weXRob24uY24vbWFpbG1hbi9saXN0aW5mby9weXRob24t
Y2hpbmVzZTwvQT48L0JMT0NLUVVPVEU+PC9ESVY+PEJSPjxCUiANCmNsZWFyPWFsbD48QlI+LS0g
PEJSPtei0uLJ7czlo6zJ7czlyse478P8tcSxvseuo6GjoSA8L0ZPTlQ+PC9ESVY+PC9CT0RZPjwv
SFRNTD4NCg==

--=====003_Dragon868348755161_=====--



[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 09:49

liupeng liupeng在18mail.cn
星期三 四月 11 09:49:36 HKT 2007

������
-------------- 下一部分 --------------
一个非文本附件被清除...
发信人: %(who)s
主题: %(subject)s
日期: %(date)s
大小: 189
Url: http://python.cn/pipermail/python-chinese/attachments/20070411/e0cfc112/attachment.pgp 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 20:26

eric glitch.wang在gmail.com
星期三 四月 11 20:26:05 HKT 2007

An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20070411/b0d778a0/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 20:54

Zoom.Quiet zoom.quiet在gmail.com
星期三 四月 11 20:54:41 HKT 2007

On 4/10/07, Adieu <adieu在adieu.cn> wrote:
> 插两句嘴。可以这样理解unicode:
>
> 世界上所有的文字都是一种符号,unicode就是一个电子化的和文字符号一对一的指向。
> 就好比世界上的所有人其实都是人,人们建立了一种电子化的和每个人对应的一对一指向。
>
> 这样就解释了unicode都是1的问题,因为不管是指向一个符号,还是指向一个人,都是一对一的过程。
>
> utf8,gbk等编码就好比人的不同的名字,他有可能叫jessinio
> smith,那么这个名字就占14位,他有可能有个中文名字,那么就占2到3位。
>
> 所以unicode到底占几位其实不重要,管它在内存中是怎么存的,反正每个字有个对映的unicode编码就可以了,只要保证一对一就没有问题
>
> 然后我们在使用的时候往往是将unicode进行编码,输出成一个我们看得懂的表现形式来查看
>
> On 4/10/07, jessinio smith <jessinio在gmail.com> wrote:
> > 从
> http://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx看到:
> >
> >
> > 很多人还存在这样的误解: Unicode 仅仅是 16 位的这么简单,每个字符占 16 位,所以一共有 65536 个可能的字符。
> > 然而,这是错误的。不过不要紧,因为这是大部分人都会犯的一个普遍的错误。
> >
> > 实际上,Unicode 理解字符的方式是截然不同的,而这是我们必须了解的。
> > 到目前为止,我们都曾经认为:一个字符对应到一些在磁盘上或内存中储存的位(bits). 如: A -> 0100
> 0001
> >
> > 而在 Unicode 中, 一个字符实际上对应一种叫做 code point 的东西。
> >
> > 每一个字母表中的每一个抽象的字母,都被赋予了一个数字,比如 U+0645. 这个叫做 code point.
> >
> >
> >
> > On 4/10/07, Neil(木野狐) < chenrong2003在gmail.com> wrote:
> > > 很久之前我翻译的一个:
> > >
> http://blog.csdn.net/inelm/archive/2004/11/29/197466.aspx
> > >
> > > 在 07-4-10,jessinio smith<jessinio在gmail.com > 写道:
> > > > 这些我都知道。
> > > >
上次会课时有提到:
http://wiki.woodpecker.org.cn/moin/BPUG/2007-03-03
 * http://thetruedelight.blogspot.com/2007/01/facts-about-unicode-which-you-might-not.html
提问的兄弟,你说的 unicode 和你实际使用的 utf-8 等等不是同一事物;

不过大家好象忘了另一初始问题: 如果是变长的,又是如何知道哪些字节是对应什么中文?

通过学习,俺可以这么白话一下:
在 unicode 之前,各种编码都是定长码表形式,对中文就容易造成高位相同,如果编码指定不对或是传输时有残缺就整篇文档解析错乱!
在 unicode 之后,不论是 utf-* 多少,使用了同样的声明串格式,在每个编码字符串的开始有专门字节表达本字码将有多长,
这样即使有传输残缺也只会造成个别字解析错乱。

所以,不论一个中文字在 utf-* 中各是使用多少字节记录,或是使用什么统计方式排序,或是否定长,大家只要记住使用 utf-*
来处理中文最靠谱,Python 内部所有字符默认使用 unicode 来传送的,就OK;

遇见具体实例 len() 一下就好了,不用费心理解的,是也乎? ;-)

-- 
'''Time is unimportant, only life important!
http://zoomquiet.org
blog在http://blog.zoomquiet.org/pyblosxom/
wiki在http://wiki.woodpecker.org.cn/moin/ZoomQuiet
scrap在http://floss.zoomquiet.org
douban在http://www.douban.com/people/zoomq/
____________________________________
Pls. use OpenOffice.org to replace M$ Office.
     http://zh.openoffice.org
Pls. use 7-zip to replace WinRAR/WinZip.
     http://7-zip.org/zh-cn/
You can get the truely Freedom 4 software.
'''

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 21:59

vcc vcc在163.com
星期三 四月 11 21:59:11 HKT 2007

在 2007-04-11三的 20:54 +0800,Zoom.Quiet写道:
> Python 内部所有字符默认使用 unicode 来传送的,就OK;
> 

在python中,unicode string是python的一种数据类型,并不是所有的字符默认使
用unicode格式。如果看python的源码unicodeobject.h和.c,可以看到unicode
object默认的存储是UCS-4 (如果编译选项--enable-unicode=ucs4没改的话),也
就是4个字节。然后再根据codec来转换成utf-8, utf-16, gb2312, ....

vcc
_



[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 22:11

wentrue(I'm Once) guozhuwen在gmail.com
星期三 四月 11 22:11:00 HKT 2007

Äã¿ÉÄÜûÀí½âÎÒµÄÒâ˼£¬ÎÒ´ÓÄã¸ø³öµÄÁ´½ÓµÄÒýÎÄÀ´½âÊÍһϣº

"UTF-8ÓÃ1µ½6¸ö×Ö½Ú±àÂëUNICODE×Ö·û¡£
Èç¹ûUNICODE×Ö·ûÓÉ2¸ö×Ö½Ú±íʾ£¬Ôò±àÂë³ÉUTF-8ºÜ¿ÉÄÜÐèÒª3¸ö×Ö½Ú£¬
¶øÈç¹ûUNICODE×Ö·ûÓÉ4¸ö×Ö½Ú±íʾ£¬Ôò±àÂë³ÉUTF-8¿ÉÄÜÐèÒª6¸ö×Ö½Ú¡£
ÓÃ4¸ö»ò6¸ö×Ö½ÚÈ¥±àÂëÒ»¸öUNICODE×Ö·û¿ÉÄÜÌ«¶àÁË£¬µ«ºÜÉÙ»áÓöµ½ÄÇÑùµÄUNICODE×Ö·û¡£ "
¡­¡­¡­¡­¡­¡­¡­¡­¡­¡­
"ʵ¼Ê±íʾASCII×Ö·ûµÄUNICODE×Ö·û£¬½«»á±àÂë³É1¸ö×Ö½Ú£¬²¢ÇÒUTF-8±íʾÓëASCII×Ö·û±íʾÊÇÒ»ÑùµÄ¡£
ËùÓÐÆäËûµÄUNCODE×Ö·ûת»¯³ÉUTF-8½«ÐèÒªÖÁÉÙ2¸ö×Ö½Ú¡£Ã¿¸ö×Ö½ÚÓÉÒ»¸ö»»ÂëÐòÁпªÊ¼¡£µÚÒ»¸ö×Ö½Ú
ÓÉΨһµÄ»»ÂëÐòÁУ¬ÓÉnλ1¼Óһλ0×é³É¡£nλ1±íʾ×Ö·û±àÂëËùÐèµÄ×Ö½ÚÊý¡£ "

´ÓÈ«ÇòµÄ·¶Î§¶øÑÔ£¬ASCII×Ö·ûµÄʹÓÃƵ¶ÈÊÇ×î¸ßµÄ£¬ËùÒÔÓÃ×îÉÙµÄ×Ö½ÚÀ´´æ´¢ËüÃÇÔÚ¸ÅÂÊÉÏÊǽÚÊ¡´æ´¢Óë´«ÊäÁ¿µÄ¡£
ÆäËüµÄ×Ö·ûΪÁ˿ɽøÐÐÇø·Ö¿ªÀ´£¬Ê¹ÓõÄ×Ö½ÚÊý¿ÉÄܱÈunicodeµÄ¶¨ÒåÒýÓÃ×Ö½ÚÊýÒª¶à¡£
µ«×¢ÒâºìÉ«ÒýÎÄ£¬UTF-8Öжà×Ö½Ú±àÂëµÄÍùÍùÊǽÏÏ¡ÉÙµÄ×Ö·û£¬ÕâÆäʵҲÕý˵Ã÷Á˸ù¾Ý
ʹÓÃƵ¶ÈÀ´Ñ¡Ôñ±àÂë×Ö½ÚÊýµÄ¹Øϵ£¬µ±È»ÕâÑùµÄÑ¡Ôñ²»ÊDzο¼Ò»Á½¸ö×Ö·ûµÄƵ¶È£¬
¶øÊÇij¸ö×Ö·û×Ó¼¯µÄƵ¶È¡£¶ÔÓÚ²»Í¬µÄµØÇø£¬²ÎÕÕÕâÒ»Ô­Ôò£¬¶¼»áÓÐÉÔ΢²»Í¬µÄµØÇøUTF-8±àÂë¡£



ÔÚ07-4-10£¬limodou <limodou在gmail.com> дµÀ£º
>
> On 4/10/07, wentrue <guozhuwen在gmail.com> wrote:
> > ¸ÅÄîÉϵÄÎÊÌ⣬Ҫ°ÑÒýÓúͱàÂë·Ö¿ª¡£
> > unicode¾ÍÊÇÒ»¸ö×Ö·û¼¯£¬ÊÇÒ»¸ö×Ö·û×é³ÉµÄ±í£¬ÊÇcharset¡£
> >
> ÎÒÃÇͨ³£ÓõÄuXXXXÖ»ÊǶԱíÖÐijһ×Ö·ûµÄÒ»¸öÒýÓ㬲»ÊÇ˵uXXXX¾ÍÊÇunicode£¬unicode¾ÍÊÇÄǸö±íµÄ³éÏóÒâÒ壬¶ø¸ÃÒýÓÃÖµÊÇÒ»¸öÊý¡£µ±È»Äã¿ÉÒÔ°ÑÄǸöÊý×÷ΪunicodeµÄÐÅÏ¢±£´æ£¬µ«³öÓÚ½ÚÊ¡¿Õ¼äµÄ¿¼ÂÇ£¬Í¨³£Òª¶Ô¸ÃÒýÓÃÖµÔÙ½øÐÐÒ»²ã°ü×°£¬ÄǾÍÊDZàÂë¡£ÏñGBKÊÇ×Ó¼¯Ê½±àÂ룬ÏñUtf-8ÊDZ䳤µÄ£¬¸ù¾Ý×Ö·ûʹÓÃƵÂÊÀ´±àÂ룬ƵÂʸߵÄÓöÌ×Ö½Ú£¬ÆµÂʵ͵ÄÓó¤×Ö½Ú£¬ÕâÑù´ÓÐÅÏ¢Â۵ĽǶÈÀ´Ëµ£¬¾Í±£Ö¤ÁËƵÂÊÉÏ´ó´ó½ÚÊ¡ÁË´æ´¢ºÍ´«ÊäµÄÊý¾ÝÁ¿¡£
>
> ½¨Òé²»ÖªµÀ²»ÒªÂÒ½âÊÍ£¬ÏȲéÁË×ÊÁÏÔÙ˵¡£utf-8±ä³¤ÊDz»´í£¬µ«ÊÇûÓÐ˵ÊÇ°´Ê¹ÓÃƵÂÊÀ´±àÂëµÄ¡£
>
> http://wiki.mambochina.net/index.php/UTF-8%E5%AD%97%E7%AC%A6%E9%9B%86%E5%9F%BA%E7%A1%80
>
> ½¨Òé×ÐϸÔĶÁ¡£ÓëƵÂʺÁÎÞ¹Øϵ¡£
>
> --
> I like python!
> UliPad <>: http://wiki.woodpecker.org.cn/moin/UliPad
> My Blog: http://www.donews.net/limodou
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese




-- 
I am Once!
I am wentrue!
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070411/2e474f6e/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 22:12

Linker Lin linkerlin88在gmail.com
星期三 四月 11 22:12:30 HKT 2007

之前列表里面有比较详细的讨论过,建议多用Google。



On 4/11/07, vcc <vcc在163.com> wrote:
>
> 在 2007-04-11三的 20:54 +0800,Zoom.Quiet写道:
> > Python 内部所有字符默认使用 unicode 来传送的,就OK;
> >
>
> 在python中,unicode string是python的一种数据类型,并不是所有的字符默认使
> 用unicode格式。如果看python的源码unicodeobject.h和.c,可以看到unicode
> object默认的存储是UCS-4 (如果编译选项--enable-unicode=ucs4没改的话),也
> 就是4个字节。然后再根据codec来转换成utf-8, utf-16, gb2312, ....
>
> vcc
> _
>
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese




-- 
Linker M Lin
linkerlin88在gmail.com
  ※※※※※※※※※
  ※※我思故我在※※
  ※※※※※※※※※
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20070411/f4f9a28f/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月11日 星期三 23:18

jessinio smith jessinio在gmail.com
星期三 四月 11 23:18:19 HKT 2007

VCcÀûº¦£¡¿´ÁËÔ´´úÂëµÄÈË˵»°¾ÍÊDz»Í¬¡£idol


On 4/11/07, vcc <vcc在163.com> wrote:
>
> ÔÚ 2007-04-11ÈýµÄ 20:54 +0800£¬Zoom.QuietдµÀ£º
> > Python ÄÚ²¿ËùÓÐ×Ö·ûĬÈÏʹÓà unicode À´´«Ë͵Ä,¾ÍOK;
> >
>
> ÔÚpythonÖУ¬unicode stringÊÇpythonµÄÒ»ÖÖÊý¾ÝÀàÐÍ£¬²¢²»ÊÇËùÓеÄ×Ö·ûĬÈÏʹ
> ÓÃunicode¸ñʽ¡£Èç¹û¿´pythonµÄÔ´Âëunicodeobject.hºÍ.c£¬¿ÉÒÔ¿´µ½unicode
> objectĬÈϵĴ洢ÊÇUCS-4 (Èç¹û±àÒëÑ¡Ïî--enable-unicode=ucs4û¸ÄµÄ»°£©£¬Ò²
> ¾ÍÊÇ4¸ö×Ö½Ú¡£È»ºóÔÙ¸ù¾ÝcodecÀ´×ª»»³Éutf-8, utf-16, gb2312, ....
>
> vcc
> _
>
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese




-- 
×¢ÒâÉíÌ壬ÉíÌåÊǸïÃüµÄ±¾Ç®£¡£¡
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070411/19ae302d/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月12日 星期四 14:29

limodou limodou在gmail.com
星期四 四月 12 14:29:07 HKT 2007

On 4/11/07, wentrue(I'm Once) <guozhuwen在gmail.com> wrote:
> 你可能没理解我的意思,我从你给出的链接的引文来解释一下:
>
> "UTF-8用1到6个字节编码UNICODE字符。
> 如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,
> 而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。
> 用4个或6个字节去编码一个UNICODE字符可能太多了,但很少会遇到那样的UNICODE字符。 "
> …………………………
> "实际表示ASCII字符的UNICODE字符,将会编码成1个字节,并且UTF-8表示与ASCII字符表示是一样的。
> 所有其他的UNCODE字符转化成UTF-8将需要至少2个字节。每个字节由一个换码序列开始。第一个字节
> 由唯一的换码序列,由n位1加一位0组成。n位1表示字符编码所需的字节数。 "
>
> 从全球的范围而言,ASCII字符的使用频度是最高的,所以用最少的字节来存储它们在概率上是节省存储与传输量的。
> 其它的字符为了可进行区分开来,使用的字节数可能比unicode的定义引用字节数要多。
> 但注意红色引文,UTF-8中多字节编码的往往是较稀少的字符,这其实也正说明了根据
> 使用频度来选择编码字节数的关系,当然这样的选择不是参考一两个字符的频度,
> 而是某个字符子集的频度。对于不同的地区,参照这一原则,都会有稍微不同的地区UTF-8编码。
>

太牵强了。反正是没人通用频度来解释utf-8,你的说法我是第一次见到。你是首创。

-- 
I like python!
UliPad <>: http://wiki.woodpecker.org.cn/moin/UliPad
My Blog: http://www.donews.net/limodou

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月13日 星期五 01:32

Adieu adieu在adieu.cn
星期五 四月 13 01:32:41 HKT 2007

unicodeµÄÎÊÌâ¿ÉÄÜÊÇÐÂÈ˶¼»áÓöµ½µÄÎÊÌ⣬ÎÒÇ°¶Îʱ¼äÒ²ÃÔãÁ˺ÃÒ»Õó¡£²»¹ÜÕâ´ÎÌÖÂ۵Ľá¹ûÊÇʲô£¬½¨ÒéÕûÀíÒ»·Ý¶«Î÷µ½wikiÖС£ÕâÑùÏ´ÎÓÐмÓÈëµÄÈËŪ²»Ã÷°×ÁË£¬´ó¼Ò¾Í¿ÉÒÔ˵£¬ÄãÏÈÈ¥wikiÉÏ¿´ÁËÔÙ¿´¿´ÓÐʲô²»Ã÷°×µÄÔÙÎÊ£¬Ð§Âʾ͸ßÁË¡£±ÜÃâÀÏ´óÃÇͬÑùµÄ»°ËµN´Î£¬ºÇºÇ¡£

On 4/12/07, limodou <limodou在gmail.com> wrote:
>
> On 4/11/07, wentrue(I'm Once) <guozhuwen在gmail.com> wrote:
> > Äã¿ÉÄÜûÀí½âÎÒµÄÒâ˼£¬ÎÒ´ÓÄã¸ø³öµÄÁ´½ÓµÄÒýÎÄÀ´½âÊÍһϣº
> >
> > "UTF-8ÓÃ1µ½6¸ö×Ö½Ú±àÂëUNICODE×Ö·û¡£
> > Èç¹ûUNICODE×Ö·ûÓÉ2¸ö×Ö½Ú±íʾ£¬Ôò±àÂë³ÉUTF-8ºÜ¿ÉÄÜÐèÒª3¸ö×Ö½Ú£¬
> > ¶øÈç¹ûUNICODE×Ö·ûÓÉ4¸ö×Ö½Ú±íʾ£¬Ôò±àÂë³ÉUTF-8¿ÉÄÜÐèÒª6¸ö×Ö½Ú¡£
> > ÓÃ4¸ö»ò6¸ö×Ö½ÚÈ¥±àÂëÒ»¸öUNICODE×Ö·û¿ÉÄÜÌ«¶àÁË£¬µ«ºÜÉÙ»áÓöµ½ÄÇÑùµÄUNICODE×Ö·û¡£ "
> > ¡­¡­¡­¡­¡­¡­¡­¡­¡­¡­
> > "ʵ¼Ê±íʾASCII×Ö·ûµÄUNICODE×Ö·û£¬½«»á±àÂë³É1¸ö×Ö½Ú£¬²¢ÇÒUTF-8±íʾÓëASCII×Ö·û±íʾÊÇÒ»ÑùµÄ¡£
> > ËùÓÐÆäËûµÄUNCODE×Ö·ûת»¯³ÉUTF-8½«ÐèÒªÖÁÉÙ2¸ö×Ö½Ú¡£Ã¿¸ö×Ö½ÚÓÉÒ»¸ö»»ÂëÐòÁпªÊ¼¡£µÚÒ»¸ö×Ö½Ú
> > ÓÉΨһµÄ»»ÂëÐòÁУ¬ÓÉnλ1¼Óһλ0×é³É¡£nλ1±íʾ×Ö·û±àÂëËùÐèµÄ×Ö½ÚÊý¡£ "
> >
> > ´ÓÈ«ÇòµÄ·¶Î§¶øÑÔ£¬ASCII×Ö·ûµÄʹÓÃƵ¶ÈÊÇ×î¸ßµÄ£¬ËùÒÔÓÃ×îÉÙµÄ×Ö½ÚÀ´´æ´¢ËüÃÇÔÚ¸ÅÂÊÉÏÊǽÚÊ¡´æ´¢Óë´«ÊäÁ¿µÄ¡£
> > ÆäËüµÄ×Ö·ûΪÁ˿ɽøÐÐÇø·Ö¿ªÀ´£¬Ê¹ÓõÄ×Ö½ÚÊý¿ÉÄܱÈunicodeµÄ¶¨ÒåÒýÓÃ×Ö½ÚÊýÒª¶à¡£
> > µ«×¢ÒâºìÉ«ÒýÎÄ£¬UTF-8Öжà×Ö½Ú±àÂëµÄÍùÍùÊǽÏÏ¡ÉÙµÄ×Ö·û£¬ÕâÆäʵҲÕý˵Ã÷Á˸ù¾Ý
> > ʹÓÃƵ¶ÈÀ´Ñ¡Ôñ±àÂë×Ö½ÚÊýµÄ¹Øϵ£¬µ±È»ÕâÑùµÄÑ¡Ôñ²»ÊDzο¼Ò»Á½¸ö×Ö·ûµÄƵ¶È£¬
> > ¶øÊÇij¸ö×Ö·û×Ó¼¯µÄƵ¶È¡£¶ÔÓÚ²»Í¬µÄµØÇø£¬²ÎÕÕÕâÒ»Ô­Ôò£¬¶¼»áÓÐÉÔ΢²»Í¬µÄµØÇøUTF-8±àÂë¡£
> >
>
> ̫ǣǿÁË¡£·´ÕýÊÇûÈËͨÓÃƵ¶ÈÀ´½âÊÍutf-8£¬ÄãµÄ˵·¨ÎÒÊǵÚÒ»´Î¼ûµ½¡£ÄãÊÇÊ×´´¡£
>
> --
> I like python!
> UliPad <>: http://wiki.woodpecker.org.cn/moin/UliPad
> My Blog: http://www.donews.net/limodou
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070413/d13510a1/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月13日 星期五 09:39

Zoom.Quiet zoom.quiet在gmail.com
星期五 四月 13 09:39:15 HKT 2007

On 4/13/07, Adieu <adieu在adieu.cn> wrote:
> unicode的问题可能是新人都会遇到的问题,我前段时间也迷茫了好一阵。不管这次讨论的结果是什么,建议整理一份东西到wiki中。这样下次有新加入的人弄不明白了,大家就可以说,你先去wiki上看了再看看有什么不明白的再问,效率就高了。避免老大们同样的话说N次,呵呵。
>
是也乎,快速组织了一下
http://wiki.woodpecker.org.cn/moin/PythonicUnicode

其实啄木鸟维基中有关文章是很有积累的,
大家帮忙看总结的图谱是否够用?!


>
> On 4/12/07, limodou <limodou在gmail.com> wrote:
> > On 4/11/07, wentrue(I'm Once) < guozhuwen在gmail.com> wrote:
> > > 你可能没理解我的意思,我从你给出的链接的引文来解释一下:
> > >
> > > "UTF-8用1到6个字节编码UNICODE字符。
> > > 如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,
> > > 而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。
> > > 用4个或6个字节去编码一个UNICODE字符可能太多了,但很少会遇到那样的UNICODE字符。 "
> > > …………………………
> > >
> "实际表示ASCII字符的UNICODE字符,将会编码成1个字节,并且UTF-8表示与ASCII字符表示是一样的。
> > > 所有其他的UNCODE字符转化成UTF-8将需要至少2个字节。每个字节由一个换码序列开始。第一个字节
> > > 由唯一的换码序列,由n位1加一位0组成。n位1表示字符编码所需的字节数。 "
> > >
> > > 从全球的范围而言,ASCII字符的使用频度是最高的,所以用最少的字节来存储它们在概率上是节省存储与传输量的。
> > > 其它的字符为了可进行区分开来,使用的字节数可能比unicode的定义引用字节数要多。
> > > 但注意红色引文,UTF-8中多字节编码的往往是较稀少的字符,这其实也正说明了根据
> > > 使用频度来选择编码字节数的关系,当然这样的选择不是参考一两个字符的频度,
> > > 而是某个字符子集的频度。对于不同的地区,参照这一原则,都会有稍微不同的地区UTF-8编码。
> > >
> >
> > 太牵强了。反正是没人通用频度来解释utf-8,你的说法我是第一次见到。你是首创。
> >
> > --
> > I like python!
> > UliPad <>:
> http://wiki.woodpecker.org.cn/moin/UliPad
> > My Blog: http://www.donews.net/limodou
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to
> python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to
> python-chinese-request在lists.python.cn
> > Detail Info:
> http://python.cn/mailman/listinfo/python-chinese
>
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to
> python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to
> python-chinese-request在lists.python.cn
> Detail Info:
> http://python.cn/mailman/listinfo/python-chinese
>


-- 
'''Time is unimportant, only life important!
http://zoomquiet.org
blog在http://blog.zoomquiet.org/pyblosxom/
wiki在http://wiki.woodpecker.org.cn/moin/ZoomQuiet
scrap在http://floss.zoomquiet.org
douban在http://www.douban.com/people/zoomq/
____________________________________
Pls. use OpenOffice.org to replace M$ Office.
     http://zh.openoffice.org
Pls. use 7-zip to replace WinRAR/WinZip.
     http://7-zip.org/zh-cn/
You can get the truely Freedom 4 software.
'''

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月13日 星期五 09:49

jessinio smith jessinio在gmail.com
星期五 四月 13 09:49:06 HKT 2007

×ÄľÄñά»ù ÎÒ»¹²»ÊǺܻáÓÃ.ΪʲôÓÐһЩÎÄÕÂÖ»ÓÐÌâĿûÓÐÄÚÈݵģ¿
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070413/1a3f3ecb/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月13日 星期五 10:02

Zoom.Quiet zoom.quiet在gmail.com
星期五 四月 13 10:02:09 HKT 2007

On 4/13/07, jessinio smith <jessinio在gmail.com> wrote:
> 啄木鸟维基  我还不是很会用.为什么有一些文章只有题目没有内容的?
比如说?
如果的确没有内容的,那是作者只开了头没有完成而已,

维基,不是啄木鸟专门的,是流行MoinMoin 系统,最易用的一种维基系统;
不要学习,直接使用就好,
当然现在有个门槛,需要声明期望加入可信赖团队,才有编辑权限 -- 为了抵抗Spamer 们



-- 
'''Time is unimportant, only life important!
http://zoomquiet.org
blog在http://blog.zoomquiet.org/pyblosxom/
wiki在http://wiki.woodpecker.org.cn/moin/ZoomQuiet
scrap在http://floss.zoomquiet.org
douban在http://www.douban.com/people/zoomq/
____________________________________
Pls. use OpenOffice.org to replace M$ Office.
     http://zh.openoffice.org
Pls. use 7-zip to replace WinRAR/WinZip.
     http://7-zip.org/zh-cn/
You can get the truely Freedom 4 software.
'''

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月13日 星期五 10:24

jessinio smith jessinio在gmail.com
星期五 四月 13 10:24:51 HKT 2007

ÏÖÔÚ»¹Ã»ÓÐдºÃÎÄÕµÄÄÜÁ¦.

Ö»ÓÃblogдûÓдóÓÃµÄ±Ê¼Ç £º£©
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070413/22594483/attachment-0001.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月13日 星期五 11:01

Adieu adieu在adieu.cn
星期五 四月 13 11:01:42 HKT 2007

On 4/13/07, Zoom. Quiet <zoom.quiet在gmail.com> wrote:
>
> On 4/13/07, Adieu <adieu在adieu.cn> wrote:
> >
> unicodeµÄÎÊÌâ¿ÉÄÜÊÇÐÂÈ˶¼»áÓöµ½µÄÎÊÌ⣬ÎÒÇ°¶Îʱ¼äÒ²ÃÔãÁ˺ÃÒ»Õó¡£²»¹ÜÕâ´ÎÌÖÂ۵Ľá¹ûÊÇʲô£¬½¨ÒéÕûÀíÒ»·Ý¶«Î÷µ½wikiÖС£ÕâÑùÏ´ÎÓÐмÓÈëµÄÈËŪ²»Ã÷°×ÁË£¬´ó¼Ò¾Í¿ÉÒÔ˵£¬ÄãÏÈÈ¥wikiÉÏ¿´ÁËÔÙ¿´¿´ÓÐʲô²»Ã÷°×µÄÔÙÎÊ£¬Ð§Âʾ͸ßÁË¡£±ÜÃâÀÏ´óÃÇͬÑùµÄ»°ËµN´Î£¬ºÇºÇ¡£
> >
> ÊÇÒ²ºõ,¿ìËÙ×éÖ¯ÁËÒ»ÏÂ
> http://wiki.woodpecker.org.cn/moin/PythonicUnicode
>
> Æäʵ×ÄľÄñά»ùÖÐÓйØÎÄÕÂÊǺÜÓлýÀÛµÄ,
> ´ó¼Ò°ïæ¿´×ܽáµÄͼÆ×ÊÇ·ñ¹»ÓÃ?!


ZoomQÀÏ´óÕæÊÇÓÅÐãµÄÐж¯Õß°¡£¬Ïà±ÈÖ®ÏÂÎÒÕâ¸ö¹â˵²»Á·µÄ¾ÍºÜ²ÑÀ¢ÁË
²»¹ý»¹ºÃÎÒÒ²Óнè¿Ú£¬»¹Ã»×ÄľÄñµÄ±à¼­È¨ÏÞ£¬ºÇºÇ
ÀÏ´ó¿´µ½°ïÎÒ¿ªÒ»Ï°ɣ¬Óû§Ãû»¹ÊÇAdieu
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070413/e60f6691/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号