2007年04月09日 星期一 16:27
Èç¹ûÊÇÁ½¸ö×Ö·ûµÄ£¬ËüÔõôÄܱíʾËùÓеĺº×ÖÄØ£¿ Èç¹ûÊDZ䳤µÄ£¬ÓÖÔõô֪µÀ³¤¶ÈÄØ£¿£¨²»Ïñutf8Óз½·¨µÄ£© -- ×¢ÒâÉíÌ壬ÉíÌåÊǸïÃüµÄ±¾Ç®£¡£¡ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/35375c0f/attachment.html
2007年04月09日 星期一 16:34
unicode是字符集,utf8是编码。 不对应的吧? On 4/9/07, jessinio smith <jessinio在gmail.com> wrote: > > 如果是两个字符的,它怎么能表示所有的汉字呢? > > 如果是变长的,又怎么知道长度呢?(不像utf8有方法的) > > -- > 注意身体,身体是革命的本钱!! > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -------------- 下一部分 -------------- 一个HTML附件被移除... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/17b0773e/attachment.htm
2007年04月09日 星期一 16:37
Unicode对象内部是如何表达的,作为用户来说没有必要关心。一个汉字的长度就是1。 jessinio smith 写道: > 如果是两个字符的,它怎么能表示所有的汉字呢? > > 如果是变长的,又怎么知道长度呢?(不像utf8有方法的) > > -- > 注意身体,身体是革命的本钱!! > ------------------------------------------------------------------------ > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -- 大管家网上建材超市 装修买建材 上网找大管家 http://www.homemaster.cn Tel: 0086-21-34240987 Fax: 0086-21-64692422
2007年04月09日 星期一 16:38
ÎÒ²»Àí½âѽ¡£ On 4/9/07, Shao Feng <sevenever在gmail.com> wrote: > > unicodeÊÇ×Ö·û¼¯£¬utf8ÊDZàÂë¡£ > ²»¶ÔÓ¦µÄ°É£¿ > > On 4/9/07, jessinio smith <jessinio在gmail.com> wrote: > > > Èç¹ûÊÇÁ½¸ö×Ö·ûµÄ£¬ËüÔõôÄܱíʾËùÓеĺº×ÖÄØ£¿ > > > > Èç¹ûÊDZ䳤µÄ£¬ÓÖÔõô֪µÀ³¤¶ÈÄØ£¿£¨²»Ïñutf8Óз½·¨µÄ£© > > > > -- > > ×¢ÒâÉíÌ壬ÉíÌåÊǸïÃüµÄ±¾Ç®£¡£¡ > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request在lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- ×¢ÒâÉíÌ壬ÉíÌåÊǸïÃüµÄ±¾Ç®£¡£¡ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/a0d10654/attachment.html
2007年04月09日 星期一 16:42
unicode是编码,它有utf-8,utf-16,utf-32的编码,咋们用utf-8比较多 On Mon, Apr 09, 2007 at 04:38:37PM +0800, jessinio smith wrote: > 我不理解呀。 > > On 4/9/07, Shao Feng <sevenever在gmail.com> wrote: > > unicode是字符集,utf8是编码。 > 不对应的吧? > > On 4/9/07, jessinio smith < jessinio在gmail.com> wrote: > > 如果是两个字符的,它怎么能表示所有的汉字呢? > > 如果是变长的,又怎么知道长度呢?(不像utf8有方法的) > > -- > 注意身体,身体是革命的本钱!! > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > -- > 注意身体,身体是革命的本钱!! > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -------------- 下一部分 -------------- 一个非文本附件被清除... 发信人: %(who)s 主题: %(subject)s 日期: %(date)s 大小: 189 Url: http://python.cn/pipermail/python-chinese/attachments/20070409/be016def/attachment-0001.pgp
2007年04月09日 星期一 16:50
http://www.cl.cam.ac.uk/~mgk25/unicode.html On 4/9/07, Hong Yuan <hongyuan在homemaster.cn> wrote: > > Unicode对象内部是如何表达的,作为用户来说没有必要关心。一个汉字的长度就是1。 > > jessinio smith 写道: > > 如果是两个字符的,它怎么能表示所有的汉字呢? > > > > 如果是变长的,又怎么知道长度呢?(不像utf8有方法的) > > > > -- > > 注意身体,身体是革命的本钱!! > > ------------------------------------------------------------------------ > > > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > -- > > 大管家网上建材超市 > 装修买建材 上网找大管家 > http://www.homemaster.cn > Tel: 0086-21-34240987 > Fax: 0086-21-64692422 > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese -------------- 下一部分 -------------- 一个HTML附件被移除... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/39adef64/attachment.html
2007年04月09日 星期一 16:53
On 4/9/07, jessinio smith <jessinio在gmail.com> wrote: > 如果是两个字符的,它怎么能表示所有的汉字呢? > > 如果是变长的,又怎么知道长度呢?(不像utf8有方法的) unicode是字符集,并不是一种编码,而我们说几个字节是指某一种编码下字符所占的字符数。 我之前在列表中转发过一篇文章的: http://boodebr.org/main/python/all-about-python-and-unicode -- Best Regards, Leo Jay
2007年04月09日 星期一 16:54
oho,写错一个字,应该是: 我们说几个字节是指某一种编码下字符所占的字节数。 -- Best Regards, Leo Jay
2007年04月09日 星期一 17:05
ÊDz»ÊÇÕâÑù£º s = u'Áº' #Ö¸¶¨SÊÇunicode×Ö·û¼¯¡£µ«ÊÇËüÔÚÄÚ´æÖÐÊÇÒÔutf8ÐÎʽ´æÔÚ ÊDz»ÊÇÕâÑù£¿£¿ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/9ab20b4e/attachment.htm
2007年04月09日 星期一 17:07
˵Ã÷°×µã ÊDz»ÊÇÕâÑù£º s = u'Áº' #Ö¸¶¨SÊÇunicode×Ö·û¼¯¡£µ«ÊÇËüµÄ×Ö·ûÂ루unicode±íÖÐ"Áº"µÄijһÊý×Ö£©ÔÚÄÚ´æÖÐÊÇÒÔutf8ÐÎʽ´æÔÚÊDz»ÊÇÕâÑù£¿£¿ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/7e84a9f6/attachment.html
2007年04月09日 星期一 18:23
unicode 本身并不规定一个字符如何在机器中表示,或者说不规定一个字符占几个字节。 python 的 unicode 对象和 python 的 string 也完全不同,它不以某种特定的编码保存字符串,所以 unicode 对象也不能像 string 那样当作字节流来用,你要进行传输的话,必须以某种编码转换成string先!print 一个unicode对象时,实际上是用系统默认编码自动进行转换了。 这篇文章讲得很清楚: http://boodebr.org/main/python/all-about-python-and-unicode On 4/9/07, jessinio smith <jessinio at gmail.com> wrote: > > 说明白点 > 是不是这样: > s = u'梁' #指定S是unicode字符集。但是它的字符码(unicode表中"梁"的某一数字)在内存中是以utf8形式存在 是不是这样?? > > > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- http://codeplayer.blogspot.com/ -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/a1e58eda/attachment.htm
2007年04月09日 星期一 18:55
unicodeÊÇ×Ö·û¼¯£¬´ú±íµÄÊÇ×Ö·û±¾Éí£¬¿ÉÒÔ°ÑËü¿´×÷ÊÇÒ»¸öµãÕó±íʾ£¬²»¹ýÄã¿ÉÒÔÓÃÒ»¸öÊý×ÖÀ´ÒýÓ㬠uft-8µÈÊDZàÂ뼯£¬¹¹ÔìÒ»¸ö×Ö·û±¾ÉíÓë¶þ½øÖÆÂëÖ®¼äµÄÓ³Éä¹Øϵ¡£ ÒòΪÊý¾ÝµÄ´æ´¢Óë´«Ê䶼ÊÇÒÔ¶þ½øÖƵķ½Ê½½øÐеģ¬ËùÒÔ²»ÄÜÖ±½Ó´æ´¢»ò´«Êäunicode±¾Éí£¬ÄÇΪʲô²»ÓÃunicodeµÄÊý×ÖÒýÓÃÀ´´æ´¢Óë´«ÊäÄØ£¬ÊÇÒòΪunicode×Ö·û¼¯±íÖаüÀ¨ÁËÊÀ½çÉϼ¸ºõËùÓеÄÊý×Ö×Ö·û£¬ÒªÓÃ4¸ö×Ö½Ú²ÅÄÜÒýÓÃËùÓУ¬¶ø±àÂë¿ÉÒÔ´ó´óѹËõÊý¾ÝÁ¿£¬ÒòΪ¶ÔÓÚ²»Í¬µØÇøµÄÈ˶øÑÔ£¬Óõ½µÄÖ»ÊÇunicodeµÄÒ»¸ö×Ó¼¯£¬¶ÔÕâÒ»×Ó¼¯×÷±àÂëÓ³Éä¼´¿É¡£ ÔÚ07-4-9£¬»ÆÒã <yi.codeplayer在gmail.com> дµÀ£º > > unicode ±¾Éí²¢²»¹æ¶¨Ò»¸ö×Ö·ûÈçºÎÔÚ»úÆ÷Öбíʾ£¬»òÕß˵²»¹æ¶¨Ò»¸ö×Ö·ûÕ¼¼¸¸ö×Ö½Ú¡£ > python µÄ unicode ¶ÔÏóºÍ python µÄ string Ò²ÍêÈ«²»Í¬£¬Ëü²»ÒÔijÖÖÌض¨µÄ±àÂë±£´æ×Ö·û´®£¬ËùÒÔ unicode > ¶ÔÏóÒ²²»ÄÜÏñ string ÄÇÑùµ±×÷×Ö½ÚÁ÷À´Óã¬ÄãÒª½øÐд«ÊäµÄ»°£¬±ØÐëÒÔijÖÖ±àÂëת»»³ÉstringÏÈ£¡print > Ò»¸öunicode¶ÔÏóʱ£¬Êµ¼ÊÉÏÊÇÓÃϵͳĬÈϱàÂë×Ô¶¯½øÐÐת»»ÁË¡£ > > ÕâƪÎÄÕ½²µÃºÜÇå³þ£º http://boodebr.org/main/python/all-about-python-and-unicode > > > On 4/9/07, jessinio smith <jessinio在gmail.com> wrote: > > > > ˵Ã÷°×µã > > ÊDz»ÊÇÕâÑù£º > > s = u'Áº' #Ö¸¶¨SÊÇunicode×Ö·û¼¯¡£µ«ÊÇËüµÄ×Ö·ûÂ루unicode±íÖÐ"Áº"µÄijһÊý×Ö£©ÔÚÄÚ´æÖÐÊÇÒÔutf8ÐÎʽ´æÔÚÊDz»ÊÇÕâÑù£¿£¿ > > > > > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request在lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > > -- > http://codeplayer.blogspot.com/ > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/fba90f3d/attachment.html
2007年04月09日 星期一 19:17
ÒªÓÃ4¸ö×Ö½Ú²ÅÄÜÒýÓÃËùÓÐ Õâ¸ö¾ÍÊÇÎÒÕæÕýÏëÖªµÀµÄ¡£ÎªÊ²Ã´ÎÒÃÇƽ³£¶¼ËµunicodeÊÇÁ½¸ö×Ö½Ú£¿£¬ÄѵÀÊÇÄã˵µÄÖ»ÊÇunicodeµÄÒ»¸ö×Ó¼¯£¿£¿ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/7ddf5e38/attachment.htm
2007年04月09日 星期一 19:33
unicodeµÄÍêÈ«ÒýÓÃÊÇËÄ×ֽڵģ¬¾³£¿´µ½µÄuXXXXÁ½×Ö½Úд·¨ÊÇÒòΪǰÃ涼ÊÇ0ºöÂÔµô¡£ ÔÚ07-4-9£¬jessinio smith <jessinio在gmail.com> дµÀ£º > > ÒªÓÃ4¸ö×Ö½Ú²ÅÄÜÒýÓÃËùÓÐ > > Õâ¸ö¾ÍÊÇÎÒÕæÕýÏëÖªµÀµÄ¡£ÎªÊ²Ã´ÎÒÃÇƽ³£¶¼ËµunicodeÊÇÁ½¸ö×Ö½Ú£¿£¬ÄѵÀÊÇÄã˵µÄ Ö»ÊÇunicodeµÄÒ»¸ö×Ó¼¯£¿£¿ > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/6f3f20c3/attachment.html
2007年04月09日 星期一 19:44
unicodeÊÇËÄλµÄ¾Í¿ÉÒÔ±íʾȫÊÀ½çµÄÎÄ×ÖÁË¡£ ллÁË¡£ÖÕÓÚÃ÷°×¡£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/f8a55716/attachment.htm
2007年04月09日 星期一 19:57
˵²»¶¨ÒÔºóΪÁËÊÊÓ¦ÓîÖæ±àÂ룬±ä³É°ËλÄØ£¿ ÔÚ07-4-9£¬jessinio smith <jessinio在gmail.com> дµÀ£º > > unicodeÊÇËÄλµÄ¾Í¿ÉÒÔ±íʾȫÊÀ½çµÄÎÄ×ÖÁË¡£ > > ллÁË¡£ÖÕÓÚÃ÷°×¡£ > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/102b796f/attachment.htm
2007年04月09日 星期一 20:09
²»»á°É¡£2^32ÓÐÊ®ÒÚÁË¡£ ÍâÐÇÈ˵ÄÎÄ×ÖÏñÓ¢ÎÄÒ»Ñù£¬ÓÉ»ù±¾ÎÄ×Ö×é³ÉµÄ¾ÍÐÐÁË¡£ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/d040e97a/attachment.html
2007年04月09日 星期一 20:14
unicode是一种字符的编码方式,他是变长的。 通过首码和尾码的范围系统就知道一个编码的长度了。 utf-8是unicode translation,本质上,utf是一种使用unicode的方法,主要目的是为了保持unicode和unicode以前编码系统的兼容性。 utf-8定义了一种区间规则来转换unicode,utf-16其实就是unicode,utf-32就是定长的unicode。 On 4/9/07, jessinio smith <jessinio at gmail.com> wrote: > > 如果是两个字符的,它怎么能表示所有的汉字呢? > > 如果是变长的,又怎么知道长度呢?(不像utf8有方法的) > > -- > 注意身体,身体是革命的本钱!! > _______________________________________________ > python-chinese > Post: send python-chinese at lists.python.cn > Subscribe: send subscribe to python-chinese-request at lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request at lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- "No More" Mark's Blog @ www.throughworks.com -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/3a060827/attachment.html
2007年04月09日 星期一 20:23
Â¥ÉÏ˵µÄʹÎÒÑÛÇ°Ò»ÁÁ£¡ ºÍÇ°ÃæµÄ´óΪ²»Í¬ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070409/1c3c2fe6/attachment.html
2007年04月10日 星期二 08:55
以前对UNICODE和UTF-8的关系比较模糊,现在浏览大家的说法,又犯迷糊了。 看书、看书,查资料,彻底弄懂它。
2007年04月10日 星期二 09:02
ÎÒ»¹ÊÇÏàÐÅ ¹ùµ¤ µÄ˵·¨ -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20070410/75a9cc89/attachment.html
Zeuux © 2025
京ICP备05028076号