2008年01月22日 星期二 11:11
ßí¡£Ã÷°×ÁË¡£Ëµµ½µ×¾ÍÊÇJiahua˵µÄʶ±ð±àÂë¡£¼ÈÈ»²»ÄÜ×Ô¶¯Ê¶±ð¾ÍÊÖ¹¤À´°É£º£© 2008-01-22 fluke.l ·¢¼þÈË£º Shixin Zeng ·¢ËÍʱ¼ä£º 2008-01-22 10:57:41 ÊÕ¼þÈË£º python-chinese在lists.python.cn ³ËÍ£º Ö÷Ì⣺ Re: [python-chinese][OT]ÔÚWindowsÏÂBIG5¾´aµÄ·±ówÖÐÎÄÎļþ£¬ÓÐʲ÷áºÃµÄ·½°¸ ÄãÓ¦¸ÃÔÚ~/.vimrcÖÐÉèÖà set fileencodings=Big5, GBK, UTF-8 Ö®ºóÔÙ´ò¿ªÕâ¸öÎļþ¡£ ÄãÔÚ´ò¿ªÖ®ºóÔÙset fileencodingÊÇÉèÖÃÕâ¸öÎļþµÄÊä³ö±àÂ룬ÎÞ·¨¸Ä±äËüµÄÊäÈë±àÂë¡£ 2008/1/21 fluke.l <fluke.l在gmail.com>: > > > ÎÒÓÃvim´ò¿ªbig5ÎļþµÄʱºò£¬ÊÇÂÒÂ룬Ȼºóset > fileencodingΪbig5,²¢Ã»Óб仯£¬¹Ø±ÕµÄʱºòÌáʾÎļþÒѾ±»Ð޸ġ£ÎÒ¹À¼ÆºÍÎÒ֮ǰ˵µÄ¶Ôbig5ÔÙÖ´ÐÐÒ»´Îutf8->big5ÀàËÆ¡£ > > ÄãÈ·¶¨ÕâÑù×öÊÇ¿ÉÒÔµÄÂð£¿Òª²»ÎÒ·¢Ò»¸öbig5µÄÎļþÄãÊÔÊÔ? > > > > 2008-01-22 ________________________________ > > fluke.l ________________________________ > > ·¢¼þÈË£º Jiahua Huang > ·¢ËÍʱ¼ä£º 2008-01-22 10:32:50 > > ÊÕ¼þÈË£º python-chinese在lists.python.cn > ³ËÍ£º > Ö÷Ì⣺ Re: [python-chinese][OT]ÔÚWindowsÏÂBIG5¾´aµÄ·±ówÖÐÎÄÎļþ£¬ÓÐʲ÷áºÃµÄ·½°¸ > > > > ²»Òª¸ú mIRC ÄÇÑù°Ñ×ÖÌåºÍ±àÂë¸ã»ìÁË > > 2008/1/22 ´óÐÜ <bearsprite在gmail.com>: > > emeditorµÄÉèÖÃ[All Configure]->[File]->[Open > > Encoding]£¬¸Ä³ÉÄãÒªµÄ±àÂë¾ÍÐÐÁË¡£×ÖÌåÓ¦¸Ã²»ÓõÈÌرðÉèÖ㬲»¹ýBig5ÓÃMingLiu×Üû´í°É¡£ > > Èç¹û·¢ÏÖ´ò¿ªµÄÎļþ±àÂëÓÐÎÊÌ⣬¿ÉÒÔÊÖ¹¤ÔÚÓÒϽǵÄ״̬À¸´¦µÄ±àÂëÇøË«»÷£¬È»ºóÔÚµ¯³öµÄ²Ëµ¥ÖÐÑ¡ÔñÄãÒªµÄ±àÂ룬ºÜ·½±ãµÄ > > > > Windows ĬÈÏËÎÌ嶼ÊÇ°üº¬ÁË·±Ìå×ÖµÄ, > ¶øÇÒ¼´Ê¹²»°üº¬, Windows Ò²»á×Ô¶¯Ñ¡×Ö > > > vimÉÔ¼ÓÅäÖÃÒ²ÄÜ´ïµ½ÀàËƵÄЧ¹û£¬²»¹ýÒª°²×°²å¼þ£¬ÔÙ×÷Щ¶¨ÖÆ£¬Â鷳Щ > > > > vim ×Ô¼º¾ÍÄÜ×Ô¶¯Ê¶±ð±àÂë, Èç¹ûÄãû´ò¿ªµÄ»°, > ÔÚ .vimrc ¼ÓÉÏ > set fileencodings=utf-8,cp936,big5,euc-jp,euc-kr,latin1,ucs-bom > > ÊÖ¹¤ÉèÖñàÂëÊÇ > :set fileencoding=big5 > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- Best Regards Shixin Zeng _______________________________________________ python-chinese Post: send python-chinese在lists.python.cn Subscribe: send subscribe to python-chinese-request在lists.python.cn Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn Detail Info: http://python.cn/mailman/listinfo/python-chinese -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20080122/9a3e7444/attachment.html
2008年01月22日 星期二 11:12
当然是你的问题啦, 一个个说吧 2008/1/22 fluke.l <fluke.l at gmail.com>: > > > 按照你的说法,是不是说,在gtk下,默认的显示编码就是utf8,kde的是utf16,windows的我知道也是utf16, > > 我印象中,utf8和gbk或者big5的编码本身是不兼容的--不像gbk是兼容了gb2312的编码,只是增加了gb2312以外的内容。(现在讨论问题的问题不太严肃,就不去查资料了,上面说的都有可能有错。) > 这些编码都是转成 utf8 或 utf16 来处理的,你不会不知道转码吧 > 那么我在gedit下,如果使用的是en.utf8的locale(Jiahua你说和locale没关系),我试过默认情况下是不会识别出big5编码的,这个时候,我要怎么去选择让他知道这个是big5的文件呢? > 截图不是给你发了么, 打开文件对话框里边自己选编码, 要自动识别里加上的话, 打开 gconf-editor 注册表, 照着截图 http://paste.ubuntu.org.cn/i4893.png 修改 /apps/gedit-2/preferences/encodings/auto_detected 加上 自动探测编码 > 我记得(短时间内是不能再现这个情况了,因为我刚换机器,linux还没装)在这个时候,在gedit处选择另存为,文件编码的选项里面,默认是utf8(是不是可以说,他认为文件编码是utf8?),并且,这个时候,显示出来的是乱码的。当然我肯定这个是big5的文件,文件是我在繁体的环境下面写的,并且在香港朋友的服务器上面,他默认是繁体的网站上面显示正常并且浏览器默认识别的也是big5,apache发出的header里面是否有char的信息,我就忘记查了。 你必须打开的时候选择啊, 你都转码转错了,再解码有啥用 > > 这个时候不能选择用big5去保存,我试过存了以后,文件在big5的环境打开也是乱码的了,大概是因为gedit把这个big5的流,当作utf8,并且使用utf8->big5的算法来转换,所以就成了乱码了。 > 用 python 说吧, 装载的时候会试图 decode(enc), 保存的时候再 encode(enc), 你 decode 都错了,怎么指望 encode 能对 > locale,字体,内码等等问题,其实我自己都不太清楚,不管是不是因为这个问题,找时间研究一下,应该还是有好处的。 > 没必要, 这种"研究" 能玩出什么东西来, > 另外,简体windows > xp环境下,editplus打开一个big5的程序,也是和我说的gedit的情况类似,只是editplus默认的保存编码是ansi。 > 一样是你自己注意打开的时候选
2008年01月22日 星期二 11:14
你全做错了 fileencodings 是自动识别的编码 encoding 是文件打开的编码 fileencoding 是文件保存的编码, 另外,让你改 .vimrc 自动识别,硬是不肯改么? 加一行就一劳永逸的 2008/1/22 fluke.l <fluke.l at gmail.com>: > > > 我用vim打开big5文件的时候,是乱码,然后set > fileencoding 为big5,并没有变化,关闭的时候提示文件已经被修改。我估计和我之前说的对big5再执行一次utf8->big5类似。 > > 你确定这样做是可以的吗?要不我发一个big5的文件你试试? >
2008年01月22日 星期二 11:17
2008/1/22 大熊 <bearsprite at gmail.com>: > 在08-1-22,Jiahua Huang <jhuangjiahua at gmail.com> 写道: > > vim 自己就能自动识别编码, 如果你没打开的话, > > 在 .vimrc 加上 > > set fileencodings=utf-8,cp936,big5,euc-jp,euc-kr,latin1,ucs-bom > > 这样vim自动选择时会首先尝试简体中文,建议把big5移到前面 用不着, gvim 是依次测试, utf8 通不过就用下一个,直到 big5 > 考虑使用fencview插件,可以在菜单中动态指定文件的编码 > 只是菜单的话,简单写下 .gvimrc 就行了 譬如 an 20.4009 &Edit.-SEP6-;an 20.4009.10 &Edit.MouseStype.;&Xterm; :behave xterm an 20.4009.11 &Edit.MouseStype.;&MsWin; :behave mswin an 20.4119.10 &Edit.Fileencoding.;&GBK; :set fileencoding=gbk an 20.4119.11 &Edit.Fileencoding.GB18030; :set fileencoding=gb18030 an 20.4119.12 &Edit.Fileencoding.;&Big5; :set fileencoding=big5 an 20.4119.13 &Edit.Fileencoding.;&UTF-8; :set fileencoding=utf-8 an 20.4119.14 &Edit.Fileencoding.UTF-16; :set fileencoding=utf-16 an 20.4119.15 &Edit.Fileencoding.EUC-;&JP; :set fileencoding=euc-jp an 20.4119.16 &Edit.Fileencoding.EUC-;&KR; :set fileencoding=euc-kr
2008年01月22日 星期二 11:23
在08-1-22,Jiahua Huang <jhuangjiahua在gmail.com> 写道: > > 2008/1/22 大熊 <bearsprite在gmail.com>: > > 在08-1-22,Jiahua Huang <jhuangjiahua在gmail.com> 写道: > > > vim 自己就能自动识别编码, 如果你没打开的话, > > > 在 .vimrc 加上 > > > set fileencodings=utf-8,cp936,big5,euc-jp,euc-kr,latin1,ucs-bom > > > > 这样vim自动选择时会首先尝试简体中文,建议把big5移到前面 > > 用不着, gvim 是依次测试, > utf8 通不过就用下一个,直到 big5 某些情况下,繁体可以被正常识别成简体的,所以big5置前才有保证 > 考虑使用fencview插件,可以在菜单中动态指定文件的编码 > > > > 只是菜单的话,简单写下 .gvimrc 就行了 > > 譬如 > an 20.4009 &Edit.-SEP6-;> an 20.4009.10 &Edit.MouseStype.;&Xterm; :behave xterm > an 20.4009.11 &Edit.MouseStype.;&MsWin; :behave mswin > > an 20.4119.10 &Edit.Fileencoding.;&GBK; :set fileencoding=gbk > an 20.4119.11 &Edit.Fileencoding.GB18030; :set > fileencoding=gb18030 > an 20.4119.12 &Edit.Fileencoding.;&Big5; :set > fileencoding=big5 > an 20.4119.13 &Edit.Fileencoding.;&UTF-8; :set > fileencoding=utf-8 > an 20.4119.14 &Edit.Fileencoding.UTF-16; :set > fileencoding=utf-16 > an 20.4119.15 &Edit.Fileencoding.EUC-;&JP; :set > fileencoding=euc-jp > an 20.4119.16 &Edit.Fileencoding.EUC-;&KR; :set > fileencoding=euc-kr > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese 有现成的用岂不很好:) -- 茫茫人海,你是我的最爱 -------------- 下一部分 -------------- 一个HTML附件被移除... URL: http://python.cn/pipermail/python-chinese/attachments/20080122/d11584d6/attachment.htm
2008年01月22日 星期二 11:23
·¢¼þÈË£º Jiahua Huang ·¢ËÍʱ¼ä£º 2008-01-22 11:13:42 ÊÕ¼þÈË£º python-chinese在lists.python.cn ³ËÍ£º Ö÷Ì⣺ Re: [python-chinese][OT]ÔÚWindowsÏÂBIG5¾´aµÄ·±ówÖÐÎÄÎļþ£¬ÓÐʲ÷áºÃµÄ·½°¸ µ±È»ÊÇÄãµÄÎÊÌâÀ², Ò»¸ö¸ö˵°É 2008/1/22 fluke.l <fluke.l在gmail.com>: > > > °´ÕÕÄãµÄ˵·¨£¬ÊDz»ÊÇ˵£¬ÔÚgtkÏ£¬Ä¬ÈϵÄÏÔʾ±àÂë¾ÍÊÇutf8,kdeµÄÊÇutf16,windowsµÄÎÒÖªµÀÒ²ÊÇutf16£¬ > > ÎÒÓ¡ÏóÖУ¬utf8ºÍgbk»òÕßbig5µÄ±àÂë±¾ÉíÊDz»¼æÈݵÄ--²»ÏñgbkÊǼæÈÝÁËgb2312µÄ±àÂ룬ֻÊÇÔö¼ÓÁËgb2312ÒÔÍâµÄÄÚÈÝ¡£(ÏÖÔÚÌÖÂÛÎÊÌâµÄÎÊÌⲻ̫ÑÏË࣬¾Í²»È¥²é×ÊÁÏÁË£¬ÉÏÃæ˵µÄ¶¼ÓпÉÄÜÓÐ´í¡£) > ÕâЩ±àÂ붼ÊÇת³É utf8 »ò utf16 À´´¦ÀíµÄ,Äã²»»á²»ÖªµÀתÂë°É£¬ »¹ÕæµÄ²»ÖªµÀÎÒÒÔΪ·±ÌåµÄÄÚÂëÒªÓ÷±ÌåµÄÏà¹Øµ÷ÓÃÀ´ÏÔʾ£¬±ÈÈçÎÒÒÔΪ¿ÉÄÜÊÇÕâÑùµÄÇé¿ö£º ³ÌÐò -> µ÷Óûæͼ½Ó¿ÚÏÔʾ²Ëµ¥ºÍÎÄ×Ö -> »æͼ½Ó¿Ú°ÑÎÄ×ÖÓÃĬÈÏ»òÕßÔ¤¶¨µÄ±àÂëÀ´ÕÒµ½¶ÔÓ¦µÄ×ÖÌ壬±ÈÈçͬÑù 0x1234 Õâ¸ö±àÂ룬ҲÐíÔÚ²»Í¬µÄ×ÖÌåÌåϵÏÂÃ棬¶ÔÓ¦²»Í¬µÄ×Ö¡£ ->»æͼ½Ó¿Úµ÷ÓÃд×ֵĵ÷ÓÃÀ´¸ù¾Ý×ÖÌåÃè»æÎÄ×Ö µ±È»°¡£¬ÏÖÔÚÎÒ˵ʲô¶¼¶àÓ࣬ÒòΪÄãÒѾ˵Á˴𰸡£ÎÒ֮ǰûÓÐÁ˽âϵͳÕâ·½ÃæµÄÔÀí£¬ÓÐÕâÑùµÄ²Â²âÎÒÏëÒ²²»Îª¹ý°Ñ¡£ > ÄÇôÎÒÔÚgeditÏ£¬Èç¹ûʹÓõÄÊÇen.utf8µÄlocale(JiahuaÄã˵ºÍlocaleû¹Øϵ)£¬ÎÒÊÔ¹ýĬÈÏÇé¿öÏÂÊDz»»áʶ±ð³öbig5±àÂëµÄ£¬Õâ¸öʱºò£¬ÎÒÒªÔõôȥѡÔñÈÃËûÖªµÀÕâ¸öÊÇbig5µÄÎļþÄØ£¿ > ½Øͼ²»ÊǸøÄã·¢ÁËô, ´ò¿ªÎļþ¶Ô»°¿òÀï±ß×Ô¼ºÑ¡±àÂë, Òª×Ô¶¯Ê¶±ðÀï¼ÓÉϵĻ°, ´ò¿ª gconf-editor ×¢²á±í, ÕÕ׎Øͼ http://paste.ubuntu.org.cn/i4893.png ÐÞ¸Ä /apps/gedit-2/preferences/encodings/auto_detected ¼ÓÉÏ ×Ô¶¯Ì½²â±àÂë Õâ¸öûÓÐÉèÖùý£¬²»¹ýÎҼǵÃgeditÊÇĬÈÏ¿ªÁË×Ô¶¯Ì½²âµÄ£¬²¢ÇÒ£¬´ò¿ªÎļþµÄʱºò£¬Ã²ËÆûÓÐÑ¡ÔñÎļþ±àÂëµÄÑ¡ÏֻÓб£´æ±àÂë¡£ËùÒÔÎÒ²ÅÐèÒªÉèÖÃlocaleÈÃgeditÓÃĬÈϵÄlocaleÀ´ÈÏÒ»ÏÂÎļþ±àÂë¡£ > ÎҼǵ㨶Ìʱ¼äÄÚÊDz»ÄÜÔÙÏÖÕâ¸öÇé¿öÁË£¬ÒòΪÎÒ¸Õ»»»úÆ÷£¬linux»¹Ã»×°£©ÔÚÕâ¸öʱºò£¬ÔÚgedit´¦Ñ¡ÔñÁí´æΪ£¬Îļþ±àÂëµÄÑ¡ÏîÀïÃ棬ĬÈÏÊÇutf8£¨ÊDz»ÊÇ¿ÉÒÔ˵£¬ËûÈÏΪÎļþ±àÂëÊÇutf8?£©£¬²¢ÇÒ£¬Õâ¸öʱºò£¬ÏÔʾ³öÀ´µÄÊÇÂÒÂëµÄ¡£µ±È»Îҿ϶¨Õâ¸öÊÇbig5µÄÎļþ£¬ÎļþÊÇÎÒÔÚ·±ÌåµÄ»·¾³ÏÂÃæдµÄ£¬²¢ÇÒÔÚÏã¸ÛÅóÓѵķþÎñÆ÷ÉÏÃ棬ËûĬÈÏÊÇ·±ÌåµÄÍøÕ¾ÉÏÃæÏÔʾÕý³£²¢ÇÒä¯ÀÀÆ÷ĬÈÏʶ±ðµÄÒ²ÊÇbig5,apache·¢³öµÄheaderÀïÃæÊÇ·ñÓÐcharµÄÐÅÏ¢£¬ÎÒ¾ÍÍü¼Ç²éÁË¡£ Äã±ØÐë´ò¿ªµÄʱºòÑ¡Ôñ°¡, Ä㶼תÂëת´íÁË,ÔÙ½âÂëÓÐɶÓà > > Õâ¸öʱºò²»ÄÜÑ¡ÔñÓÃbig5È¥±£´æ£¬ÎÒÊÔ¹ý´æÁËÒÔºó£¬ÎļþÔÚbig5µÄ»·¾³´ò¿ªÒ²ÊÇÂÒÂëµÄÁË£¬´ó¸ÅÊÇÒòΪgedit°ÑÕâ¸öbig5µÄÁ÷£¬µ±×÷utf8£¬²¢ÇÒʹÓÃutf8->big5µÄËã·¨À´×ª»»£¬ËùÒԾͳÉÁËÂÒÂëÁË¡£ > Óà python ˵°É, ×°ÔصÄʱºò»áÊÔͼ decode(enc), ±£´æµÄʱºòÔÙ encode(enc), Äã decode ¶¼´íÁË,ÔõôָÍû encode ÄÜ¶Ô Õâ¸öÃ÷°×ÁË£¬Ð»Ð» > locale£¬×ÖÌ壬ÄÚÂëµÈµÈÎÊÌ⣬ÆäʵÎÒ×Ô¼º¶¼²»Ì«Çå³þ£¬²»¹ÜÊDz»ÊÇÒòΪÕâ¸öÎÊÌ⣬ÕÒʱ¼äÑо¿Ò»Ï£¬Ó¦¸Ã»¹ÊÇÓкô¦µÄ¡£ > û±ØÒª, ÕâÖÖ"Ñо¿" ÄÜÍæ³öʲô¶«Î÷À´, > ÁíÍ⣬¼òÌåwindows > xp»·¾³Ï£¬editplus´ò¿ªÒ»¸öbig5µÄ³ÌÐò£¬Ò²ÊǺÍÎÒ˵µÄgeditµÄÇé¿öÀàËÆ£¬Ö»ÊÇeditplusĬÈϵı£´æ±àÂëÊÇansi¡£ > Ò»ÑùÊÇÄã×Ô¼º×¢Òâ´ò¿ªµÄʱºòÑ¡ _______________________________________________ python-chinese Post: send python-chinese在lists.python.cn Subscribe: send subscribe to python-chinese-request在lists.python.cn Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn Detail Info: http://python.cn/mailman/listinfo/python-chinese -------------- 下一部分 -------------- Ò»¸öHTML¸½¼þ±»ÒƳý... URL: http://python.cn/pipermail/python-chinese/attachments/20080122/e042a9a9/attachment.html
2008年01月22日 星期二 11:38
2008/1/22 fluke.l <fluke.l at gmail.com>: > > 这个没有设置过,不过我记得gedit是默认开了自动探测的,并且,打开文件的时候,貌似没有选择文件编码的选项,只有保存编码。所以我才需要设置locale让gedit用默认的locale来认一下文件编码。 > > 默认是有自动探测,但是都要探测哪些编码呢? 这需要你自己加上自动探测的编码范围, 所以让你在自动探测里边加上 big5, gb18030 这些. gedit 打开的时候没有选编码? 看这个截图 http://paste.ubuntu.org.cn/i4892.png 就是打开文件对话框里边的
2008年01月22日 星期二 11:39
待会, gedit 需要你在 gedit 里 点 打开 ,才会有文件对话框,( 想必 Windows 程序也是一样吧) 而不是在 资源管理器里 双击 打开文本. 再,或者你的 gedit 是旧版本,不支持多编码? 2008/1/22 Jiahua Huang <jhuangjiahua at gmail.com>: > 2008/1/22 fluke.l <fluke.l at gmail.com>: > > > > 这个没有设置过,不过我记得gedit是默认开了自动探测的,并且,打开文件的时候,貌似没有选择文件编码的选项,只有保存编码。所以我才需要设置locale让gedit用默认的locale来认一下文件编码。 > > > > > > 默认是有自动探测,但是都要探测哪些编码呢? > 这需要你自己加上自动探测的编码范围, > 所以让你在自动探测里边加上 big5, gb18030 这些. > > > gedit 打开的时候没有选编码? > 看这个截图 http://paste.ubuntu.org.cn/i4892.png 就是打开文件对话框里边的 >
Zeuux © 2024
京ICP备05028076号