2006年11月27日 星期一 21:49
刚刚涉及到编码转换的问题,不知道这么说对不对. 1.首先问下,一个文件里有可能第一行是一种编码方法,第二行又是一种编码方法么? 有一个文件,全部decode就报错,去掉第一行就可以decode. 猜想第一行是一种编码方法,其它行又是另一种编码方法(utf16). 这个有可能么? 2.也是突然想到的.列出所有的编码方式(比如utf16,utf8,unicode,jp) 那么. for i in (utf16,utf8,unicode,jp): try: str.decode(i) print i except: pass 这样就可以知道文件是用哪种方法编码的?? 希望达人帮我解答啊~~ -------------- next part -------------- An HTML attachment was scrubbed... URL: http://python.cn/pipermail/python-chinese/attachments/20061127/776fb7ce/attachment.html
2006年11月27日 星期一 22:33
utf-8,utf-16等都有自己特殊的文件头。文件的头几个字节是专门用来标定编码类型的。各种编码都不一样,占的位数也不想同。 对于一个文件有多种编码,好像这种说法就不对吧。解码的函数一般都是查找特殊的几个字节来判断字节流所采用的编码方式的。 On 11/27/06, john <john.about在gmail.com> wrote: > 刚刚涉及到编码转换的问题,不知道这么说对不对. > 1.首先问下,一个文件里有可能第一行是一种编码方法,第二行又是一种编码方法么? > 有一个文件,全部decode就报错,去掉第一行就可以decode. > 猜想第一行是一种编码方法,其它行又是另一种编码方法(utf16). > 这个有可能么? > > 2.也是突然想到的.列出所有的编码方式(比如utf16,utf8,unicode,jp) > 那么. > for i in (utf16,utf8,unicode,jp): > try: > str.decode(i) > print i > except: > pass > 这样就可以知道文件是用哪种方法编码的?? > > 希望达人帮我解答啊~~ > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to > python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to > python-chinese-request在lists.python.cn > Detail Info: > http://python.cn/mailman/listinfo/python-chinese > -- 蔡峰 Cai Feng
2006年11月28日 星期二 10:50
一般来说,文本文件中总是使用一个编码的,否则普通的文本编辑器是无法处理的,只能当作二进制处理 除非是你自己定义的文本格式,那随便你在里面放什么编码的文本 在06-11-27,john <john.about在gmail.com> 写道: > > 刚刚涉及到编码转换的问题,不知道这么说对不对. > 1.首先问下,一个文件里有可能第一行是一种编码方法,第二行又是一种编码方法么? > 有一个文件,全部decode就报错,去掉第一行就可以decode. > 猜想第一行是一种编码方法,其它行又是另一种编码方法(utf16). > 这个有可能么? > > 2.也是突然想到的.列出所有的编码方式(比如utf16,utf8,unicode,jp) > 那么. > for i in (utf16,utf8,unicode,jp): > try: > str.decode(i) > print i > except: > pass > 这样就可以知道文件是用哪种方法编码的?? > > 希望达人帮我解答啊~~ > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -- 茫茫人海,你是我的最爱 -------------- 下一部分 -------------- 一个HTML附件被移除... URL: http://python.cn/pipermail/python-chinese/attachments/20061128/1b746ae9/attachment.htm
Zeuux © 2025
京ICP备05028076号