Python论坛  - 讨论区

标题:[python-chinese] python支持多少种编码

2006年11月27日 星期一 21:49

john john.about在gmail.com
星期一 十一月 27 21:49:19 HKT 2006

刚刚涉及到编码转换的问题,不知道这么说对不对.
1.首先问下,一个文件里有可能第一行是一种编码方法,第二行又是一种编码方法么?
有一个文件,全部decode就报错,去掉第一行就可以decode.
猜想第一行是一种编码方法,其它行又是另一种编码方法(utf16).
这个有可能么?

2.也是突然想到的.列出所有的编码方式(比如utf16,utf8,unicode,jp)
那么.
for i in (utf16,utf8,unicode,jp):
  try:
    str.decode(i)
    print i
  except:
    pass
这样就可以知道文件是用哪种方法编码的??

希望达人帮我解答啊~~
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20061127/776fb7ce/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]
cf

cf

2006年11月27日 星期一 22:33

cai feng caifen1985在gmail.com
星期一 十一月 27 22:33:30 HKT 2006

utf-8,utf-16等都有自己特殊的文件头。文件的头几个字节是专门用来标定编码类型的。各种编码都不一样,占的位数也不想同。
对于一个文件有多种编码,好像这种说法就不对吧。解码的函数一般都是查找特殊的几个字节来判断字节流所采用的编码方式的。


On 11/27/06, john <john.about在gmail.com> wrote:
> 刚刚涉及到编码转换的问题,不知道这么说对不对.
> 1.首先问下,一个文件里有可能第一行是一种编码方法,第二行又是一种编码方法么?
> 有一个文件,全部decode就报错,去掉第一行就可以decode.
> 猜想第一行是一种编码方法,其它行又是另一种编码方法(utf16).
> 这个有可能么?
>
> 2.也是突然想到的.列出所有的编码方式(比如utf16,utf8,unicode,jp)
> 那么.
> for i in (utf16,utf8,unicode,jp):
>   try:
>     str.decode(i)
>     print i
>   except:
>     pass
> 这样就可以知道文件是用哪种方法编码的??
>
> 希望达人帮我解答啊~~
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to
> python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to
> python-chinese-request在lists.python.cn
> Detail Info:
> http://python.cn/mailman/listinfo/python-chinese
>


-- 
蔡峰 Cai Feng

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月28日 星期二 10:50

大熊 bearsprite在gmail.com
星期二 十一月 28 10:50:35 HKT 2006

一般来说,文本文件中总是使用一个编码的,否则普通的文本编辑器是无法处理的,只能当作二进制处理

除非是你自己定义的文本格式,那随便你在里面放什么编码的文本

在06-11-27,john <john.about在gmail.com> 写道:
>
> 刚刚涉及到编码转换的问题,不知道这么说对不对.
> 1.首先问下,一个文件里有可能第一行是一种编码方法,第二行又是一种编码方法么?
> 有一个文件,全部decode就报错,去掉第一行就可以decode.
> 猜想第一行是一种编码方法,其它行又是另一种编码方法(utf16).
> 这个有可能么?
>
> 2.也是突然想到的.列出所有的编码方式(比如utf16,utf8,unicode,jp)
> 那么.
> for i in (utf16,utf8,unicode,jp):
>   try:
>     str.decode(i)
>     print i
>   except:
>     pass
> 这样就可以知道文件是用哪种方法编码的??
>
> 希望达人帮我解答啊~~
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



-- 
茫茫人海,你是我的最爱
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20061128/1b746ae9/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号