Python论坛  - 讨论区

标题:[python-chinese] 如何判断一段str的编码格式?

2007年11月01日 星期四 12:38

yuan xuan xuanyuan14.leo在gmail.com
星期四 十一月 1 12:38:14 HKT 2007

我在用一个商用词库进行比对,像这种"变巨"无意义的词汇,就会认为是转译错了。
不过这个真正在联机系统里面用起来,资源消耗肯定是惊人的。

在07-10-30,Samuel Chi <princeofdatamining在gmail.com> 写道:
>
> 可以猜,但是没办法肯定,尤其是对gbk和big5.
> 比如:
> >>> print '变巨'.decode('big5')
> 曹操
> >>> print '变巨'.decode('gbk')
> 变巨
>
>
> 在07-10-30, Kevin anew <kevinanew在gmail.com> 写道:
> >
> > 有没有办法可以知道一串字符串是用什么编码的,或者直接转成unicode的方法也可以。
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to
> > python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> >
>
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20071101/537534a3/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号