2007年11月01日 星期四 12:38
我在用一个商用词库进行比对,像这种"变巨"无意义的词汇,就会认为是转译错了。 不过这个真正在联机系统里面用起来,资源消耗肯定是惊人的。 在07-10-30,Samuel Chi <princeofdatamining在gmail.com> 写道: > > 可以猜,但是没办法肯定,尤其是对gbk和big5. > 比如: > >>> print '变巨'.decode('big5') > 曹操 > >>> print '变巨'.decode('gbk') > 变巨 > > > 在07-10-30, Kevin anew <kevinanew在gmail.com> 写道: > > > > 有没有办法可以知道一串字符串是用什么编码的,或者直接转成unicode的方法也可以。 > > _______________________________________________ > > python-chinese > > Post: send python-chinese在lists.python.cn > > Subscribe: send subscribe to python-chinese-request在lists.python.cn > > Unsubscribe: send unsubscribe to > > python-chinese-request在lists.python.cn > > Detail Info: http://python.cn/mailman/listinfo/python-chinese > > > > > _______________________________________________ > python-chinese > Post: send python-chinese在lists.python.cn > Subscribe: send subscribe to python-chinese-request在lists.python.cn > Unsubscribe: send unsubscribe to python-chinese-request在lists.python.cn > Detail Info: http://python.cn/mailman/listinfo/python-chinese > -------------- 下一部分 -------------- 一个HTML附件被移除... URL: http://python.cn/pipermail/python-chinese/attachments/20071101/537534a3/attachment.htm
Zeuux © 2025
京ICP备05028076号