Python论坛  - 讨论区

标题:[python-chinese] Re: 有关字符编码的问题

2005年09月14日 星期三 21:26

gyb tension tensiongyb at gmail.com
Wed Sep 14 21:26:42 HKT 2005

就是这个意思,

在python下如何做同样的事情呢?
怎么把中文转化为unicode.

On 9/14/05, NI ZhengGang <ni at twinisa.com> wrote:
> 应该是把中文转换为Unicode吧?
> 在php下面做过这个事情,可以参考一下
> 
> http://chinaunix.net/jh/13/386011.html
> 
> -----Original Message-----
> From: python-chinese-bounces at lists.python.cn
> [mailto:python-chinese-bounces at lists.python.cn] On Behalf Of Qiangning Hong
> Sent: 2005年9月14日 21:04
> To: python-chinese at lists.python.cn
> Subject: Re: [python-chinese] 有关字符编码的问题
> 
> gyb tension wrote:
> > 我用mplayer想播放在线电影,但mplayer不支持中文名的电影。
> > 我想写一个脚本用来把中文改变成别的编码,让mplayer来播放。
> > 但我看了半天以前的邮件也没弄明白,所以想请教一下有关编码的问题。
> > 用什么方法呢?
> 
> 你测试用的电影URL是什么?我看看能不能帮上你的忙
> 
> -- 
> Qiangning Hong
> http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> 
> Registered Linux User #396996
> Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> Thunderbird! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 21:38

张骏 zhangj at foreseen-info.com
Wed Sep 14 21:38:41 HKT 2005

>>> a = 'aaaz中文'
>>> b = a.decode( 'gbk' ).encode( 'utf8' )
>>> import urllib
>>> url = urllib.quote( b )
>>> url
'aaaz%E4%B8%AD%E6%96%87'

----------------------- Original Message -----------------------
From:    gyb tension <tensiongyb at gmail.com>
To:      python-chinese at lists.python.cn
Date:    Wed, 14 Sep 2005 09:26:42 -0400
Subject: [python-chinese] Re: 有关字符编码的问题
----------------------------------------------------------------
> 就是这个意思,
> > $inString=$_GET["aaaa"];
> $inString=urlencode(iconv( 'gb2312', 'utf-8', $inString ));
> $inString=str_replace("%3A",":",$inString);
> $inString=str_replace("%2F","/",$inString);
> echo $inString;
> ?>
> 在python下如何做同样的事情呢?
> 怎么把中文转化为unicode.
> 
> On 9/14/05, NI ZhengGang <ni at twinisa.com> wrote:
> > 应该是把中文转换为Unicode吧?
> > 在php下面做过这个事情,可以参考一下
> > 
> > http://chinaunix.net/jh/13/386011.html
> > 
> > -----Original Message-----
> > From: python-chinese-bounces at lists.python.cn
> > [mailto:python-chinese-bounces at lists.python.cn] On Behalf Of Qiangning Hong
> > Sent: 2005年9月14日 21:04
> > To: python-chinese at lists.python.cn
> > Subject: Re: [python-chinese] 有关字符编码的问题
> > 
> > gyb tension wrote:
> > > 我用mplayer想播放在线电影,但mplayer不支持中文名的电影。
> > > 我想写一个脚本用来把中文改变成别的编码,让mplayer来播放。
> > > 但我看了半天以前的邮件也没弄明白,所以想请教一下有关编码的问题。
> > > 用什么方法呢?
> > 
> > 你测试用的电影URL是什么?我看看能不能帮上你的忙
> > 
> > -- 
> > Qiangning Hong
> > http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> > 
> > Registered Linux User #396996
> > Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> > Thunderbird! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> > _______________________________________________
> > python-chinese list
> > python-chinese at lists.python.cn
> > http://python.cn/mailman/listinfo/python-chinese
> >

--------------------- Original Message Ends --------------------


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 21:47

gyb tension tensiongyb at gmail.com
Wed Sep 14 21:47:08 HKT 2005

On 9/14/05, 张骏 <zhangj at foreseen-info.com> wrote:
> >>> a = 'aaaz中文'
> >>> b = a.decode( 'gbk' ).encode( 'utf8' )

>>> b =a.decode('gbk').encode('utf8')#'utf-8'?也不行
Traceback (most recent call last):
  File "", line 1, in ?
LookupError: unknown encoding

> >>> import urllib
> >>> url = urllib.quote( b )
> >>> url
> 'aaaz%E4%B8%AD%E6%96%87'
> 
> ----------------------- Original Message -----------------------
> From:    gyb tension <tensiongyb at gmail.com>
> To:      python-chinese at lists.python.cn
> Date:    Wed, 14 Sep 2005 09:26:42 -0400
> Subject: [python-chinese] Re: 有关字符编码的问题
> ----------------------------------------------------------------
> > 就是这个意思,
> > > > $inString=$_GET["aaaa"];
> > $inString=urlencode(iconv( 'gb2312', 'utf-8', $inString ));
> > $inString=str_replace("%3A",":",$inString);
> > $inString=str_replace("%2F","/",$inString);
> > echo $inString;
> > ?>
> > 在python下如何做同样的事情呢?
> > 怎么把中文转化为unicode.
> > 
> > On 9/14/05, NI ZhengGang <ni at twinisa.com> wrote:
> > > 应该是把中文转换为Unicode吧?
> > > 在php下面做过这个事情,可以参考一下
> > > 
> > > http://chinaunix.net/jh/13/386011.html
> > > 
> > > -----Original Message-----
> > > From: python-chinese-bounces at lists.python.cn
> > > [mailto:python-chinese-bounces at lists.python.cn] On Behalf Of Qiangning
> Hong
> > > Sent: 2005年9月14日 21:04
> > > To: python-chinese at lists.python.cn
> > > Subject: Re: [python-chinese] 有关字符编码的问题
> > > 
> > > gyb tension wrote:
> > > > 我用mplayer想播放在线电影,但mplayer不支持中文名的电影。
> > > > 我想写一个脚本用来把中文改变成别的编码,让mplayer来播放。
> > > > 但我看了半天以前的邮件也没弄明白,所以想请教一下有关编码的问题。
> > > > 用什么方法呢?
> > > 
> > > 你测试用的电影URL是什么?我看看能不能帮上你的忙
> > > 
> > > -- 
> > > Qiangning Hong
> > > http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> > > 
> > > Registered Linux User #396996
> > > Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> > > Thunderbird!
> <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> > > _______________________________________________
> > > python-chinese list
> > > python-chinese at lists.python.cn
> > > http://python.cn/mailman/listinfo/python-chinese
> > >
> 
> --------------------- Original Message Ends --------------------
> 
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 22:00

Qiangning Hong hongqn at gmail.com
Wed Sep 14 22:00:51 HKT 2005

gyb tension wrote:
> On 9/14/05, 张骏 <zhangj at foreseen-info.com> wrote:
> 
>>>>>a = 'aaaz中文'
>>>>>b = a.decode( 'gbk' ).encode( 'utf8' )
> 
> 
>>>>b =a.decode('gbk').encode('utf8')#'utf-8'?也不行
> 
> Traceback (most recent call last):
>   File "", line 1, in ?
> LookupError: unknown encoding

你是python2.3吧?装cjkcodecs,或者python2.4,不然没有gbk编码。
或者用cp936

-- 
Qiangning Hong
http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)

Registered Linux User #396996
Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
Thunderbird! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 22:03

张骏 zhangj at foreseen-info.com
Wed Sep 14 22:03:02 HKT 2005

你是什么版本的python?
尽可能升级2.4吧,2.3可能需要装ckjcodec
----------------------- Original Message -----------------------
From:    gyb tension <tensiongyb at gmail.com>
To:      python-chinese at lists.python.cn
Date:    Wed, 14 Sep 2005 09:47:08 -0400
Subject: [python-chinese] Re: 有关字符编码的问题
----------------------------------------------------------------
> On 9/14/05, 张骏 <zhangj at foreseen-info.com> wrote:
> > >>> a = 'aaaz中文'
> > >>> b = a.decode( 'gbk' ).encode( 'utf8' )
> 
> >>> b =a.decode('gbk').encode('utf8')#'utf-8'?也不行
> Traceback (most recent call last):
>   File "", line 1, in ?
> LookupError: unknown encoding
> 
> > >>> import urllib
> > >>> url = urllib.quote( b )
> > >>> url
> > 'aaaz%E4%B8%AD%E6%96%87'
> > 
> > ----------------------- Original Message -----------------------
> > From:    gyb tension <tensiongyb at gmail.com>
> > To:      python-chinese at lists.python.cn
> > Date:    Wed, 14 Sep 2005 09:26:42 -0400
> > Subject: [python-chinese] Re: 有关字符编码的问题
> > ----------------------------------------------------------------
> > > 就是这个意思,
> > > > > > $inString=$_GET["aaaa"];
> > > $inString=urlencode(iconv( 'gb2312', 'utf-8', $inString ));
> > > $inString=str_replace("%3A",":",$inString);
> > > $inString=str_replace("%2F","/",$inString);
> > > echo $inString;
> > > ?>
> > > 在python下如何做同样的事情呢?
> > > 怎么把中文转化为unicode.
> > > 
> > > On 9/14/05, NI ZhengGang <ni at twinisa.com> wrote:
> > > > 应该是把中文转换为Unicode吧?
> > > > 在php下面做过这个事情,可以参考一下
> > > > 
> > > > http://chinaunix.net/jh/13/386011.html
> > > > 
> > > > -----Original Message-----
> > > > From: python-chinese-bounces at lists.python.cn
> > > > [mailto:python-chinese-bounces at lists.python.cn] On Behalf Of Qiangning
> > Hong
> > > > Sent: 2005年9月14日 21:04
> > > > To: python-chinese at lists.python.cn
> > > > Subject: Re: [python-chinese] 有关字符编码的问题
> > > > 
> > > > gyb tension wrote:
> > > > > 我用mplayer想播放在线电影,但mplayer不支持中文名的电影。
> > > > > 我想写一个脚本用来把中文改变成别的编码,让mplayer来播放。
> > > > > 但我看了半天以前的邮件也没弄明白,所以想请教一下有关编码的问题。
> > > > > 用什么方法呢?
> > > > 
> > > > 你测试用的电影URL是什么?我看看能不能帮上你的忙
> > > > 
> > > > -- 
> > > > Qiangning Hong
> > > > http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> > > > 
> > > > Registered Linux User #396996
> > > > Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> > > > Thunderbird!
> > <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> > > > _______________________________________________
> > > > python-chinese list
> > > > python-chinese at lists.python.cn
> > > > http://python.cn/mailman/listinfo/python-chinese
> > > >
> > 
> > --------------------- Original Message Ends --------------------
> > 
> > _______________________________________________
> > python-chinese list
> > python-chinese at lists.python.cn
> > http://python.cn/mailman/listinfo/python-chinese
> >

--------------------- Original Message Ends --------------------


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 22:07

gyb tension tensiongyb at gmail.com
Wed Sep 14 22:07:47 HKT 2005

On 9/14/05, Qiangning Hong <hongqn at gmail.com> wrote:
> gyb tension wrote:
> > On 9/14/05, 张骏 <zhangj at foreseen-info.com> wrote:
> > 
> >>>>>a = 'aaaz中文'
> >>>>>b = a.decode( 'gbk' ).encode( 'utf8' )
> > 
> > 
> >>>>b =a.decode('gbk').encode('utf8')#'utf-8'?也不行
> > 
> > Traceback (most recent call last):
> >   File "", line 1, in ?
> > LookupError: unknown encoding
> 
> 你是python2.3吧?装cjkcodecs,或者python2.4,不然没有gbk编码。
> 或者用cp936
linux下怎么升级python?我的是mandrake 10.1.
> 
> -- 
> Qiangning Hong
> http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> 
> Registered Linux User #396996
> Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> Thunderbird! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 22:31

Bo Yang boyang at mac.com
Wed Sep 14 22:31:47 HKT 2005

请教,有没有汉字处理的开源python库?比如汉字按拼 
音排序等等。最好是基于unicode, 能处理繁简字符的, 
最好是有python接口的C库。

谢谢。

- 阿北
http://blog.douban.com

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 22:42

张骏 zhangj at foreseen-info.com
Wed Sep 14 22:42:57 HKT 2005

下载python24.tar.gz
解包
执行./configure
执行make 
执行make test
执行make install
在usr/local/bin下就有python24了,记住把/usr/local/bin放到$PATH的前面
----------------------- Original Message -----------------------
From:    gyb tension <tensiongyb at gmail.com>
To:      python-chinese at lists.python.cn
Date:    Wed, 14 Sep 2005 10:07:47 -0400
Subject: [python-chinese] Re: 有关字符编码的问题
----------------------------------------------------------------
> On 9/14/05, Qiangning Hong <hongqn at gmail.com> wrote:
> > gyb tension wrote:
> > > On 9/14/05, 张骏 <zhangj at foreseen-info.com> wrote:
> > > 
> > >>>>>a = 'aaaz中文'
> > >>>>>b = a.decode( 'gbk' ).encode( 'utf8' )
> > > 
> > > 
> > >>>>b =a.decode('gbk').encode('utf8')#'utf-8'?也不行
> > > 
> > > Traceback (most recent call last):
> > >   File "", line 1, in ?
> > > LookupError: unknown encoding
> > 
> > 你是python2.3吧?装cjkcodecs,或者python2.4,不然没有gbk编码。
> > 或者用cp936
> linux下怎么升级python?我的是mandrake 10.1.
> > 
> > -- 
> > Qiangning Hong
> > http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> > 
> > Registered Linux User #396996
> > Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> > Thunderbird! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> > _______________________________________________
> > python-chinese list
> > python-chinese at lists.python.cn
> > http://python.cn/mailman/listinfo/python-chinese
> >

--------------------- Original Message Ends --------------------


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 22:49

Qiangning Hong hongqn at gmail.com
Wed Sep 14 22:49:08 HKT 2005

gyb tension wrote:
> linux下怎么升级python?我的是mandrake 10.1.

mandrake好像是基于rpm的吧,你上rpmfind.net去看看有没有合适的rpm包。
没有用过mandrake,不太清楚。

我用的是gentoo,升级很简单。一条emerge指令就搞定了。

-- 
Qiangning Hong
http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)

Registered Linux User #396996
Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
Thunderbird! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 22:58

nEO (a.k.a. gentoo.cn) gentoo.cn at gmail.com
Wed Sep 14 22:58:43 HKT 2005

在 05-9-14,gyb tension<tensiongyb at gmail.com> 写道:

> linux下怎么升级python?我的是mandrake 10.1.
根据你的发行版不同,包管理程序的不同,方法都不一样
比如我是:
emerge sync
emerge --upgradeonly python2.4
esearch python2.4-*

debian中:
apt-get update
apt-get install python2.4
apt-cache search python2.4-*

我记得MDK用的是urpmi类似apt的一个rpm系统
当然也可一把ebuild和portage用在别的发行版上,不过我还没使过
你看看urpmi的帮助吧



-- 
I'm the one, powered by nEO

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 23:12

Qiangning Hong hongqn at gmail.com
Wed Sep 14 23:12:25 HKT 2005

nEO (a.k.a. gentoo.cn) wrote:
> 在 05-9-14,gyb tension<tensiongyb at gmail.com> 写道:
> 
>>linux下怎么升级python?我的是mandrake 10.1.
> 
> 根据你的发行版不同,包管理程序的不同,方法都不一样
> 比如我是:
> emerge sync
> emerge --upgradeonly python2.4

Gentoo Linux吧?
应该是emerge --upgrade ">=dev-lang/python-2.4"
现在python-2.4.1-r1已经进入x86 branch了,因此直接
emerge -u python
就可以。

> esearch python2.4-*

推荐app-portage/eix,速度比esearch更快

hongqn at r52 ~ $ eix ^python$
* dev-lang/python
     Available versions:  2.1.3-r1 2.2.3-r6 2.3.4-r1 2.3.5 2.3.5-r1
2.3.5-r2 2.4-r3 2.4.1 2.4.1-r1
     Installed:           2.4.1-r1
     Homepage:            http://www.python.org/
     Description:         Python is an interpreted, interactive,
object-orientated programming language.

呵呵,跑题了。


-- 
Qiangning Hong
http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)

Registered Linux User #396996
Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
Thunderbird! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月14日 星期三 23:14

gyb tension tensiongyb at gmail.com
Wed Sep 14 23:14:49 HKT 2005

谢谢,这样就有两个版本的python了吧。

在05-9-14,张骏 <zhangj at foreseen-info.com> 写道:
> 
> 下载python24.tar.gz
> 解包
> 执行./configure
> 执行make
> 执行make test
> 执行make install
> 在usr/local/bin下就有python24了,记住把/usr/local/bin放到$PATH的前面
> ----------------------- Original Message -----------------------
> From: gyb tension <tensiongyb at gmail.com>
> To: python-chinese at lists.python.cn
> Date: Wed, 14 Sep 2005 10:07:47 -0400
> Subject: [python-chinese] Re: 有关字符编码的问题
> ----------------------------------------------------------------
> > On 9/14/05, Qiangning Hong <hongqn at gmail.com> wrote:
> > > gyb tension wrote:
> > > > On 9/14/05, 张骏 <zhangj at foreseen-info.com> wrote:
> > > >
> > > >>>>>a = 'aaaz中文'
> > > >>>>>b = a.decode( 'gbk' ).encode( 'utf8' )
> > > >
> > > >
> > > >>>>b =a.decode('gbk').encode('utf8')#'utf-8'?也不行
> > > >
> > > > Traceback (most recent call last):
> > > > File "", line 1, in ?
> > > > LookupError: unknown encoding
> > >
> > > 你是python2.3吧?装cjkcodecs,或者python2.4,不然没有gbk编码。
> > > 或者用cp936
> > linux下怎么升级python?我的是mandrake 10.1.
> > >
> > > --
> > > Qiangning Hong
> > > http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> > >
> > > Registered Linux User #396996
> > > Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> > > Thunderbird! <
> http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> > > _______________________________________________
> > > python-chinese list
> > > python-chinese at lists.python.cn
> > > http://python.cn/mailman/listinfo/python-chinese
> > >
> 
> --------------------- Original Message Ends --------------------
> 
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20050914/d9936e7f/attachment.htm

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月15日 星期四 10:25

Xie Yanbo xieyanbo at gmail.com
Thu Sep 15 10:25:08 HKT 2005

Bo Yang wrote:

> 请教,有没有汉字处理的开源python库?比如汉字按拼 音排序等等。最好是基 
> 于unicode, 能处理繁简字符的,最好是有python接口的C库。 

呵呵,阿北要开始做繁简转换了?不要说python,就是clib的这种汉语
拼音处理模块都没有听说过。不过你可以考虑整理unicode资料库中的
相关信息,那里面有一部分中日韩汉字的拼音资料[1]。*有一些程序,
比如**gucharmap**[2] 可以查看其中的信息。

部分上,**繁简转换**可以依靠 iconv库中把不同编码转成unicode,
再转换成另外一种编码来实现。这个能力从python2.4开始内建
了。不过,这种转换很不完善,最好还是依靠一些人工的对照表
来做转换。大陆和台湾以前都有人整理过一些表格,但比较老了。
我个人比较看好维基百科正在进行的繁简转换工作[3],那个工程
有更广泛的人员参与,而且一直在线上,接受住了检验。
*
[1] http://www.unicode.org/charts/
[2] http://freshmeat.net/projects/gucharmap/
[3] *http://tinyurl.com/crgxf*
-------------- next part --------------
A non-text attachment was scrubbed...
Name: xieyanbo.vcf
Type: text/x-vcard
Size: 122 bytes
Desc: not available
Url : http://lists.exoweb.net/pipermail/python-chinese/attachments/20050915/63a5c675/xieyanbo.vcf

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月15日 星期四 12:59

transbuerg tian accesine.python at gmail.com
Thu Sep 15 12:59:10 HKT 2005

我准备做 python 的中文分词。

现在正在学 python 如何处理字节的问题,
不知道大家能帮忙吗?

比如:每次读取 4个字节,然后根据4个字节的内容读取 不定长的字节内容,依次类推。


希望大家能给我我个例子。

On 9/15/05, Xie Yanbo <xieyanbo at gmail.com> wrote:
> 
> Bo Yang wrote:
> 
> > 请教,有没有汉字处理的开源python库?比如汉字按拼 音排序等等。最好是基
> > 于unicode, 能处理繁简字符的,最好是有python接口的C库。
> 
> 呵呵,阿北要开始做繁简转换了?不要说python,就是clib的这种汉语
> 拼音处理模块都没有听说过。不过你可以考虑整理unicode资料库中的
> 相关信息,那里面有一部分中日韩汉字的拼音资料[1]。*有一些程序,
> 比如**gucharmap**[2] 可以查看其中的信息。
> 
> 部分上,**繁简转换**可以依靠 iconv库中把不同编码转成unicode,
> 再转换成另外一种编码来实现。这个能力从python2.4开始内建
> 了。不过,这种转换很不完善,最好还是依靠一些人工的对照表
> 来做转换。大陆和台湾以前都有人整理过一些表格,但比较老了。
> 我个人比较看好维基百科正在进行的繁简转换工作[3],那个工程
> 有更广泛的人员参与,而且一直在线上,接受住了检验。
> *
> [1] http://www.unicode.org/charts/
> [2] http://freshmeat.net/projects/gucharmap/
> [3] *http://tinyurl.com/crgxf*
> 
> 
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
> 
> 
> 
> 


-- 
我要去桂林

http://www.domolo.com
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20050915/0a70b1bb/attachment.html

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年09月16日 星期五 20:26

gyb tension tensiongyb at gmail.com
Fri Sep 16 20:26:47 HKT 2005

谁能把"美国派"三个字的unicode编码发一下,我想试一下,谢谢!

在05-9-14,张骏 <zhangj at foreseen-info.com> 写道:
> 
> >>> a = 'aaaz中文'
> >>> b = a.decode( 'gbk' ).encode( 'utf8' )
> >>> import urllib
> >>> url = urllib.quote( b )
> >>> url
> 'aaaz%E4%B8%AD%E6%96%87'
> 
> ----------------------- Original Message -----------------------
> From: gyb tension <tensiongyb at gmail.com>
> To: python-chinese at lists.python.cn
> Date: Wed, 14 Sep 2005 09:26:42 -0400
> Subject: [python-chinese] Re: 有关字符编码的问题
> ----------------------------------------------------------------
> > 就是这个意思,
> > > > $inString=$_GET["aaaa"];
> > $inString=urlencode(iconv( 'gb2312', 'utf-8', $inString ));
> > $inString=str_replace("%3A",":",$inString);
> > $inString=str_replace("%2F","/",$inString);
> > echo $inString;
> > ?>
> > 在python下如何做同样的事情呢?
> > 怎么把中文转化为unicode.
> >
> > On 9/14/05, NI ZhengGang <ni at twinisa.com> wrote:
> > > 应该是把中文转换为Unicode吧?
> > > 在php下面做过这个事情,可以参考一下
> > >
> > > http://chinaunix.net/jh/13/386011.html
> > >
> > > -----Original Message-----
> > > From: python-chinese-bounces at lists.python.cn
> > > [mailto:python-chinese-bounces at lists.python.cn] On Behalf Of Qiangning 
> Hong
> > > Sent: 2005年9月14日 21:04
> > > To: python-chinese at lists.python.cn
> > > Subject: Re: [python-chinese] 有关字符编码的问题
> > >
> > > gyb tension wrote:
> > > > 我用mplayer想播放在线电影,但mplayer不支持中文名的电影。
> > > > 我想写一个脚本用来把中文改变成别的编码,让mplayer来播放。
> > > > 但我看了半天以前的邮件也没弄明白,所以想请教一下有关编码的问题。
> > > > 用什么方法呢?
> > >
> > > 你测试用的电影URL是什么?我看看能不能帮上你的忙
> > >
> > > --
> > > Qiangning Hong
> > > http://www.hn.org/hongqn (RSS: http://feeds.feedburner.com/hongqn)
> > >
> > > Registered Linux User #396996
> > > Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=1>
> > > Thunderbird! <
> http://www.spreadfirefox.com/?q=affiliates&id;=67907&t;=183>
> > > _______________________________________________
> > > python-chinese list
> > > python-chinese at lists.python.cn
> > > http://python.cn/mailman/listinfo/python-chinese
> > >
> 
> --------------------- Original Message Ends --------------------
> 
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20050916/6e9f80b0/attachment.htm

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号