Python论坛  - 讨论区

标题:Re: [python-chinese] 关于一个正则表达式的问题

2005年05月26日 星期四 21:34

limodou limodou at gmail.com
Thu May 26 21:34:19 HKT 2005

这是因为你使用字节码,如果使用unicode应该不存在这个问题了。

在 Thu May 12 22:35:26 2005 +0800,李维刚<dimension at hit.edu.cn> 写道:
> 各位好:
> 
> 比如要实现一个句子分割器,
> 只有是"。!?"以及
> 。"
> !"
> ?"
> 等几种情况结尾的句子都分割称单独的句子。
> 
> 我利用正则表达式
> expression = r"。|!|?|。"|!"|?""
> 
> listSentence = re.split(expression, sentence)
> 
> 但是这样情况下,就会把汉字中某些字分开称乱码,比如:
> 
> 假如
> 
> str1 = "【幸福】的人是很少的。"
> 
> 这样一个字符串就会被分开,因为"福"的后一半"】"的前一半正好是a3a1是一个"!"。当然,类似的情况肯定还有。
> 
> 不知道怎么解决。
> _______________________________________________
> python-chinese list
> python-chinese at lists.python.cn
> http://python.cn/mailman/listinfo/python-chinese
> 
> 
> 


-- 
I like python! 
My Donews Blog: http://www.donews.net/limodou
New Google Maillist: http://groups-beta.google.com/group/python-cn

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2005年05月27日 星期五 14:55

Qiangning Hong hongqn at gmail.com
Fri May 27 14:55:26 HKT 2005

On 5/26/05, limodou <limodou at gmail.com> wrote:
> 这是因为你使用字节码,如果使用unicode应该不存在这个问题了。

纠正一下limodou的笔误,呵呵。
这里不应该说"字节码",而应该说"string对象"。字节码在python里应该是指bytecode,python虚拟机运行的基本指令。string对象才是指的字节序列。

-- 
Qiangning Hong
Get Firefox! <http://www.spreadfirefox.com/?q=affiliates&id=67907&t=1>

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号