Python论坛  - 讨论区

标题:[python-chinese] split words

2006年08月08日 星期二 09:04

cry zyqmail at tom.com
Tue Aug 8 09:04:57 HKT 2006

python,您好!

请问怎么才可以把一个英文文本文件里的英文单词都分离出来,形成一个单词文件,每个单词一行,按字母次序。
或者已经有这样的工具?知道的能否介绍一下?最好是PYTHON的。

PYTHON里,把一行中的词分离,用什么方法比较好。split好象不能同时分离多种分割符。

                    致
礼!

            cry
            zyqmail at tom.com



[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年08月08日 星期二 09:07

limodou limodou at gmail.com
Tue Aug 8 09:07:39 HKT 2006

On 8/8/06, cry <zyqmail at tom.com> wrote:
> python,您好!
>
> 请问怎么才可以把一个英文文本文件里的英文单词都分离出来,形成一个单词文件,每个单词一行,按字母次序。
> 或者已经有这样的工具?知道的能否介绍一下?最好是PYTHON的。
>
> PYTHON里,把一行中的词分离,用什么方法比较好。split好象不能同时分离多种分割符。
>
 >>> a = 'a b\tc\nd'
 >>> a.split()
 ['a', 'b', 'c', 'd']

-- 
I like python!
My Blog: http://www.donews.net/limodou
My Django Site: http://www.djangocn.org
NewEdit Maillist: http://groups.google.com/group/NewEdit

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年08月08日 星期二 10:59

jacob jacob at exoweb.net
Tue Aug 8 10:59:41 HKT 2006

limodou wrote:

> On 8/8/06, cry <zyqmail at tom.com> wrote:
>
>> python,您好!
>>
>> 请问怎么才可以把一个英文文本文件里的英文单词都分离出来,形成一个单词
>> 文件,每个单词一行,按字母次序。
>> 或者已经有这样的工具?知道的能否介绍一下?最好是PYTHON的。
>>
>> PYTHON里,把一行中的词分离,用什么方法比较好。split好象不能同时分离多
>> 种分割符。
>>
> >>> a = 'a b\tc\nd'
> >>> a.split()
> ['a', 'b', 'c', 'd']
>
>  
>
>>> s = "this is a good day, I think.d $@#$#"
>>> s.split()
['this', 'is', 'a', 'good', 'day,', 'I', 'think.d', '$@#$#']

>>> re.findall("[a-zA-Z]+", s)
['this', 'is', 'a', 'good', 'day', 'I', 'think', 'd']




[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号