2006年08月08日 星期二 09:04
python,您好! 请问怎么才可以把一个英文文本文件里的英文单词都分离出来,形成一个单词文件,每个单词一行,按字母次序。 或者已经有这样的工具?知道的能否介绍一下?最好是PYTHON的。 PYTHON里,把一行中的词分离,用什么方法比较好。split好象不能同时分离多种分割符。 致 礼! cry zyqmail at tom.com
2006年08月08日 星期二 09:07
On 8/8/06, cry <zyqmail at tom.com> wrote: > python,您好! > > 请问怎么才可以把一个英文文本文件里的英文单词都分离出来,形成一个单词文件,每个单词一行,按字母次序。 > 或者已经有这样的工具?知道的能否介绍一下?最好是PYTHON的。 > > PYTHON里,把一行中的词分离,用什么方法比较好。split好象不能同时分离多种分割符。 > >>> a = 'a b\tc\nd' >>> a.split() ['a', 'b', 'c', 'd'] -- I like python! My Blog: http://www.donews.net/limodou My Django Site: http://www.djangocn.org NewEdit Maillist: http://groups.google.com/group/NewEdit
2006年08月08日 星期二 10:59
limodou wrote: > On 8/8/06, cry <zyqmail at tom.com> wrote: > >> python,您好! >> >> 请问怎么才可以把一个英文文本文件里的英文单词都分离出来,形成一个单词 >> 文件,每个单词一行,按字母次序。 >> 或者已经有这样的工具?知道的能否介绍一下?最好是PYTHON的。 >> >> PYTHON里,把一行中的词分离,用什么方法比较好。split好象不能同时分离多 >> 种分割符。 >> > >>> a = 'a b\tc\nd' > >>> a.split() > ['a', 'b', 'c', 'd'] > > > >>> s = "this is a good day, I think.d $@#$#" >>> s.split() ['this', 'is', 'a', 'good', 'day,', 'I', 'think.d', '$@#$#'] >>> re.findall("[a-zA-Z]+", s) ['this', 'is', 'a', 'good', 'day', 'I', 'think', 'd']
Zeuux © 2025
京ICP备05028076号