Python论坛  - 讨论区

标题:[python-chinese] 如何处理这种log文件

2006年11月28日 星期二 21:43

aiglx pretty good jason.gnu在gmail.com
星期二 十一月 28 21:43:12 HKT 2006

"JOB_FINISH" "6.1" 1164710285 109080 10056 100663298 1 1164710269 0 0
1164710272 "e12838"

"ddd66e-lj afsdf" "cpu" "" "" "ddd66eha01 sf"
"/vobs/rrt_apps/code/messaging/lj63/lib/msg_engine/plug-

in/transport_provider/sms" "" "" "" "1164710269.109080" 0 1 "ddd66elnx12" 32
60.0 "" "make test" 0.730000

0.670000 0 0 -1 0 0 6447 2391 0 0 0 -1 0 0 0 0 0 -1 "" "default" 512 1 "" ""
0 1368 4156 "" "" "" "" 0 "" 0 "" -1

"" ""

ÉÏÃæÊÇÒ»ÕûÐÐÎļþ£¬¸÷¸öfieldÖ®¼äÊÇ¿Õ¸ñ¸ô¿ªµÄ£¬Èç¹û¸ÃfieldÊÇ×Ö·û´®£¬ÔòÇ°ºóÓÐË«ÒýºÅ¡£
ÎÊÌâÖ÷ÒªÊÇÔÚÓÚÕâЩ×Ö·û´®ÓòÀïÒ²ÓпÉÄܳöÏÖ²»¶¨ÊýÁ¿µÄ¿Õ¸ñ£¬ËùÒÔÔÚ´¦ÀíÿÌõ¼Ç¼ʱÈç¹û¼òµ¥µÄ°´¿Õ¸ñÈ¥·ÖÓòµÄ»°»áµ¼ÖÂ
Óò¸öÊý²»È·¶¨£¬´Ó¶øºÜÄѶ¨Î»Ò»Ð©ÏëÒªµÄÓò¡£
Çë½Ì´ó¼Ò¶ÔÕâÖÖ¸ñʽµÄlogÎļþÓÐʲôºÃµÄ´¦Àí·½·¨ÄÜʹһÐмǼÄÜ·½±ãµÄת»¯³ÉÏîÊý¹Ì¶¨µÄÁÐ±í£¬¶øÇÒÿһÏîµÄ
ÄÚÈÝȷʵÊǶÔÓ¦ÕýÈ·µÄfield£¿
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20061128/9411dfdc/attachment-0001.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月28日 星期二 22:25

Leo Jay python.leojay在gmail.com
星期二 十一月 28 22:25:58 HKT 2006

On 11/28/06, aiglx pretty good <jason.gnu在gmail.com> wrote:
> "JOB_FINISH" "6.1" 1164710285 109080 10056 100663298 1 1164710269 0 0
> 1164710272 "e12838"
>
> "ddd66e-lj afsdf" "cpu" "" "" "ddd66eha01 sf"
> "/vobs/rrt_apps/code/messaging/lj63/lib/msg_engine/plug-
>
> in/transport_provider/sms" "" "" "" "1164710269.109080" 0 1 "ddd66elnx12" 32
> 60.0 "" "make test" 0.730000
>
> 0.670000 0 0 -1 0 0 6447 2391 0 0 0 -1 0 0 0 0 0 -1 "" "default" 512 1 "" ""
> 0 1368 4156 "" "" "" "" 0 "" 0 "" -1
>
> "" ""
>
> 上面是一整行文件,各个field之间是空格隔开的,如果该field是字符串,则前后有双引号。
> 问题主要是在于这些字符串域里也有可能出现不定数量的空格,所以在处理每条记录时如果简单的按空格去分域的话会导致
> 域个数不确定,从而很难定位一些想要的域。
> 请教大家对这种格式的log文件有什么好的处理方法能使一行记录能方便的转化成项数固定的列表,而且每一项的
> 内容确实是对应正确的field?

有个模块叫csv,也许对你有用


-- 
Best Regards,
Leo Jay

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月29日 星期三 12:58

shhgs shhgs.efhilt在gmail.com
星期三 十一月 29 12:58:22 HKT 2006

你可以先写一个函数,把所有用双引号扩起来的东西挑出来,再写一个函数,把没有用双引号扩起来的东西split开。

但是,这里有一个前提,就是你的双引号必须严格对称,而且当中没有escape的双引号。

否则,你就得麻烦一把写一个parser了。


On 11/28/06, Leo Jay <python.leojay在gmail.com> wrote:
> On 11/28/06, aiglx pretty good <jason.gnu在gmail.com> wrote:
> > "JOB_FINISH" "6.1" 1164710285 109080 10056 100663298 1 1164710269 0 0
> > 1164710272 "e12838"
> >
> > "ddd66e-lj afsdf" "cpu" "" "" "ddd66eha01 sf"
> > "/vobs/rrt_apps/code/messaging/lj63/lib/msg_engine/plug-
> >
> > in/transport_provider/sms" "" "" "" "1164710269.109080" 0 1 "ddd66elnx12" 32
> > 60.0 "" "make test" 0.730000
> >
> > 0.670000 0 0 -1 0 0 6447 2391 0 0 0 -1 0 0 0 0 0 -1 "" "default" 512 1 "" ""
> > 0 1368 4156 "" "" "" "" 0 "" 0 "" -1
> >
> > "" ""
> >
> > 上面是一整行文件,各个field之间是空格隔开的,如果该field是字符串,则前后有双引号。
> > 问题主要是在于这些字符串域里也有可能出现不定数量的空格,所以在处理每条记录时如果简单的按空格去分域的话会导致
> > 域个数不确定,从而很难定位一些想要的域。
> > 请教大家对这种格式的log文件有什么好的处理方法能使一行记录能方便的转化成项数固定的列表,而且每一项的
> > 内容确实是对应正确的field?
>
> 有个模块叫csv,也许对你有用
>
>
> --
> Best Regards,
> Leo Jay
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年11月30日 星期四 01:08

Young fivesheep在gmail.com
星期四 十一月 30 01:08:36 HKT 2006

先按空格分割. 然后再将分割出来的数组处理一下就可以了吧. 状态机? 这个该很简单的.

On 11/29/06, shhgs <shhgs.efhilt在gmail.com> wrote:
> 你可以先写一个函数,把所有用双引号扩起来的东西挑出来,再写一个函数,把没有用双引号扩起来的东西split开。
>
> 但是,这里有一个前提,就是你的双引号必须严格对称,而且当中没有escape的双引号。
>
> 否则,你就得麻烦一把写一个parser了。
>
>
> On 11/28/06, Leo Jay <python.leojay在gmail.com> wrote:
> > On 11/28/06, aiglx pretty good <jason.gnu在gmail.com> wrote:
> > > "JOB_FINISH" "6.1" 1164710285 109080 10056 100663298 1 1164710269 0 0
> > > 1164710272 "e12838"
> > >
> > > "ddd66e-lj afsdf" "cpu" "" "" "ddd66eha01 sf"
> > > "/vobs/rrt_apps/code/messaging/lj63/lib/msg_engine/plug-
> > >
> > > in/transport_provider/sms" "" "" "" "1164710269.109080" 0 1 "ddd66elnx12" 32
> > > 60.0 "" "make test" 0.730000
> > >
> > > 0.670000 0 0 -1 0 0 6447 2391 0 0 0 -1 0 0 0 0 0 -1 "" "default" 512 1 "" ""
> > > 0 1368 4156 "" "" "" "" 0 "" 0 "" -1
> > >
> > > "" ""
> > >
> > > 上面是一整行文件,各个field之间是空格隔开的,如果该field是字符串,则前后有双引号。
> > > 问题主要是在于这些字符串域里也有可能出现不定数量的空格,所以在处理每条记录时如果简单的按空格去分域的话会导致
> > > 域个数不确定,从而很难定位一些想要的域。
> > > 请教大家对这种格式的log文件有什么好的处理方法能使一行记录能方便的转化成项数固定的列表,而且每一项的
> > > 内容确实是对应正确的field?
> >
> > 有个模块叫csv,也许对你有用
> >
> >
> > --
> > Best Regards,
> > Leo Jay
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号