Python论坛  - 讨论区

标题:[python-chinese] Python应用

2006年04月28日 星期五 13:35

Jerry jetport at gmail.com
Fri Apr 28 13:35:40 HKT 2006

我也在找PDF文本提取方面的工具,不过我要求表格,图片也要提取出来,如果你只要文本可以试试Xpdf,The Xpdf project also
includes a PDF text extractor


--
If U can see it, then U can do it
If U just believe it, there's nothing to it
I believe U can fly
From Jetport at gmail.com
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20060428/f7bbb2a2/attachment.htm

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年04月28日 星期五 14:40

jacob jacob at exoweb.net
Fri Apr 28 14:40:48 HKT 2006

xpdf里面有一个pdftotext工具.
http://www.foolabs.com/xpdf/download.html
邓作霖 wrote:

> 大家好:
>
>     最近项目中需要从PDF中提取文本,我的C基础不好,使用Adobe PDF的SDK时
> 有很大的障碍,时间也不允许在这方面花费太多时间,不知道python有没有操作
> PDF文件的库,主要的功能就是要求提取文本内容,不要求格式,有谁知道吗?
> 多 谢了。
> <http://codeplayer.blogbus.com/>
>
>------------------------------------------------------------------------
>
>_______________________________________________
>python-chinese
>Post: send python-chinese at lists.python.cn
>Subscribe: send subscribe to python-chinese-request at lists.python.cn
>Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
>Detail Info: http://python.cn/mailman/listinfo/python-chinese
>  
>
>------------------------------------------------------------------------
>
>_______________________________________________
>python-chinese
>Post: send python-chinese at lists.python.cn
>Subscribe: send subscribe to python-chinese-request at lists.python.cn
>Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
>Detail Info: http://python.cn/mailman/listinfo/python-chinese
>


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年04月28日 星期五 16:36

yzhh yezonghui at gmail.com
Fri Apr 28 16:36:57 HKT 2006

我想你的老师是说"对python有多么多么好做一番宣传不能带来使用价值".
另外,你做的到底是个干什么的程序?

吴俊玉 wrote:

> 到没什么好保密的,只不过全是形式主义,
> 照着dive into python的结构半写半翻译了些内容。
> 
> 而且我的程序现在还不能在别人的机器上运行。

-- 
   regards,
yzhh


[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年04月28日 星期五 19:24

一只小蚂蚁 qixiangnj at gmail.com
Fri Apr 28 19:24:49 HKT 2006

关注此题,兄弟,别灰心!

在06-4-28,yzhh <yezonghui at gmail.com> 写道:
>
> 我想你的老师是说"对python有多么多么好做一番宣传不能带来使用价值".
> 另外,你做的到底是个干什么的程序?
>
> 吴俊玉 wrote:
>
> > 到没什么好保密的,只不过全是形式主义,
> > 照着dive into python的结构半写半翻译了些内容。
> >
> > 而且我的程序现在还不能在别人的机器上运行。
>
> --
>   regards,
> yzhh
>
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



--
『忙忙碌碌   ★   碌碌无为』

――――一只小蚂蚁――――
http://blog.csdn.net/qixiang_nj
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.exoweb.net/pipermail/python-chinese/attachments/20060428/098215b5/attachment.html

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2006年04月29日 星期六 07:58

邓作霖 pse-dengzl at pegasus.tj.cn
Sat Apr 29 07:58:43 HKT 2006

我原来是想用python来批量导出PDF,因为主程序是用Delphi做的,XPdf这样的工
具也不错,用Shell直接调用就可以了,非常感谢。
也非常感谢jacob!

Jerry wrote:
> 我也在找PDF文本提取方面的工具,不过我要求表格,图片也要提取出来,如果你只
> 要文本可以试试Xpdf,The Xpdf project also includes a PDF text extractor
>
>
> -- 
> If U can see it, then U can do it
> If U just believe it, there's nothing to it
> I believe U can fly
> From Jetport at gmail.com Jetport at gmail.com>
> ------------------------------------------------------------------------
>
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号