Python论坛  - 讨论区

标题:[python-chinese] 关于构建文档翻译平台的想法

2007年04月06日 星期五 16:12

Davies Liu davies.liu在gmail.com
星期五 四月 6 16:12:07 HKT 2007

On 4/6/07, klutz chump <chumpklutz在gmail.com> wrote:
>
> ÏÈBSһȦ
>
> ÕâÖÖ¶«Î÷ºÜ¶àÍøÕ¾¼°¸öÈ˶¼Ìá³ö¹ý.Ò²ÓкܶàÈ˲ÎÓë¹ý
> °¦Ö»¿ÉϧµÄÊǶ¼ÊÇÌ«¼à..
>
> ´Ë¾ÙÀíÂÛÉÏ¿ÉÐÐ,µ«Êµ¼ùÉϲ»¿ÉÐÐ.
>

Äã˵µÄÊÇÄĸö£¿ÏßË÷¶ÏÁË
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/b42f9803/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 16:12

ro rosettas在gmail.com
星期五 四月 6 16:12:38 HKT 2007

On 4/6/07, 刘鑫 <march.liu在gmail.com> wrote:
> 同意你的观点,这个分割在句子以上的单位比较好。自动提取……这个是遥远的目标,呵呵,我们可以先从简单的,暴力的,愚蠢的方法开始……
>

我认为全文替换是没有问题的,但有个要求,启动替换的人必须检查所有替换的内容,检查一个提交一个.

-- 
with kind regards

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 16:14

刘鑫 march.liu在gmail.com
星期五 四月 6 16:14:08 HKT 2007

àÅ£¬ÒÔ¶ÎÂäΪµ¥Î»£¬½¨Á¢°æ±¾¿ØÖƺ͸ú×ÙÌåϵ£¬Í¬Ê±½¨Á¢Ò»¸öÊõÓï´Êµä×öΪ¹¤×÷°ïÖúºÍЭ×÷ÒÀ¾Ý£¬Ó¦¸ÃÊDZȽϺõİ취¡£Ê¹ÓùæÔò²»Ó¦¸ÃÌ«¸´ÔÓ£¬×îºÃ¿ÉÒÔ×öµ½±ê¼ÇÃèÊöÎ޹أ¬¶Ô¸÷ÖÖ±ê¼ÇÓïÑÔÎ޹ء£

ÔÚ07-4-6£¬Davies Liu <davies.liu在gmail.com> дµÀ£º
>
> On 4/6/07, ÁõöÎ <march.liu在gmail.com> wrote:
> >
> >
> > ²»ÊǾܾøÖ±Ò룬ÎÒ¶¼ÊÇÖ±Ò룬µ«ÔÙÖ±Ò룬ÕâÒ²ÊÇÁ½ÖÖÍêÈ«²»Í¬ÓïϵµÄÓïÑÔ£¬ÔÚÈκÎСÓÚ¾ä×ӵĵ¥Î»Éϳ¢ÊÔÒ»Ò»Ó³É䣬×îºó³öÀ´µÄ¶«Î÷»ù±¾É϶¼²»ÏñÈË»°ÁË¡­¡­²»ÒªËµÑÅ£¬ÐŶ¼×ö²»µ½¡£2000ÄêÇ°¿ªÊ¼Ñ§Ï°IT¼¼ÊõµÄ£¬Ó¦¸Ã¶¼¶Á¹ýÏ£Íû³ö°æÉçµÄÄÇÅúÒý½øÊé°É¡­¡­
> > Ó¢ÓïºÍºÉÀ¼ÓïËã±È½Ï½Ó½üÁË°É£¬¶Ô±ÈÒ»ÏÂPython2.3µ½Python2.5£¬tutorial
> > ÀïÉÙÁ˲»ÉÙÓï·¨´íÎóºÍ¹ÖÒìµÄ£¬ºÜ²»EnglishµÄ¾ä×Ó¡­¡­Ïë±ØijºÉÀ¼´óÊåµÄÓ¢ÓïˮƽҲÔÚ½ø²½ÖС­¡­
> >
>
> ¼øÓÚÖÐÓ¢Îľ䷨µÄ²îÒ죬µÍÓÚ¾ä×ӵĻ®·Ö×ÔÈ»ÊDz»ºÏÀíµÄ£¬ÒÔ¾ä×ÓΪµ¥Î»»®·Ö£¬²¢½¨ÒéÒ»Ò»Ó³É䣬Ӧ¸Ã»¹Ðаɡ£ÔÙ²»ÐоÍÒÔ¶ÎÂäΪµ¥Î»¡£
> ·´Õý×ܵÃÏñ¸ö°ì·¨À´½â¾öÎĵµÐ­Í¬·­ÒëµÄÎÊÌâ¡£
>
> --
> Davies Liu
> My Blog: http://blog.daviesliu.net/
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



-- 
µÇɽÕßÈ¥µÇɽ£¬ÒòΪɽÔÚÄÇÀï
ÎÒÔÚ˼¿¼£¬ÒòΪÎÊÌâÔÚÄÇÀï

ÁõöÎ
March.Liu
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/2502b08d/attachment-0001.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 16:33

刘鑫 march.liu在gmail.com
星期五 四月 6 16:33:54 HKT 2007

¼òµ¥µÄÈ«ÎÄÌæ»»¶Ô·­Ò빤×÷²»»áÓÐʲô°ïÖú£¬GoogleºÚ°å±¨ÉϽéÉܹýÒ»ÖÖ»ùÓÚͳ¼ÆѧµÄ·­ÒëËã·¨µ¹ÊÇÖµµÃѧϰ£º£©¡£

ÔÚ07-4-6£¬ro <rosettas在gmail.com> дµÀ£º
>
> On 4/6/07, ÁõöÎ <march.liu在gmail.com> wrote:
> > ͬÒâÄãµÄ¹Ûµã£¬Õâ¸ö·Ö¸îÔÚ¾ä×ÓÒÔÉϵĵ¥Î»±È½ÏºÃ¡£×Ô¶¯ÌáÈ¡¡­¡­Õâ¸öÊÇÒ£Ô¶µÄÄ¿±ê£¬ºÇºÇ£¬ÎÒÃÇ¿ÉÒÔÏÈ´Ó¼òµ¥µÄ£¬±©Á¦µÄ£¬ÓÞ´ÀµÄ·½·¨¿ªÊ¼¡­¡­
> >
>
> ÎÒÈÏΪȫÎÄÌæ»»ÊÇûÓÐÎÊÌâµÄ,µ«ÓиöÒªÇó,Æô¶¯Ìæ»»µÄÈ˱ØÐë¼ì²éËùÓÐÌæ»»µÄÄÚÈÝ,¼ì²éÒ»¸öÌá½»Ò»¸ö.
>
> --
> with kind regards
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese




-- 
µÇɽÕßÈ¥µÇɽ£¬ÒòΪɽÔÚÄÇÀï
ÎÒÔÚ˼¿¼£¬ÒòΪÎÊÌâÔÚÄÇÀï

ÁõöÎ
March.Liu
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/9f04ecba/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 16:39

Yung-Yu Chen yungyuc在gmail.com
星期五 四月 6 16:39:18 HKT 2007

根據個人的經驗,如果下到以句子為單位劃分,有時候作出來的東西實在不敢拿給別人看。

用段落作單位就安全多了。

On 4/6/07, 刘鑫 <march.liu在gmail.com> wrote:
>
>
> 嗯,以段落为单位,建立版本控制和跟踪体系,同时建立一个术语词典做为工作帮助和协作依据,应该是比较好的办法。使用规则不应该太复杂,最好可以做到标记描述无关,对各种标记语言无关。
>
> 在07-4-6,Davies Liu <davies.liu在gmail.com > 写道:
> >
> > On 4/6/07, 刘鑫 < march.liu在gmail.com> wrote:
> > >
> > >
> > > 不是拒绝直译,我都是直译,但再直译,这也是两种完全不同语系的语言,在任何小于句子的单位上尝试一一映射,最后出来的东西基本上都不像人话了……不要说雅,信都做不到。2000年前开始学习IT技术的,应该都读过希望出版社的那批引进书吧……
> > > 英语和荷兰语算比较接近了吧,对比一下Python2.3到Python2.5,tutorial
> > > 里少了不少语法错误和怪异的,很不English的句子……想必某荷兰大叔的英语水平也在进步中……
> > >
> >
> > 鉴于中英文句法的差异,低于句子的划分自然是不合理的,以句子为单位划分,并建议一一映射,应该还行吧。再不行就以段落为单位。
> > 反正总得像个办法来解决文档协同翻译的问题。
> >
> > --
> > Davies Liu
> > My Blog: http://blog.daviesliu.net/
> >
> > _______________________________________________
> > python-chinese
> > Post: send python-chinese在lists.python.cn
> > Subscribe: send subscribe to python-chinese-request在lists.python.cn
> > Unsubscribe: send unsubscribe to
> > python-chinese-request在lists.python.cn
> > Detail Info: http://python.cn/mailman/listinfo/python-chinese
> >
>
>
>
> --
> 登山者去登山,因为山在那里
> 我在思考,因为问题在那里
>
> 刘鑫
> March.Liu
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



-- 
with regards,
Yung-Yu Chen

yyc在seety.org
-------------- 下一部分 --------------
一个HTML附件被移除...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/8f2b86ce/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 18:32

xiaotian wu wu2xiaotian在gmail.com
星期五 四月 6 18:32:01 HKT 2007

不错, 你所想的正是我们所做的, 你可以看看这个工程:Gnome API Document Translate :
http://dev.inlsd.org/projects/gadt

我们是把文档采用po文件的形式翻译的, 具有你所说的大部分优点.  有些po文件编辑器也支持自动翻译, 如poedit.


在07-4-6,Davies Liu <davies.liu at gmail.com> 写道:
>
> Hi, all:
>
> 开源社区现在有大量非常有用的文档,虽然对部分英语较好的人不存在阅读障碍,也鼓励大家尽量
> 提高自身的英语能力,但是有一份翻译得不错的中文文档,会更加有用,毕竟使用自己最熟悉的语言是最轻松的。同时也能造福广大英语不好的人,即使翻译文档不
> 能完全准确表达原文的意思,能让人快速了解个大概也是非常非常有用的,通常费了很多时间阅读英文资料后也只能留下一个大概的印象。总的来说,如果能够有一
> 个方便地支持协作翻译的平台,让更多的人更容易地参与翻译和改进,将是非常好的一件事。
>
> 现在有不少翻译社区,比如译言 <http://www.yeeyan.com/>或
> 者其它的一些翻译型blog,他们适合翻译一些简短的新闻类文章,不便于多人共同维护一份技术文档的翻译。也有基于Wiki的协作翻译形式,但是wiki
> 的使用有一些门槛,在格式上也很难跟原文保持一致,针对原文档的更新也不容易。基于已有的这些并不太理想的方案,针对技术文档的特点,构建一个更适合文档
> 翻译的平台。
>
> 先来看看文档翻译的特点:
>
>    1. 技术文档相对新闻和blog来说,有效性时间相对要长,一篇翻译得好的文档可以让很多人受益;
>    2. 技术文档是有版本概念的,会随着软件或者系统的更新而更新;
>    3. 内容比较多,一个人单独完成翻译比较困难;
>    4. 语句比较客观、直白和严谨,容易得到一个大多数人都能接受的翻译结果,多人协调翻页导致;
>    5. 有不少相对稳定的专业词汇和概念;
>    6. 文档有一定的格式,通常为HTML页面,内部会嵌入代码等。
>
> 根据这些特点,希望文档翻译平台能达到下面这些目标:
>
>    1. 个人的翻译的过程是方便和快捷的,能够中英文对照,批量替换等;
>    2. 方便地进行多人协同翻译,共同完成大量文档的翻译,个人即使只翻译一句话或者一个段落也是可参与的;
>    3. 方便地进行相互校对和修订,提高翻译质量;
>    4. 保持跟原文档一致的格式;
>    5. 能够自动跟踪原文档的更新,并自动合并;
>
> 拟采用的方案:
>
>    1.
>    将文档的翻译细化到句子甚至短语的翻译,建立文档中句子甚至短语跟翻译结果的一一对应关系,用它们替换原文档得到翻译后的文档。这样当原文更新后,翻译文档也会自动更新,新出现的语句会明显地暴露出来,便于增量翻译。同时可以保持与原文档同样的格式。
>    2. 可
>    选择以机器翻译作为初始状态进行改进,提高翻译质量,同时改进后的翻译作为用来进行机器学习。对一批文档采用项目的形式进行管理,同一个项目共享一个词
>    库,用于进行批量替换或机器翻译时的特化词典。机器翻译最大的问题在于对专业词汇的翻译,解决了这部分后通常能得到一个基本能看明白的文档。
>    3. 一个句子或者短语可以有多个翻译结果,用户可以选择最合适的翻译,投票决定最优翻译,以提高翻译质量。
>    4.
>    交互界面上采用Google翻译的效果,页面中显示翻译后的结果,鼠标停留时可以看到原文,点击后可以选择其他翻译或者采用原文或者提交新的翻译。
>    5. 可以做一个浏览器扩展或者插件,用户可以根据网页的URL,自动跳转到该平台下的相应翻译页面;
>
> 以上是我对协作进行文档翻译的一些想法,欢迎大家多提意见,最后能得到一个比较好的方案并付诸实施。
>
> 原文在我的blog上: http://blog.daviesliu.net/article/entry20070406-115711
>
> Davies
>
> _______________________________________________
> python-chinese
> Post: send python-chinese at lists.python.cn
> Subscribe: send subscribe to python-chinese-request at lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request at lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/203fb818/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 19:08

Davies Liu davies.liu在gmail.com
星期五 四月 6 19:08:47 HKT 2007

On 4/6/07, ÁõöÎ <march.liu在gmail.com> wrote:
>
> ¼òµ¥µÄÈ«ÎÄÌæ»»¶Ô·­Ò빤×÷²»»áÓÐʲô°ïÖú£¬GoogleºÚ°å±¨ÉϽéÉܹýÒ»ÖÖ»ùÓÚͳ¼ÆѧµÄ·­ÒëËã·¨µ¹ÊÇÖµµÃѧϰ£º£©¡£


ÏÖÔÚGoogleµÄÖÐÎÄ·­Òë¾ÍÊÇʹÓõÄͳ¼ÆѧģÐÍ£¬ËüʹÓõÄÊÇÈ«¾ÖµÄͳ¼ÆÄ£ÐÍ£¬Ã»ÓжÔÌض¨ÁìÓò»òÕßרҵ×öÌØ»¯£¬¶ÔרҵÐÔ½ÏÇ¿µÄÎĵµ·­ÒëЧ¹ûºÜ²î£¬ÓÈÆäÊÇһЩרҵ´Ê»ã£¬¶ÔÈÕ³£ÐÂÎÅÐÍÎı¾·­Ò뻹¿ÉÒÔ½ÓÊÜ¡£
¿ÉÒÔʹÓûúÆ÷·­Òë×÷Ϊ³õÖµ£¬È»ºó¶Ôרҵ´Ê»ã½øÐÐÌæ»»£¬×îºóÔÙÈ˹¤Ð£¶Ô£¬¶ÔÓï¾ä½øÐÐÓÅ»¯¡£Ï£ÍûÕâÖÖ·½Ê½ÄܼõµÍ·­ÒëµÄ¹¤×÷Á¿£¬²»ÖªµÀʵ¼ÊЧ¹ûÈçºÎ¡£

Davies
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/fc6b605c/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 19:11

Davies Liu davies.liu在gmail.com
星期五 四月 6 19:11:15 HKT 2007

On 4/6/07, xiaotian wu <wu2xiaotian在gmail.com> wrote:
>
> ²»´í, ÄãËùÏëµÄÕýÊÇÎÒÃÇËù×öµÄ, Äã¿ÉÒÔ¿´¿´Õâ¸ö¹¤³Ì:Gnome API Document Translate :
> http://dev.inlsd.org/projects/gadt
> ÎÒÃÇÊÇ°ÑÎĵµ²ÉÓÃpoÎļþµÄÐÎʽ·­ÒëµÄ, ¾ßÓÐÄãËù˵µÄ´ó²¿·ÖÓŵã.  ÓÐЩpoÎļþ±à¼­Æ÷Ò²Ö§³Ö×Ô¶¯·­Òë, Èçpoedit.


Ì«ÔÞÁË£¬¹ûÈ»ÊÇÖÚÈËÊ°²ñ»ðÑæ¸ß£¬
ºÃºÃѧϰһÏÂÏÖÓеĹú¼Ê»¯·½·¨¡£

Davies
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/023bf201/attachment.htm 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

2007年04月06日 星期五 19:15

jessinio smith jessinio在gmail.com
星期五 四月 6 19:15:03 HKT 2007

²Âһϣ¬ÒÔºóµÄÈí¼þ·­Òë¼¼Êõ»á²»»áµ½´ïÍêÃÀ¼¶ÄØ£¿

ÏÖÔÚµÄÈí¼þ·­ÒëÌ«²îÁË¡£

On 4/6/07, Davies Liu <davies.liu在gmail.com> wrote:
>
> On 4/6/07, xiaotian wu <wu2xiaotian在gmail.com> wrote:
> >
> > ²»´í, ÄãËùÏëµÄÕýÊÇÎÒÃÇËù×öµÄ, Äã¿ÉÒÔ¿´¿´Õâ¸ö¹¤³Ì:Gnome API Document Translate :
> > http://dev.inlsd.org/projects/gadt
> > ÎÒÃÇÊÇ°ÑÎĵµ²ÉÓÃpoÎļþµÄÐÎʽ·­ÒëµÄ, ¾ßÓÐÄãËù˵µÄ´ó²¿·ÖÓŵã.  ÓÐЩpoÎļþ±à¼­Æ÷Ò²Ö§³Ö×Ô¶¯·­Òë, Èçpoedit.
>
>
> Ì«ÔÞÁË£¬¹ûÈ»ÊÇÖÚÈËÊ°²ñ»ðÑæ¸ß£¬
> ºÃºÃѧϰһÏÂÏÖÓеĹú¼Ê»¯·½·¨¡£
>
> Davies
>
> _______________________________________________
> python-chinese
> Post: send python-chinese在lists.python.cn
> Subscribe: send subscribe to python-chinese-request在lists.python.cn
> Unsubscribe: send unsubscribe to  python-chinese-request在lists.python.cn
> Detail Info: http://python.cn/mailman/listinfo/python-chinese
>



-- 
×¢ÒâÉíÌ壬ÉíÌåÊǸïÃüµÄ±¾Ç®£¡£¡
-------------- 下一部分 --------------
Ò»¸öHTML¸½¼þ±»ÒƳý...
URL: http://python.cn/pipermail/python-chinese/attachments/20070406/ea8fe1f6/attachment.html 

[导入自Mailman归档:http://www.zeuux.org/pipermail/zeuux-python]

如下红色区域有误,请重新填写。

    你的回复:

    请 登录 后回复。还没有在Zeuux哲思注册吗?现在 注册 !

    Zeuux © 2025

    京ICP备05028076号