·汉化新世纪 ·汉化新世纪论坛 ·百家争鸣 ·论坛集萃 ·汉化问答 ·软件介绍
文章首页 >> 汉化教学 >> 系统教学 >> Trados新手必读四    Creative Commons License,创作共用协议(中文版)  署名 非商业性使用 禁止演绎

Trados新手必读四

作者: 苏任 来源:FanE『翻译中国』 时间:2006-04-01 点击:10596

如需转载,请注明来自:FanE『翻译中国』http;//www.FanE.cn。本文由汉化教学基地转载自翻译中国,如有版权疑问请及时告知。
 
译海撷英系列之软件漫谈之Trados新手必读四
术语库批量导入一招制敌
作者:苏任

相信各位已经重新安装了231版的IX平台,我们因此可以彻底地解决这个导入问题,这样各位可以把自己的词汇集直接做成Multiter IX术语库。老用户也不用再上5版那里绕弯,新手以后更用不着考虑什么老5版问题。

上次说到你的excel文件名最好是英语的,如果你没有采用英语名,那么现在至少要把XDT文件和XML文件名改为英语(否则无法导入!)。我们假定现在所用文件组的共同名称为“英汉机械术语”,那么请将XDT和XML的名称均改为EC-jx(XDT后缀不变),为什么改名等讲完后再解释。

友情提示:为了防止失败之后的烦躁情绪,建议先用含量为100条的小术语库做试验,词条过少缺乏实证性,词条过多会浪费时间。还是那句话,成功后随便多少条都由你。

下面就给出分步操作程序,仍然是没有图解。仔细看就成,也还是老办法,对照本文逐步操作,至少Multiterm不会因为你动作慢就发脾气。请各位注意:以下所有操作步骤均假定你的IX平台安装在C:\Program Files\Trados\Corprate Languange\MultiTerm\,这是6.0版的系统默认目录位置,大多数用户应该就是这个目录。

1. 首先把这两个文件剪切到Multiterm所在子目录下的Temp子目录,因为术语库建立之后这两个文件就没用了。可以删除。
2. 启动Multiterm IX模块。
3. 进入界面后打开“Termbase(术语库)”菜单项并选择“Create(建立)”命令。
4. 模块的路径窗口打开,让你选择术语库存放的位置,记住一定要选择Multiterm子目录下的Termbase子目录,这也是系统默认的位置,如果你的路径窗口显示的是其它位置,也一定要改回到这里。Trados记性好,以后永远就是这个位置了。点击“确定”。
5. 出现了“Termbase Wizard”模块窗口,上面给出了创建数据库的具体步骤。可直接点击“Next”。
6. 出现了数据库定义窗口,同时在左上方表明共有5步,现在是5/1步。由于你是用转换模块建立的XML文件,因此在这里你要选择第二行,即“载入现有数据库定义文件”。也就是选中第二行的选项按钮,然后点击该行最右边的路径按钮(正方形)以便载入定义文件。
7. 路径窗口再次打开,让你选择XDT文件存放的位置,记住一定要选择Multiterm子目录下的Temp子目录,因为是你自己刚才把文件放在这里的。Trados一样会记住这个位置。
8. 在Temp目录下当然能够看到你的EC-jx.xdt文件,选中并打开,双击也可以。路径窗口消失,回到刚才的定义窗口。
9. 此时你会看到路径栏里已经填入你缩给出的具体地址,点击“next”。
10. 进入“数据库名称”窗口(2/5步),这里有两项供你填写,在第一行里你可以写入名称,在这里完全可以使用中文,使用上更方便一些。第二行里可以写入一些详细的评论,内容随便,空着不写trados也没有意见。点击“next”。
11. 立刻进入“索引字段”窗口(3/5步)。注意,在此处什么也不用做,XDT文件已经替你填入合理选项了,不需要再研究什么。点击“next”。
12. 进入“描述字段”窗口(4/5步),仍然没活干,点击“next”。
13. 进入“输入结构”窗口(5/5步),无需动手,接着点击“next”。
14. 进入结束窗口,点击“finish”。
15. 程序带你回到了Multiterm的启动界面,也就是主界面。在这里可以看到你所建立的数据库已经赫然出现在左下方的工程窗口中,就是那个蓝色的小圆柱,蓝色代表默认数据库,它的优先级别最高。至此,你已经有了一个空数据库,该向里面输入词条了。
16. 仍然打开“Termbase(术语库)”菜单项并选择“Import Entry(导入词条)”,这回要动真的了!
17. 程序打开“Termbase Catalog(数据库选项卡)”窗口,里面有6张卡片供你填写。我知道有有些网友在这些卡片上吃过苦头,实际上对于新手来说,只有第一张和最后一张值得注意,其它都不用理它。
18. 注意第一张卡片“general(概述)”,这里面给出了你的源语言选项和目标语言选项,以及本数据库的词条数量,词库大小和建立日期。由于我们假定是英汉术语,因此与系统给出的默认值相同,所以在这个窗口里什么也不用做。但你要注意,如果你建立的是一个汉英术语库,那么在这里一定要手动改为源语言是中文,目标语言是英文。否则机器进入后英语在前面,汉语在后面,虽然说Multiterm IX是个自动的双向库,但是每次都要先改动一下翻译方向才能开始干活,那还不如事先在这里一次完成。(209版注解1见后)
19. 然后直接点击最右边的“Import(导入)”卡片,进去后直接点击“Process(处理)”按钮,别的选项都不用理它。
20. 进入“General Settings(总体设置)”窗口,在第一行最右边点击路径按钮,这回Multietrm直接进入Temp子目录,你的XML文件正在哪里等着呢,双击打开,第二行(Log File)为自动填入,这又是Trados的记帐本了。注意在选项按钮“Fast Import(快速导入)”要划勾,意思是我的术语表没有毛病,你也不用挑刺,赶紧导入就行了。至于“Apply Filter(应用过滤)”那个选项不要动它,你崭新的词库何需过滤呢。点击“Next”。(209版注解2见后)
21. 进入“Import Definition Summary(导入定义摘要)”,Trados再次总结一下,有后悔的还可以回去,如果确认呢,试试看:
22. 看到什么了?词条正在导入!!
23. 成功导入后界面会通知你有多少词条进入术语库,两次回车后返回主界面。
24. 这次你将会在主界面上看到真正的术语库显示出来,随便试试查询,改向,模糊搜索,没有不成功的。而且更让你高兴的是,绝对没有一个乱码!!
25. 可以退出了,你的第一个术语库已经建立成功。
26. 删除Temp子目录下的XDT,XML和LOG文件,这些文件都不再有用了。你真正需要保存的是Excel文件,那是原始文件,如果什么时候术语库真的需要增删改,再次转换和导入就是了,没有必要留着XML,尺寸太大。与网友交换术语库的时候,更没有必要采用XML文件,纯文本或Excel就足够了。
209版注解1:该版在此处反应不正常,虽然你导入的是英汉术语,这里却自动给出源语言是中文,目标语言是英文。而且,如果再仔细一些,可以看出本来是正确的默认值,但在进入卡片界面的瞬间,跳动改变了设定值。说明有人在这里将原有代码强行旁路了。

209版注解2:该版在此处反应不正常,选项按钮“Fast Import(快速导入)”被人为摘除,强迫你进入下一个排除(Exclusion)界面,必须存储排除记录文件。接下来各步骤完成后,模块开始逐个导入词条(功能仍在),但是每个词条都不能正确导入,从而造成最终失败,查看记录文件就全明白了。为什么要在这里做手脚,是不是此处代码与第一张卡片有某种关联,请各位编程高手考虑。

现在我们也模仿Trados,来个小小的总结,从而结束这个“新手必读”系列。
1. 阅读手册十分重要,许多在手册中早已阐述清楚的问题,直到现在还被有些网友当作秘密而重新“发现”,或者当作话题在热烈讨论。不但浪费自己的时间和精力,而且对诸多新手造成误导。
2. 术语库平台导入问题就是个典型的例子,本来手册中的相关论述都可以得到一一验证,之所以出现争论仅仅是因为流传着一个问题版本,然而在很多情况下我们的讨论不是排除问题,而是制造了更多的问题,得出了更多的错误结论,以至于不但众多新手陷入彷徨,就是先行实践者也为此付出了不必要的时间和精力。
3. 新手只需了解以下几个简单的结论就足够了:
a. 你的词汇集当然可以直接形成IX术语库。
b. 转换工具支持三种格式:老5版,纯文本和Excel文件,可根据你的已有资源和习惯加以选择和使用。
c. 找到正确的IX平台(231版),便可顺利实现导入。209版肯定有问题,其它版本如何请自行验证,IX平台的最新版本是6.2版。
d. 我们给出的所有步骤,都是手册里的内容,并没有任何新发现或新发明。

下面讨论几个问题,作为和感兴趣网友的交流。
Q:我也导入成功了,可是感觉Multiterm里面那么多选项,经常用不着,是不是这个软件很罗嗦哪?
A:不对,因为面向新手,所以我们假设的都是最简单的情况。实际上那里的所有选项都能用得上,而且很有深度,一句话,Multiterm IX在最大程度上允许你自由掌控术语库,比如上次说到Excel两列表格的问题,其实不但可以多列,还可以随便嵌套,还允许多媒体数据,例如翻译资料的时候不但可以检索到词汇,还可以看到相应的设备图片。各位慢慢深入体会吧。

Q:为什么不再有乱码了呢?
A:我没有很具体的分析,但是直觉上认为应当和两个因素有关。一个是字体和字号,通常我们的文件制作习惯是英文12号字,中文是小四,仔细瞧瞧人家的英德样板库,就是10号字,就算没有开发能力,照葫芦画瓢总不会错。所以我在Excel文件制作的时候,最后一步总是格式化字体和字号,无论中英文一律10号字(不要用五号!谁知道是不是一样),而且中英文都是最常见的字体,再挑剔的也不能说不成吧。另一个因素是文件名称,Trados系列的界面语言中只支持几种西方语言,不支持简体中文,所以中文文件名有可能导致其内部字节产生错位,因此我才要求各位改成英语文件名称。这里面究竟是什么原因,有请高手们出面详细解释。既然这么处理能成功,我就懒得再琢磨它了(实在不喜欢清理试验后产生的垃圾文件,再加上修改主数据库,太烦人)。消除乱码很重要,否则你无法查询术语表,因为你的查询单词本身就是乱码或是其它不相干的单词。

Q:为什么一定要指定子目录呢?别的子目录就不行吗?
A:Trados手册上说允许自选路径。一般理解就是可以在任何硬盘分区和任意深度的子目录建立,导入并存放你的术语库,但在实际操作时必须满足一个条件:子目录和XML相关文件均不得为简体中文名称,而必须是英文和/或数字组成的名称。本文开始时假定读者的路径也就是这个原因,如果不信你改用中文试试,立刻失败!在这里我郑重建议新手采用默认路径而不要另建子目录,虽然那样做可能令你感到方便,但是系统也有可能因此而开销更多的机器指令,你看看系统的主数据库就明白了,本地样版术语库(Local Sample)根本就没有给出任何路径数据,这还不说明问题吗?
友情提示:主数据库是Access格式的,允许点击打开,但是新手务请慎重,因为Access是属于那种写入后立刻生效的程序,不适当操作将会导致程序失效。

看一看Trados的log文件就更明白了,只要你的文件名或目录名采用简体中文,则无论209还是231,记录中都会给出如下文字:

“Fatal Error at (file , line 0, column 0): An exception occurred! Type:RuntimeException, Message:The primary
document entity could not be opened. Id=F:\pack\?ˉí¨.xml (重大错误。。。。,主文件实体无法打开,标识=。。。。。)”

简体中文出现处全是乱码。术语平台当然无法识别,导致功亏一篑。而改用英文名称后,231获得成功。209依然失败,但这次209的记录不同了,没有错误,就是不能导入,这说明209的错误成因更加复杂一些。

感谢各位网友阅读本文,此后我们将不再讨论任何有关导入或版本的问题,毕竟我们更应当关注的是使用技巧,也只有这样才能更好地为翻译工作本身服务。

最后感谢各位网友的文章,我从中学到了很多实战技巧。就是因为受到网友言论的启发,我才注意到209的问题所在。现在的这些文章,一方面是对网友的回报,另一方面也是为了后来者不必承受我们曾经的痛苦。

汉化新世纪 责任编辑: 乾 .:|:. 标签(Tag): TRADOS 新手

·上一篇: Trados新手必读三 ·下一篇: 塔多思(TRADOS)常见问题FAQ

· 版权申明: 本文引自《FanE『翻译中国』》,如有版权疑问请及时联系本站,以便本站处理。

· 转载申明: 本文引自《FanE『翻译中国』》[ 作者: 苏任],如需转载请直接联系原始作者,并请注明原始出处。

相关文章                                                                                发表评论 打印此文 关闭窗口

| 设为首页 | 加入收藏 | 联系我们 | 友情链接
Creative Commons License,创作共用协议(中文版)  署名 非商业性使用 禁止演绎
本站内容,除转载或版权特别申明的内容外,皆遵守 创造共用协议中文版之“署名-非商业性使用-禁止演绎 2.5 中国大陆”条款
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.5 China License.
本网站内容源自汉化新世纪论坛的摘录和汉化新世纪成员的原创文章。
凡汉化新世纪论坛的文字皆默认为汉化新世纪与原作者共同拥有并授权发布。
如对本站发布文章有所异议请来信告知,我们将及时删除。
凡商业摘录本站文字请先与我们联系,本站将保留非授权商业发布的追究权利。
凡非商业摘录本站文字请明显注明出处和原作者,并不得改动,凡改动必先征求原作者同意。
苏ICP备05002283号