也谈中文的简繁转换

最近手头上的任务不多,没事时我就检查了一遍公司产品的繁体版UI界面,发现了一些以前没注意到的细节问题,主要是关于简繁转换的。

目前我们公司产品的UI界面从简体中文转为繁体中文的基本方式是:先用自定义的专业术语转换脚本转一次,再用微软Office Word 2007自带的中文简繁转换工具转一次。应该说,这种处理方式基本上能够满足我们的需求。不过,简体中文和繁体中文存在一对多的关系,因此有时候有一些细节问题容易被忽略。

以简体的“面”为例,对应繁体中文有两个词,一个是“麵”(如“吃麵”),另一个是“面”(如“面目”)。这两个例子还算比较好区分的,不过如果碰上“下面”这个词会出现什么情形呢?“下面”可以做动词讲(煮面条),也可以是表示介词(在什么什么的下面),如果你用微软的Word来转,很可能它没法100%正确分辨出来:

请在下面加上一个数字 —> 請在下面加上一個數字

上面的这个倒是转换正确了,再来看看另一个:

此操作将导致下面的结果 —> 此操作將導致下麵的結果

呵呵,傻眼了吧?莫非Word认为上面这句话中的“下面”是个动作?

“面”用于表示动作的对象时,还有“和面”这个用法(别读错啦,这里的“和”念去声),不过如果“和面”不是一个独立的词组,而是放在有前后情景的句子中时,不一定会跟面条扯上关系,如下面的例子:

职位信息和面试信息 —> 職位資訊和麵試資訊

“麵試”?看来Word是把“和面”当作一个词组了。由于单独的“面试”确实可以用Word正常转成“面試”,那我们只需要特别地为“和面试”进行定义就行了,即在Word简繁转换的自定义词典中加入(简到繁)“和面试=和面試”。

我们公司产品的繁体版是基于台湾地区习惯用法的,但实际上其他非简体中文地区所使用的繁体并不是完全一样的。例如严格来讲香港的繁体和台湾的繁体是不太一样的。也许日常用语的词汇是类似的,但具体到专门领域的词汇,有时候差别也不小。香港的用户用英文版的产品基本没问题,所以中小公司也许可以不用考虑专门为香港的用户量身定制一套繁体版。当然了,财大气粗的公司就不一样了,像微软,他们家的操作系统肯定是区分香港和台湾的不同繁体的。还有一些软件产品的本地化是由志愿者完成的(典型如Firefox),这也是个可选方案,只不过这个方式不太适合过于复杂和庞大的产品,特别是商业软件(商业公司毕竟是要保证自己产品质量的)。

其实,微软的Word不是绝对的标准,Wikipedia也不是,它们也只是一种参考手段而已。汉字几千年演变至今,因为简体字和繁体字共存现象的出现,而某种程度上阻碍了交流(至于简体和繁体孰优孰劣的话题,本文不涉及)。更多时候,语言和文字是约定俗成的东西,一种习惯用法被大家接受了,慢慢的它就成为标准了(虽然我很讨厌类似“空穴来风”等滥用成语的现象)。在目前的这种状况下,我们能做的,就是尽量把简繁转换工作做得更细致和精确,促进大家的交流。

最后附上一些实用链接供大家参考使用:

1)單個簡體字對應至少兩個繁體字的現象

2)Wikipedia:简繁一多对应校验表

3)微软术语库

4)OpenCC 一个开源的简繁转换项目

“也谈中文的简繁转换”的2个回复

    1. 这个……我这个小站暂时没有友链建设的打算,您还是把我的友链给撤了吧,我心领啦!况且我关注的话题不是很大众的,跟您的站点风格也不太一致,不太适合呢。友链么,更多是因广泛的共同话题而成,还望谅解!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注