随着制造业的全球化及中国、印度等新兴国家市场的日益增长,东芝与海外企业之间的会议交流使用外语的情况不断增多,而不同语言导致的沟通障碍和误解、翻译成本增加、外语人才管理等,都已成为日渐突出的经营课题。
当下,语音识别和机器翻译技术突飞猛进,尤其在旅行和购物等日常会话方面,已出现实用性语音翻译工具。然而,会议中的专业术语和口语性发言等增加了翻译难度,迄今尚未开发出适用于商务领域的实用化翻译系统。为解决这一问题,东芝推出外语会议支援系统。
该系统采用东芝最新研发的文本整理技术,即利用捕捉发言者口语化发言的共通性的规则型翻译,与收集大量多样化实例而逐渐改进的统计型翻译,将难翻译、难理解的语句修整为易翻译句法和长度。而相关的文本整理网络工具,可收集大量的文本整理实例和对整理结果进行高效评价,从而大幅提高文本整理的精度。
为防止未知词汇造成的声音识别精度和翻译精度下降,东芝还研发了关键词抽取技术。即从会议资料中自动抽取专业术语等会议所需词汇,在会议开始前预先存储该词汇的正确翻译。经过文本整理后的原文,通过关键词抽取技术和东芝独有的统计型+规则型混合机器翻译方式进行处理,对各种发言实现高品质翻译。
此外,东芝还开发了支持远程会议、面对面会议和演讲的支援系统。使用该系统在公司内部进行测评,日语能力测试二级或二级以上的测试对象对日语会议内容的理解度从60%提高到80%,而日语能力测试二级以下或完全不懂日语的测试对象理解度则从30%提高到60%。该系统此前仅在开发部门内部进行试运行,本次则将在包括5家中国当地公司在内的东芝集团内部投入试运行。东芝将在内部应用的基础上,不断积累内部会议翻译所需的语言数据,在力争将翻译译文的可理解度提高到80%以上的同时,不断完善会议语音应用系统的各项功能。