Skip to content

机器翻译自动评估的相关问题 #1

@Yesterday17

Description

@Yesterday17

如果说是Python的BLEU的话,其实已经有现有的轮子了:
https://www.cnblogs.com/by-dream/p/7679284.html

但BLEU是对机器翻译的评测,其中需要牵扯到的就是标准答案的提供。BLEU通过和标准答案进行比对,并且加以一定的优化,最后得到一个比率,但汉化资源包的仓库中很大部分是人工翻译,然后……emmm

我个人感觉对于汉化质量可以分成以下几步检测:

  1. 检查汉化文本是否和某一网站的机翻一致。
  2. 如果和机翻一致,则通过LanguageTool进行语法检查。如果语法没有问题则判分。
  3. 对于与机翻不一致的,同样进行语法检测,判定语法问题。如果检查没有通过,则给予与上者相比更低的分值。

但这样仍然无法完全评估汉化的质量,emmm,除非有一个标准答案,但这是几乎不可能的。
所以我在这里展开一个话题,希望找到一个可用的算法(逃

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions