如果说是Python的BLEU的话,其实已经有现有的轮子了:
https://www.cnblogs.com/by-dream/p/7679284.html
但BLEU是对机器翻译的评测,其中需要牵扯到的就是标准答案的提供。BLEU通过和标准答案进行比对,并且加以一定的优化,最后得到一个比率,但汉化资源包的仓库中很大部分是人工翻译,然后……emmm
我个人感觉对于汉化质量可以分成以下几步检测:
- 检查汉化文本是否和某一网站的机翻一致。
- 如果和机翻一致,则通过LanguageTool进行语法检查。如果语法没有问题则判分。
- 对于与机翻不一致的,同样进行语法检测,判定语法问题。如果检查没有通过,则给予与上者相比更低的分值。
但这样仍然无法完全评估汉化的质量,emmm,除非有一个标准答案,但这是几乎不可能的。
所以我在这里展开一个话题,希望找到一个可用的算法(逃
如果说是Python的BLEU的话,其实已经有现有的轮子了:
https://www.cnblogs.com/by-dream/p/7679284.html
但BLEU是对机器翻译的评测,其中需要牵扯到的就是标准答案的提供。BLEU通过和标准答案进行比对,并且加以一定的优化,最后得到一个比率,但汉化资源包的仓库中很大部分是人工翻译,然后……emmm
我个人感觉对于汉化质量可以分成以下几步检测:
但这样仍然无法完全评估汉化的质量,emmm,除非有一个标准答案,但这是几乎不可能的。
所以我在这里展开一个话题,希望找到一个可用的算法(逃