其他
AI阅卷翻车,人工和机器评分为何出入这么大?
此次AI阅卷系统“翻车”的导火索是一位美国历史系教授的儿子在进行历史考试的时候只得到了50%的分数,而她对儿子的答案进行评测后,觉得孩子的回答基本没有问题。
同样的答案,人工评价和机器评价为何有如此大的出入?
相关阅读
查看更多,请点击主页菜单“语言学→语言学杂文汇总”或点击阅读原文
此次AI阅卷系统“翻车”的导火索是一位美国历史系教授的儿子在进行历史考试的时候只得到了50%的分数,而她对儿子的答案进行评测后,觉得孩子的回答基本没有问题。
同样的答案,人工评价和机器评价为何有如此大的出入?
相关阅读
查看更多,请点击主页菜单“语言学→语言学杂文汇总”或点击阅读原文