查看原文
其他

数据标注 | 北大新传学硕考研真题详解05

胡师姐团队 胡师姐新传考研清北专列 2023-06-25



扫码加入21新传考研群



2020年 北京大学新传学硕653


名词解释:数据标注



01丨答题思路


数据标注是互联网业界较底层的新工种,属于新兴知识点。


这道名解的灵感可能来源于张慧瑜老师指导的非虚构写作小组的澎湃作品《数据标注员:隐身于人工智能背后的工兵》首先我们需要对数据标注的概念进行简单描述,然后对其分类作出划分。最后结合实际情况描述其现状特点。



02丨参考答案


数据标注的概念:为了满足AI在监督学习和半监督学习的数据需求,需要将无序、混乱的数据进行清洗,同时围绕应用场景对数据进行标注,以提高数据的质量和精度,将规范化数据“喂养”给模型,不断提高AI的使用精度。

数据标注的分类有:图片标注、文本标注、音频标注、视频标注、其他标注。


当前,数据标注工作还无法完全由机器承担,需要大量的人力对数据进行标注,在AI产业飞速发展,应用场景不断产生的背景下,AI模型也需要大量的标注数据进行训练,因此,也带动了劳动密集型的AI数据标注行业的产生和发展,被称为“数字富士康”的数据标注工厂应运而生。


数据标注行业的特点:劳动密集型主要分为众包和自建工厂两种模式、进入门槛较低、市场混乱,亟待规范和整治、从业人员学历普遍较低,以兼职为主、标记质量参差不齐、专业性标记成本较高、对上游AI算法的依赖程度较高、敏感数据存在安全隐患等。







编辑 | 文文责编 | 鲸鲸

欢迎大家在评论区写下你的看法,大家有任何问题,可在文后留言,胡师姐为你解答。


1. 培养分析 | 北大新传学硕考研真题详解01

2. 固定样本调查 | 北大新传学硕考研真题详解02

3. 短视频对传播和社会交往的影响 | 北大新传学硕考研真题详解03

4. 什么是新型主流媒体?| 北大新传学硕考研真题详解04

5. 归纳与演绎 I 研究方法05 




点击阅读原文,即可报名逻辑课~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存