查看原文
其他

除了调戏Siri 和 Alexa,社交媒体领域里NLP还能做什么?

Zihuan 大数据应用 2022-10-18

今日份知识你摄入了么?

自然语言处理(NLP)一直是数据圈的一个喜闻乐见的话题。今天我们就来涉猎一下由USC教授 Anna Farzindar 为大家分享的自然语言处理在社交媒体方面的应用。


什么是NLP?它的历史是怎样的?

 

NLP人工智能的一个分支领域,而且可能也是目前最火最吸睛的领域。它主要是指人通过文本或者语音的内容与机器进行沟通的相关技术。之所以叫它自然语言,是因为我们希望仅仅通过说人话,说英语汉语西班牙语甚至法语等语言,就可以实现对智能设备的操纵和控制,而不是还要每个人都学会用Java、Python等编程语言。毕竟说人话还是比写代码容易得多。

 

很多技术的出现最多都是用于军事,NLP也不例外。回溯到1950年,NLP的出现最初是想实现自动翻译,将敌方的俄语翻译成英语,从而知己知彼。但今天,NLP其实已经悄无声息地渗入我们的日常生活中,尽管大多数人都不知道这叫NLP。Google搜索,Ins评论的翻译,iPhone上调戏Siri,Amazon上调戏Alexa,甚至是最近的AI新闻主播,都离不开NLP的支持。


 

有什么应用NLP技术的简单例子?

 

在实际应用中,我们一般都是把一个复杂的任务分配成几个简单的小任务。比如,我们可能把一个NLP的模块放到一个pipeline中,这个模块的输出一般会作为下一个模型的输入。

 

比如,实时语音的翻译是一个复杂的任务。它的流程通常是,现将听到的语言识别出来,然后再将这个语言翻译成其他语言。这个应用通常分为三步:


1. 语音识别,将口语转化成文字 

    Speech to text

2. 机器翻译,将该语言翻译成需要的语言

    Text to text

3. 语音合成,将翻译好的文字转化成语 

    Text to speech

NLP在社交媒体方面的应用与其在其他领域的应用有什么区别?可能会遇到哪些挑战呢?

 

社交媒体的数据不比报纸等纸媒的数据,只要网页没有被黑掉,它永远都是公开透明的,具有社交性,实时性,倾向性,时效性,真实性等等重要特点。它可能以多种形式和语言来呈现。写这些文字的人背景千差万别,往往不是专业的写手,写出来的文字让人读来非常拗口也是屡见不鲜。

 

所以,对这些来路不明的文字进行有效的信息提取对我们来说是一种挑战,传统的文字处理、翻译的方法都需要改变,以适应铺天盖地而来的鱼龙混杂的数据。


有什么常见的关于NLP的误解?


经常有人低估NLP,认为NLP和图像识别等其他机器学习的技术相比要略逊一筹。他们以为,NLP只有像Term Frequency Inverse Document Frequency(TF-IDF),也就是挑选出重要的词组这种相貌平平的方法。这怎么能忍呢?NLP在处理文字或者声音的时候,不仅处理单词和语法,还会处理整句话的语义。正是因为这些,很多NLP的技术是非常复杂的,比如深度学习。

 

个人数据的私密性是如何影响社交媒体分析的?

 

社交媒体上数据有很多是公开的,但往往也有很多是有私密性的,比如Ins,WeChat上的信息。现在就有很多业内人士在致力于如何合理使用这些公开的私人信息,来减少网络攻击和校园欺凌。在使用社交媒体的数据的时候,遵守商业道德是很重要的,不能利用这些数据去做丧尽天良的事情。然而,目前还没有相应的法律来规范大家的行为,只能进行道德约束。

 

NLP的未来会是怎样的?

 

NLP现在广泛应用于诸多领域,比如医疗保健,金融,大选预测,娱乐,营销和军事应用等。

 

在将来,科技的飞速发展会改变技术的落地形式。可穿戴设备的兴起,比如智能手表,睡眠质量监控器等,都会影响社交媒体的沟通形式。比如,医疗保健的应用已经成为可穿戴设备的核心应用领域。微软,Google和Apple都已经发布了他们自己的医疗平台,医生可以通过数据、文本和声音来实时监测病人的健康状况。可以预见的是,在不久的将来,NLP技术的应用就像今天的电力系统和互联网系统一样,成为日常生活的一种隐性必需品。

原文作者:Kevin Gray

翻译作者:Zihuan

美工编辑:过儿

校对审稿:卡里

原文链接:https://www.kdnuggets.com/2019/02/natural-language-processing-social-media.html


往期精彩回顾


分析了3592个拿到FLAG offer的Linkedin账户,我们总结了这14点必胜法宝。

数据分析小丫头片子,还有四副面孔呢?!

商科背景的我是如何发挥专业特长成为公司不可替代的商业分析师的?

如果不知道这10点大佬忠告,Kaggle比赛你压根别想进Top 10%!

如何撬开数据科学$180K年薪的大门?



点「在看」的人都变好看了哦

点击阅读原文,加入我们吧!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存