不懂NLP的人想知道,NLP的难度在哪里?
人工智能的专家说
人工智能大致有三个阶段
感知、认知、推理
在电力物联网用于设备管理里头
感知对应的是设备侧的传感器
和各种监测技术
认知对应的是故障模型
推理对应的是故障预测
(额在两年前画的小图片)
干这种事儿的目的是啥?
是把传统的状态监测智能化
把更多的预防性检修
变成预测性维护
把发现故障的关口前移
前移到维护阶段
从而最大限度的减少
消缺、检修、故障抢修
甚至是事故应急的概率
从本质上讲
业主干这种事儿不是为了获得
可以入账的经济效益
而是为了避免未来的损失
这与保险玩法是比较接近的
OK,开始聊NLP
NLP是个什么鸟?
是自然语言处理的意思
额初步理解
NLP的感知貌似做的不错了
比如微信聊天中的语音转文字
有了至少80%以上的正确率
那么,NLP难在什么地方呢?
额觉得,难在认知上
就像我早上发的这个段子所讲的
女生怕男生不来,但又怕他乱来
18岁以上的正常人
都能正常理解这句话的意思
但是
如果让机器来理解这句话
不知道会出现什么结果
这就是认知的问题
从前好几年
额在新浪博客的京东藏宝斋上
写过很多大数据的段子
其中就提到
革命样板戏《红灯记》中
李玉和关于木梳的一段对话
如果让机器去理解
不知道会出现什么结果?
从前的文章
我把大数据是这样分类的
四个维度,分别是
结构化数据、非结构化数据
实时的、非实时的
还构建了一个特别捣糨糊的场景
是关于结构化数据和非结构数据
跨断层分析的问题
说
有3亿人每晚讲鬼故事
吓得另外5亿人每晚开灯睡觉
第二个月
统计局的数据出来了
说
上个月全社会用电量增长了
也知道是居民用电量增长
但是
增长的原因到底是什么呢?
又有谁能知道
其中有
3亿人讲鬼故事的贡献呢
这是NLP在认知上的另一个需要解决的问题
想当年,额写这个捣鸡毛的段子
是为了批判社会上
有一种非常错误的认知
即
大数据只需要研究相关性
而不需要关注其动因
借机mark一下
额对考古学的痴迷
已经超过了大数据和电力应用
今天
领导给我一个任务
学习一份新科技公司的资料
额发现他们有两个解决方案
一个是关于RPA的
一种场景是关于电表缴费复电的
额很替他们担心啊
另一个是关于NLP
貌似在认知上还需要多多努力啊
这个翡翠小丢丢
额什么时候才能完工呢
额喜欢把正经事儿,用特不正经的style来表达,故自称【爱胡扯】
当场景发生改变时,大数据和人工智能的数学模型有可能是靠不住的
龙山时期『鬲』和『鼎』的变换,显示了什么样的气候和人文环境的改变