查看原文
其他

在智能金融的巨浪前,收下这份AI解读贴

贸易金融 2020-09-06

以下文章来源于Fintech的八宝粥 ,作者八宝粥 & 猫头鹰

文 | 八宝粥 & 猫头鹰

来源 | Fintech的八宝粥(ID:zhouqiwenzhou)


最后,只剩下神一样的他们,和蝼蚁一样的我们
——尤瓦尔·赫拉利《人类简史》

那一夜

1980年,伦敦郊区。一个四岁的小男孩,在父母的玩具店里,发现了一盒国际象棋。

黑与白的世界,映入这个有着东方血统、黑头发的孩子眼中,黑色的眼珠散发出琉璃般的光芒。

两周后,他学会了国际象棋并赢了大人。此后,一路开挂,5岁参加比赛, 13岁时成为所在年龄段世界第二。

8岁时,他用参加比赛赢得的200英镑,为自己买了人生中第一台计算机。

2016年1月,他带领的DeepMind公司宣布阿尔法狗Alpha Go攻克了围棋,并将正式挑战人类棋手。

他叫戴密斯·哈萨比斯Demis Hassabis。

为什么围棋是世上最复杂的游戏?因为把围棋每一步的所有可能算在内,大概有10的360次方种可能,比全宇宙所有微粒子加在一起的数量还要大,理论上不可能穷尽。

2016年3月,AlphaGo与围棋世界冠军、职业九段棋手李世石大战5盘,以4比1获胜。

从此,AI人工智能,妇孺皆知。

4:1。在第三局,李世石白78挖,祭出“神之一手”,扳回一局。

上图:1为白78,9为白86。(李世石执白)

获胜后的那一夜,疲倦的李世石安然睡去。朝阳升起后,他还是他。

那一夜,AlphaGo一夜未眠,深度学习100万盘棋谱。朝阳升起后,再无人类胜过它。

直到2017年10月,经过3天训练阿尔法元AlphaGo Zero以100:0完胜它。

此前,AlphaGo训练数据为3000万盘,而阿尔法元则只用了490万盘。此前阿尔法元对阵打败柯洁的AlphaGo Master为压倒性的89:11,经过40天的自我对弈后,它以100战全胜超越了AlphaGo Master。

AlphaGo和AlphaGo Master的训练数据都是人盘局。

而AlphaGo Zero,如你我一样,是真正的自我学习,随后独步天下。
但是我们和它不一样。

因为人脑终有极限,算法永无倦时。

“Zero”意味着从0开始。自我学习的AI也许真是人类历史的新纪元。
2017年,教育部、国家语委发布《中国语言生活状况报告》中,“阿尔法围棋”入选2016年度中国媒体十大新词。

“只可意会、不可言传”中的暗知识

《圣经》中记载人类联合兴建了通往天堂的巴比塔。为了阻止人类的计划,上帝让人类说不同的语言,从此人类不能沟通。

如果发生在今天,即使通天塔倒下,无需语言,我们依然可以心意相通。

2019年3月30日,加州大学旧金山分校Joseph Makin 等人在 Nature Neuroscience上发表论文,题为《利用 encoder-decoder 框架,将大脑皮质活动翻译为文本》(Machine translation of cortical activity to text with an encoder–decoder framework)。

上图:自然杂志论文

通俗的讲,当脑机接口(brain-computer interface,BCI)与人工智能结合,“只可意会、不可言传”成为现实,虽然“盈盈一水间,脉脉不得语”,却依然“心有灵犀一点通”。

和人工智能一样,脑机接口也是综合交叉学科,都有着漫长的研究史。

只是过往,很多科学家付出汗水,依然步履维艰。

| 人工智能的概念在1956年左右正式提出。20世70年代专家系统兴起,带动第一次高潮。20世纪80至90年代中期。随着应用规模扩大,应用窄、推理单一等问题暴露出来,归于沉寂。20世纪90年代中至2010年,由于互联网发展,AI进一步走向实用化。1997年IBM深蓝战胜了国际象棋世界冠军卡斯帕罗夫,是决策树为代表的AI发展颠覆之作,此后决策树方向再无进展。2011年至今,随着技术的发展,以神经网络深度学习为代表的AI飞速发展。

人工智能领域包括多个知识领域:自然语言理解/处理、计算机视觉、图像视频识别、语音识别、数据挖掘、人机对弈等,包括多种算法:是知识图谱、决策树、朴素贝叶斯、支持向量机、回归模型、博弈论、遗传算法、聚类算法、神经网络(深度学习)、强化学习多。

脑机接口的研究已持续超40年。早期主要聚焦人体植入设备,用于恢复损伤的听觉、视觉和肢体运动能力。后期研究主线是利用大脑不同寻常的皮层可塑性,与芯片计算机接口后,可以像自然肢体那样控制植入的假肢。

3月的Nature论文依托人工智能另辟蹊径,提供了一种“无创”的脑机接口模式。

假设你是受测者,见证奇迹仅需四步:

第一步:你大声读一组30到50个句子。

第二步:当你读时,大脑皮层产生的脑电波转化为信号数据,随着你头上的电极传到高密度脑电图网格(请脑补心电图,只是这个更高级)。

第三步:研究人员收集脑电波信号和对应句子,转化为数据输入到“编码-解码”的人工神经网络。换句话说,AI上场了。

第四步:“编码-解码”构成训练数据集,用于训练一个机器翻译模型,就像用人类流传千年的棋谱训练AlphaGo一样。训练后机器知你懂你。

从此,你脑中无论电光火石,还是千言万语,都可瞬间转化为文字。

这个奇迹的前提是训练数据集,数据是AI之魂。

只需提供30到50个独立句子,凭借“稀少”的数据,AI就能醍醐灌顶,覆盖你全部的语言世界。

人类的闪光时刻,很多类似于围棋中的“神之一手”。虽落子有感,却说不出落子背后的原理。

这就是人工智能挖掘出的“暗知识”。

一直以来人类有两种知识,可以用语言、文字或公式表达和描述的是“明知识”;另一类是个人通过经验数据得出,在感觉上能把握,但无法清晰描述,“只可意会,不可言传”,名为“暗知识”。

人工智能的神奇在于,通过神经网络深度学习,能够发现隐藏在海量数据中万事万物的关系。

神经网络的出现:知识的基础是记忆,记忆的基础是关联,而关联的形成是通过大脑中神经元的连接形成的。大脑中大约有1000亿个神经元,每一个神经元可以从许多其他神经元接收电脉冲信号,同时向其他神经元输出电脉冲信号。这个发现启发了计算科学家,他们模仿神经元,搭建起N层的神经网络。神经元的功能可以用数学函数模仿,而函数的权重可根据打标的输出来优化调优,从而找到一组输入信号和输出信号之间最优的数学或逻辑关系,而最终训练好的复杂神经网络就是那个数据或逻辑关系的表达, 它组合了数量众多的神经元和神经元之间的数学表达。

神经网络最广为人知的缺点是“黑箱”, 这意味着复杂的神经网络所包含的逻辑或数学关系,没有办法用直观的,人类能明白的,哪怕复杂的数学公式表达出来。

通俗的讲,你不知道神经网络如何输出,以及输出什么?当你将一张猫的图像输入神经网络,神经网络预测这是汽车时,很难理解为什么会导致它产生这个预测。这就是为什么还没有银行使用神经网络来预测客户是否有信用,因为他们需要向客户解释,为什么他们无法获得贷款,否则客户会产生误解和不满。

能够自我学习的阿尔法元使人类意识到,我们能发现的知识和AI发现的知识相比,只是冰山一角。AI发现知识的速度远高于人类,发现的复杂度也超过了人类,既超过经验,也超过理性。

魔幻的惊喜,将贯穿我们的余生。

只知大势将至,不知未来已来

人工智能与其说是一种技术,不如说是一种理想。

AI最喜欢的舞台,正是充满了数据,多种决策要素交叉的行业。

金融当属其一,银行4.0的时代无疑是智能的时代。

在华尔街,AI领军人物本·戈泽尔博士带领的团队,创造了一个名为“基因进化”的系统。系统由多个AI引擎构成,在分析所有的股票价格、交易量、宏观数据之后,所有AI引擎,会聚在一起“开个会”,做市场预测。然后,AI们会投票选出最佳市场决策,进行股票交易。全程不需要任何人类干预。

还是在华尔街,摩根大通研发的智能金融合同解析软件,将原先每年需36万小时的人工工作,缩短到秒级,不但错误率大大降低,还不用放假……

在中国的金融圈,AI的金融应用,主要集中在智能客服、智能营销、智能投顾、智能支付、智能理赔、智能投研、智能风控等场景。

例如智能客服,即使你没有用过金融机构的“智能客户”,你也体验过淘宝京东的客服机器人。虽然有时它的答非所问让你无可奈何,但是对于常规问题,的确省了很多人工。

例如智能投顾,2016年年底,招行“摩羯智投”在手机APP上线,由此,智能投顾从实验技术转变为主流趋势,成为金融机构的标配服务。大型银行中,工行、中行、建行已陆续推出相关产品;股份制银行中,浦发、中信、兴业、平安、广发和光大银行也推出了自己的产品;城商行中江苏银行早在2017年8月就推出了“阿尔法智投”。

例如智能风控,依托机器学习、深度学习、自然语言处理、知识图谱等底层核心技术,可提供预授信行内白名单、贷前准入、贷后预警、收益评分、信用卡激活促动、信用卡贷后调额、智能催收等多个场景的解决方案。各行的秒贷系列,背后最核心的技术是智能风控。

这些智能金融服务家族,相信你已听过,也尝鲜过,笔者不再赘言。

未来,作为银行数字化转型的“风口”,人工智能不仅是现阶段金融科技的热点,也将对未来的金融业进行颠覆性重塑。

人工智能在前端将成为银行沟通客户、发现客户金融需求的重要手段,在中台,智能风控将在信贷、反欺诈、异常交易检测等领域充分发挥作用,为欺诈风险的分析和预警监测提供颠覆性支持,在后台,将支持授信、各类金融交易和金融分析中的决策。它将大幅改变现有金融产品与服务的格局,曾经“天马行空”、“海市蜃楼”的金融创想即将实现。

这就是一切吗?

能成气候的互联网场景建设有四大要素:刚需、高频、低门槛、免费。

免费不是不需要花一分钱,而是可免或者通过其它方式补贴。打折或很多促销活动都是广义的免费。

对于金融行业,目前来看同时满足四大要素的只有支付,最遗憾的也是支付。

支付是消费者与企业互动频率最高的金融服务,是所有金融生态建设最容易撬动的杠杆。遗憾的是对标支付宝到微信支付,再到后起之秀京东金融等,商业银行在个人移动支付占有率的确堪忧。

中国移动互联网支付用户规模约为8.9亿。微信用户8.2亿  用户渗透率85.4%。支付宝用户6.5亿  用户渗透率68.7%。四大类支付场景的使用率分别为:个人类95%、线下消费类86%、线上消费类82%、金融类20%。一线、二线、三线城市的用户渗透率分别为:90.4%、93.5%、92.4%.国外消费近90%中国游客使用移动支付而非银联卡。

一切已成定局吗?

大胆假设,未来脑机接口技术普及,数字货币已经广泛流通。人人都成为半人半机器的生物体,支付不用掏出手机,不用刷人脸,不用输手机后四位,一个眼神、一个手势、甚至一个意念即可支付。

当体验更佳、成本更低、更加安全的智能支付出现时,用户善变,一切皆有可能。


未来有多远,一步之遥

最遥远的距离,在于数据。

三月初,26岁的龚飞和弟弟在贵州铜仁老家滞留50多天后,在家门口成了同事。兄弟两现在都是支付宝人工智能训练师,工作地点就在县城。工作半个月后,龚飞发现,在大山里给人工智能打工,比到大城市给人打工“划算多了”。

疫情期间,支付宝培训并上岗了10万名人工智能训练师。两兄弟只是十万分之二。他们的工作是为数据打标,以便让人工智能更聪明。这份月入3000到6000元的工作,让很多农民工决定留在当地就业。

你没看错,农民兄弟在为数据打标。

人工智能,首先是人工,然后才是智能。

金融行业的人工智能有四道坎,即数据短板、场景困惑、人才困境和成本焦虑。

数据的密度、数量、质量和关联场景的复杂性,以及手工对原始数据的第一次打标的科学性,决定了一家金融企业的智能化能够走多远。

根据2018年的公开数据,滴滴每日路径规划次数超过90亿次,日均定位数超过130亿次。每天新增数据量超过70TB,每天处理的数据量超过2000TB(1T等于1024字节)。

而这一切的基础,在于滴滴得天独厚的财富——海量的出行大数据。

每辆在滴滴平台上的车辆,每隔几秒就会向滴滴大脑这一智能系统传递信息。滴滴大脑的使命,正是利用 AI 技术,从海量的出行数据里面挖掘有用的信息来提高人们的出行体验和效率。

打开淘宝,每个人的配色和菜单里的商品都不相同,背后是一个叫Lubanner(中文谐音鲁班)的AI人工智能设计师 。

它的slogan是——让天下没有难撸的Banner!和阿里爸爸如出一辙。

上图:鲁班AI智能设计成果

2016年“双十一”,鲁班在阿里内部大规模投入使用,目前其设计水平已接近专业设计师。2017年阿里面向社会发布智能设计平台鲁班。此平台的原理是通过人工智能算法和大量数据训练机器学习设计。

当前,1秒钟,鲁班能设计出 8000 张海报,已累积设计超10亿张海。并且千人千面,阿里的banner已从纯商品个性化跨到广告资源位个性化的。

在阿里内部,鲁班和真人一样有入职记录, 今年已是P6 设计师水平。在阿里,这个等级可以担纲中等设计项目主创人员。而他的效率绝非人类能及。

鲁班的背后,是包括淘宝在内的阿里系,近7亿的月活海量数据。

以最近大热的直播带货为例,截至2018年9月,淘宝内容创作者收益已超过30亿,仅淘宝平台,每天就有19亿的短视频播放量,用户在淘宝上平均每逛100个商品,便有42个商品可以通过短视频进行展现。

经过多年的信息化,国内金融业沉淀了大量数据。

抛开数据完整性、有效性等必需要求外,单看满足AI的数据多元性,传统金融业依然有长路要走。

以智能风控为例,传统银行的风控数据是强金融数据,主要依赖身份属性和金融交易数据等资金流,而互联网企业的大数据智能风控认为围绕用户的所有数据都是风险数据,包括你看直播时的打赏和菜鸟的收货确认。头部互金企业根植场景生态多年,凭借掌握的从衣食住行到物流配送的弱数据金融化,再提炼风险表征,借助AI形成“数据+决策+监控”的智能风控动态闭环。

庆幸的是,很多传统金融机构已走出封闭的体系,开启了场景金融的大幕。

在AI的时代,金融在线成为主流,万物数据、场景数据、金融数据叠加后,数据量激增,将超出了人的经验范畴和处理能力边界。

金融数据、非直接金融数据(比如语言、图片、生物等数据)、非结构化数据结合(比如经济生活场景数据)恰是人工智能最擅长处理的领域。 

当然在此之前,最重要的是数据,特别是有标签的数据。此外,强大的计算能力必不可少。(这涉及AI芯片问题,也是中国AI发展的短板,大家如有兴趣,笔者改日奉上)

有时,一步之遥,山长水阔。

人有再少之颜

墓有重开之日,人无再少之颜。

这12个朱砂红字,出现在山西高平市一座五代空墓的墓壁之上。

人无再少之颜,千年之后,苍茫依然。

惊喜的是,在看得见的未来,AI让我们出走半生,果然还是少年。

在AI的无限可能中,笔者认为最普世的价值,不是在金融,而是在生命科学领域。

2月15日,阿里宣布研发了一套针对新冠的诊断技术,可在20秒内做出CT判断,分析结果正确率达96%。早在去年5月,阿里和欧莱雅共同发布了全球首个AI检测痘痘应用。痘痘,那是多少人青春的噩梦。

未来回首,这些都是浮云般的小儿科。

从文艺复兴时代走来的现代生命科学,一直进行的是相关性或线性因果研究,而生命科学的本质是非线性因果。基于大数据和深度学习的人工智能,最擅长以有限的信息推测全貌、发现规律。

这是揭示生命科学的上帝之手。

2018年12月,谷歌AlphaFold成功根据基因序列预测了生命基本分子——蛋白质的三维结构。
AlphaFold和AlphaGo是孪生兄弟。后者围棋,前者将人工智能转向了人类科学中最棘手的领域——基因医疗科学。

所有生物都由蛋白质构成。如同阶层割裂,引发深切焦虑的《北京折叠》,一旦蛋白质折叠错误,就会导致糖尿病、帕金森症和阿尔茨海默病等疾病。所以,预测蛋白质折叠结构意义重大,基本上能解决所有涉及生命系统的问题。

2019年3月5日DeepMind 宣布他们用 AlohaFold 生成了六种可能与新冠病毒有关的蛋白质结构预测结果,已开放下载。这一结果可能对新冠病毒疫苗研发等工作起到推动作用。稍作解释,我国的科学机构已经公布了COV 19的DNA序列。通俗讲DNA的序列只是罗列出了一道菜的成分, 至于这些成分是如何拼接在一起的(也就是蛋白质结构)才至关重要,直接决定如何研发有效的药物。因为COV 19是个超大的蛋白质病毒,计算所有可能的3D结构是天文计算量,此刻AI出场了。这就是AlphaFold与国内科研机构工作的不同之处。

众多世纪难题、人生悲叹将就此解开。所以,谷歌说这是一个灯塔项目。

人工智能+基因科学不再是科幻,不再是试管中荡漾的液体和双螺旋体中孱弱的灵魂,而是实实在在的宿命。

当前,基因检测已走向市场,今后检测将和用体温计量体温一样便捷。

在生命的初期,每个新生儿会同时拥有出生证和被绘制的基因组图,每个成年人都将通晓生命出路。

在生命的成长期,人工智能医生将逐渐取代人类医生,可以为病人添加缺少的基因,删除不好的基因,靶向药扫荡癌细胞,DNA编程逆转衰老,干细胞被改写,上帝的密码防线崩溃。基因治疗不仅重塑体内一切组织和器官的活性,并能够开发出药物,直接锁定一种疾病背后的代谢流程。

奇点大学校长、谷歌技术总监库兹韦尔认为,到2045年,人工智能的创造力将超过今天所有人类智能总和的10亿倍。到那时,人工智能开始大规模改造人类体内的“生命软件”,即人体内被称为基因的23000个“小程序”。

通过全新的基因编程,人类上千年不再使用的陈旧基因将被抛弃,我们的生命升级成为一个更高级的操作系统。

到时八十岁的你,看上去只有四十岁的样子。

对于大多数70、80、90后,现在你只是在生命的青春期。

还会有死亡吗?天晓得。

当感知设备代替了你的眼耳鼻口;当你的记忆从脑电波变为数据,以比特方式被存储在云端;当AI能够模仿你全部的语音语调、思维习惯、行为逻辑;当虚拟现实能够呈现出另一个一模一样的你……有记忆、能表达、会思考、会学习、会行动的你,还在乎死亡吗?

从此,生仍有欢,死又何惧。

魔幻之外的担忧是,人工智能的进化速度可能超过人类,它们的终极目标不可预测的。

霍金生前最后一本书《大问小答》中表达了对“人工智能+基因科学”的担心”—— 一群超级人类将通过基因工程,甩开其他人类,最终接管地球。

担忧会成为现实吗?天晓得。

能知的是,在人类的已知技能中,貌似AI最拥有执一御万的能力。

打开DeepMind的主页,赫然写着——

What if solving one problem could unlock solutions to thousands more?

执一御万,未来可期。


感谢Y老师指点选题
感谢猫头鹰协助,轻舟和水姐姐指教


长期坚持提供干货不易,如文章引起大家共鸣、对大家有帮助,请大家赞并转发,以支持我们提供更多干货,谢谢。

专注十年,持续打造全面有价值的贸易金融知识库

更多关键词,请到公众号对话框输入,获取更多干货

商务合作:手机号同微信:18501955840(备注合作事由)研报定制/公众号代运营/内容撰写服务:18600329996

定制线上直播课:刘老师 15601009440

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存