由浅入深聊聊SAP Cloud Platform (Part III)
文 | 袁大兔
Part 3
实战大数据语义智能
Semantic Intelligent
感谢各位的投票与建议,第一个实战案例是一个SCP上的RDS Semantic Intelligent:通过抓取社交网络的信息以及智能语义系统和来对一些关键词的追踪。
这个RDS 到目前是第六个版本,最新的这个版本是完全支持SCP 并且分离了APIs 方便企业的功能集成(REST)。
目前有十来个大型企业使用已经部分地区的政府部门在使用中,最近的一个是飞利浦做的智能城市(Smart City) 有兴趣的可以去这个链接看看:
http://www.lighting.philips.com/main/inspiration/smart-cities/smart-cities-initiative/smart-cities-initiative-impact-analysis-sentiment
废话不多说,先来展示下:
主要的社交平台有脸书,google plus,youtube,twitter。如果其他社交网站支持API读取数据,也很容易添加渠道。目前舆情分析支持语言有:阿拉伯语,中文简体,中文繁体,荷兰语,法语,英语,德语,意大利语,葡萄牙语,俄语,西班牙语。
主要功能如上图。每个单独指标都单独分离成为一个小软件。在主页上只给出重要指标,点入后能够有更多的交互。以下会选取几个介绍一下内外页面的功能。
舆情
外:给出了所选关键词、关键词组的总体情况。
内:主要给出多种互动方式,可以对数据进行深度分析。
左边是控制,右边的表格会根据左边选择的进行实时分解。大致有如下几种图标,对于每条记录都能够点击打开来查看被分类到不同舆情的原因。以下这个iphone X的是因为hate (憎恨)这个单词。
02
评论
外:根据当前选的时间段,给出评论走势。
内:可以通过不同组合来看评论走势, 并且能够分解到小时。
03
最具影响力的人
外:给出前几位最具影响力的人。
内:对用户重要度进行排名,并且分析在当天话题、话题组下该用户的情绪。
当然你也能点击用户并且查看相对于的评论,并且查看具体的问题。
04
最具影响力的状态
外:前三个最具影响力的状态以及情绪。
内:正反面状态对比,影响力排名是根据多少人看,转发喜欢等来综合考虑。
05
热门趋势
所设置的关键字在全世界或者任何国家的搜索情况,以及类似关键词推荐。
06
热议地区
以热点的方式在地图上显示出坐标。
如果有街景图片甚至能够直接查看所在地照片。
服务器需求:
目前这个服务器上大概有2.4亿条记录。每个人只能查看自己创建的,所以我上面数据只是我的账号所有的关键词。
大概是3000 个左右的关键词,使用了一个128GB内存的HANA服务器和7个JAVA的容器和一个HTML5容器,目前内存占用率在85左右。
最低配置:需要2个JAVA 容器和一个HTML5 以及64GB内存的HANA服务器来进行配置。
下期如果有需要可以展示如何配置以上这个方案,或者是其他案例。
欢迎留言分享你的看法。
关于作者
InweHub用户名:袁大兔。资深SAP开发者,对HANA,SAP Cloud Platform,Fiori,Blockchain等相关领域有深入理解,现就职于SAP美国公司。
近期热文:SAP世界生存指南(2017版)
近期热文:替代SE16N的超强悍SE16H
近期热文:每个顾问都该有的底层逻辑
近期热文:3分钟判断SAP顾问水平