「Azure」数据分析师有理由爱Azure之一-Azure能带给我们什么?
The following article is from Excel催化剂 Author 李伟坚
前面我们以相同的方式从数据分析师的视角介绍了Sqlserver,本系列亦同样地延续下去,同样是挖掘数据分析师值得使用的Azure云平台的功能。因云平台功能太多,笔者所接触的面也十分有限,有更专业的读者欢迎补充。
对云服务的一点点小认识
笔者接触Azure云时间不长,因没有IT背景,故对各大云市场也只能是浅尝即止,有关注Excel催化剂插件的读者们,也应该对笔者使用其他云市场有一些的了解。
Excel催化剂的自动更新机制是放到阿里云上完成的,对应的云服务是构建云服务器(比虚拟主机要高级,可以完全自己管控整台机器),但是软件授权都是没有的例如数据库(WindowsServer系统貌似国内使用免费)。
同样地在Excel插件功能上也使用了百度云的人工智能模块如自然语言处理、图像识别功能,翻译功能。
Excel插件的短信功能使用了腾讯云上短信接口服务。
因过往这些功能都是为了让个人用户可以有免费额度使用,也费尽了心思在各大云市场里寻找免费资源。
第15波-接入AI人工智能NLP自然语言处理https://www.jianshu.com/p/56a0616125fa
第86波-人工智能之图像OCR文本识别全覆盖 https://www.jianshu.com/p/7ac57a2af845
第85波-灵活便捷的批量发送短信功能(使用腾讯云接口) https://www.jianshu.com/p/2bd2d05dc541
总的来说,云服务就是可以给我们提供各种基础服务,如给我们一台电脑(服务器)或给我们一些空间存储(百度云之类的)或给我们一些调用接口(短信、人工智能等),可以让我们无需IT的支持,也可以用上很多的功能,并且是可以联网共享的,花钱方式也可以少用的少花,多用的多花,按需消费。
对Azure云的接触过程
对Azure云的了解是参加了一次微软举办的Azure动手实验营,虽然当时在课程上也是一脸懵逼,课程上都是以IT型的方向讲解,一来就讲怎么快速搭建个linux系统,怎么开Web应用程序,作为数据分析师的笔者根本一点不感兴趣。
幸运的是知道了怎样去学习和微软还是比较良心地提供了1元套餐1个月免费可以学习使用。
微软新开了一个频道叫Learn,里面的教程还是比较靠谱,偏动手实验方面的入门型,还有免费沙箱可以模拟环境使用,不像MSDN一上来就是文档化,没上手前根本看不动。
https://docs.microsoft.com/zh-cn/learn/browse/
还有搜索功能,不过不知道中文和英文的learn是不是也有区别,反正中文感觉教程不多,有些英文还没汉化的样子。
笔者就是从learn教程中,稍微熟悉了PowerShell调用Azure的基础知识。
Azure对数据分析师的价值
对于不是专业IT背景的数据分析师来说,大部分的基础性IT系统、环境,都不应该我们自己去搭建处理,可能第一印象云服务和我们关系不大,但笔者也还算找到一些比较刚需的东西,可以和大家一起分享下。
数据分析过程中,不可避免遇到非结构化的数据,这时各大云市场的人工智能接口,也是不错的选择,就像笔者前面所述已使用了百度云的人工智能接口,当然Azure上也有人工智能方面的,具体收费还没太多关注(百度貌似也快转向收费了,免费的资源越来越少)。
除此以外,笔者近期做的BI项目中,接触到了Azure SQL服务和Azure Analysis Services服务,重新对Azure的使用价值有了新认识。
作为数据分析师来说,前面一个专题系列给大家讲述了Sqlserver的价值,这里不再复述。此篇告诉大家一个非常利好的消息是,我们可以将使用Sqlserver的技能全盘搬到Azure SQL上来,Azure SQL就是云上的Sqlserver。
大部分IT人员经过比较后,都对Azure又爱又恨,爱的是提供的东西真的太好了,还可以用PowerShell进行自动化运维,和本地的IT环境可以无缝对接,若用的是微软全家桶(OFFICE365+Exchange邮件服务器+Active Directory活动目录等),真的非常爽。但费用摆在那里,贵得难以接受。
经笔者认真考察过,使用Azure SQL这们的云数据库功能,微软非常良心地给我们低廉的入门价格(在数据分析的用途上其实也用不上太高级的功能,性能慢一点,并发差一点也是可以忍受过去的,何况我们最终的Azure SQL的数据是为我们下一步Azure Analysis Services服务,最终只需分析服务作数据输出即可)。
笔者在项目中也正是使用Azure SQL+Azure Analysis Services的方案,实测效果还不错,价格也是非常无负担,作为个人都可以承担的手机话费一样几十块钱一个月而已。
Azure SQL按使用量和性能计费,永远是最新版的Sqlserver,这个对我们追求功能强大的分析师来说,无疑是极大的利好消息。
所以若从数据分析师的角度来看,选择Azure SQL,真的是性价比越高,体验最棒。Azure SQL的按使用量收费,精确到分钟级别的,随时不够用加大性能,不用时关掉或降低性能,非常灵活,已经垫付了笔者对包年使用更便宜的固定思维了。
使用PowerShell对Azure服务资源进行关开升降操作,是一门很考手艺的活,也是笔者对PowerShell充满热情的所在,真金白银省下不少钱,例如上述的月费用,若优化下来,至少还可以节省一半以上(工作时间一天算12小时,其他时间关着)
另外在自助式BI工具PowerBI闹得火热的时候,其实论及功能扩展和性能满足来说,单单靠廉价的PowerBI Pro帐号体系里的公有云环境,模型一大,就没法太好操控,随着用户量的加大,PowerBI Pro性价比也不见得太优。
笔者在项目中接触到Azure Analysis Services,可以用它作为后端数据模型层,在前端展示上可以少量PowerBI Pro+Excel+PowerBIDesktop等方式来满足用户需要(PowerBI的玄丽可视化说实话,在传统Excel群体中特别是财务领域,也不见得是个多么刚需重要的东西,买几个PowerBI Pro做几个报表给高层看看就还好,大量底下一线分析人员,回到Excel或者只需PowerBIDesktop免费版即可)。
同样享受着Azure的低门槛进入的红利,在Azure Analysis Services的最低版本中,月费用也不过是1000+,非常容易入门。结合性能调优的资源开关升降操作,初始项目1000以内每月都可以实现。
在Azure Analysis Services中,有Sqlserver的Analysis Services一切优势,可满足开发企业级的BI项目需求,当然部门级的小范围使用就更容易了。有完善且免费的AAD(Azure Active Directory)帐号体系支持。比本地的Sqlserver用起来更舒服流畅,运维成本低,免高昂的数据库Sqlserver和Windows软件授权,真是难得一遇的好方案。
其他还在探索中的方案
Azure作为全球市值第一的微软的重头戏主推产品,时代所需,作为普通数据分析师,也需要顺势而为,认识并尽早使用这一重量级的云产品,必然能够给自己带来很大的红利价值。
作为数据分析师的角色,其实Azure上还有许多可挖掘的领域如机器学习领域,认知服务如人工智能领域还有云上数据中心的数据工厂等等,笔者也还在学习过程中,后续若有学成,再给读者们分享,也欢迎大家将自己所接触到的Azure其他的好东西分享一下,让笔者也能跟上。
笔者未来聚焦在数据领域的分享,不限于Excel,会分享更多Sqlserver、dotNET、Azure、PowerBI等话题,升级数据分析的能力,欢迎继续关注。
关于Excel催化剂
Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!
Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!
Excel催化剂插件下载链接:
https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q
取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。
最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!
关于Excel催化剂作者
姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。
服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)
技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。
历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。
擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。
在Dynamics365V9版本里创建使用统一界面客户端的App
Flow自动抓取SharePoint站点列表并发送邮件和附件
注册微软开发者社区
更多活动资讯一手掌握