七年没能将 Python 集成到 Excel,Python 之父加入微软三年后成了!
近日,微软宣布将流行的编程语言 Python 引入到了 Excel。该功能的公共预览版现已推出,允许 Excel 用户操作和分析来自 Python 的数据。
微软表示,Python in Excel 能够在同一工作簿中将 Python 与 Excel 分析原生组合起来,无需任何额外设置。使用 Python in Excel,用户可以直接在单元格内键入 Python,相关计算将在微软云端运行,并将绘图和可视化等结果返回至工作表内。
“听起来像愚人节玩笑,但这是真的!”“太棒了!它肯定可以加快我的工作速度。”网友们听到这个消息后纷纷发出了感叹。为什么大家都对此感到兴奋呢?我们先看下 Python 的强大功能和 Excel 的灵活性结合后,都发生了哪些“化学反应”?
Python in Excel 即将通过 Excel for Windows 的 Beta Channel,向 Microsoft 365 Insiders 项目的会员们发布公共预览版。不过微软也表示在预览结束后,“如果没有付费许可证,某些功能将受到限制”。
首先,Python in Excel 专为分析师而构建。微软表示,每一天,全球各地都有数百万用户依靠熟悉的 Excel 工具(例如公式、图表和数据透视表)分析并理解自己的数据。Python in Excel 将以原生方式被直接整合至 Excel 网格当中。
用户只需使用新的 PY 函数即可将 Python 代码直接输入至 Excel 单元格中。Excel 用户可通过 Python 访问强大的分析功能,从而实现可视化、数据清洗、机器学习和预测分析等目标。用户现在可以创建起无缝对接的 Excel 加 Python 端到端解决方案,且全程无需脱离于 Excel 之外。使用 Excel 的内置连接器加 Power Query,用户还能轻松将外部数据引入 Python in Excel 的工作流程。Python in Excel 还跟用户所熟悉并喜爱的各种工具相兼容,例如公式、数据透视表和 Excel 图表等。下面来看 Python in Excel 所能实现的几种分析示例:
充分利用 Matplotlib 和 seaborn 等著名 Python 图表库的功能构建各类图表,包括传统的条形图、线形图,乃至热力图、小提琴图和群图等专用可视化效果。
使用 Seaborn 生成的各种图
利用 scikit-learn 与 statsmodels 等 Python 库,可以实现目前人气极高的机器学习、预测分析与预期计算,包括回归分析、时间序列建模等等。
使用 Python 和 Excel LAMBDA 构建的天气预测机器学习模型
可有效利用先进的数据清洗技术,例如查找缺失值、标准化格式、删除重复项,并可采用正则表达式等技术进行基于模式的转换。
使用正则表达式提取日期
其次,Python in Excel 通过 Anaconda 实现顶级 Python 分析功能。
Anaconda 是全球数千万数据从业者日常使用的领先 Python 项目。Python in Excel 可使用运行在 Azure 当中的 Anaconda Distribution for Python,其中包含最流行的各 Python 库(例如 pandas、Matplotlib、scikit-learn 等),并由 Anaconda 安全完成构建、测试和支持。Anaconda 提供的 Python 功能,支持在 Python in Excel 中执行广泛的分析操作。
再者,Python in Excel 运行于微软云端,无需任何额外设置。
Excel 使用的 Python 代码运行在微软云端,并提供 Microsoft 365 兼容的连接体验。Python 代码使用 Azure 容器实例在自己的虚拟机管理程序内隔离运行,并通过安全的软件供应链从 Anaconda 处获取源构建包。微软表示,Python in Excel 可以防止运行的 Python 代码知晓用户身份,通过互联网打开的工作簿也在独立的容器内受进一步隔离,这就妥善保护了用户的数据隐私。工作簿中的数据只能通过内置 xl() Python 函数发送,且 Python 代码的输出只能作为 =PY() Excel 函数的结果返回。
另外,Python in Excel 专为团队协作而打造。
用户可以在 Excel 工作簿内共享 Python。各团队成员还可以在基于 Excel 的分析中无缝进行 Python 交互并刷新,不必分神安装其他工具、Python 运行时,或者管理库和依赖项。用户可以随意选择自己喜爱的协作工作(例如 Microsoft Teams 和 Microsoft Outlook)来共享工作簿,并通过评论、@提及还有与同事共同开发以进行无缝协作,整个体验过程与本地 Excel 无异。包含 Python 的工作簿还配合有敏感度标签,能够确保其符合组织内的信息保护策略。
该消息发布后,自称曾在 Excel 工作过的开发者“vba”爆料,Excel 早就试着将 Python 引入 Excel,但最终失败了。
作为一个曾试图将 Python 引入 Excel 的前 Excel 开发人员,今天看到这个消息真的很惊喜。7 年多前,我选择离开 Excel 团队。当时老板的老板知道我对将 Python 引入 Excel 很感兴趣,如果我选择留下的话,就给我一个机会来解决这个问题。后来,原本 6 个月的项目变成了大约 3 年的项目,Python 的部分消失了,我们最终在 Excel 中启用了 JavaScript 自定义函数。
对于 Python,我们当时也是设计为在“云端”(AzureML v1) 运行,尽管就是否应该在本地运行上前前后后做了很多讨论。我认为让 Python 部分消失的是我们的合作伙伴 AzureML 团队的重新重组、重新发布和重新雇佣,我们失去了一个 PM。与此同时,我们的工作引起了另一个合作伙伴团队的注意,他们意识到他们可以使用我们的代码来执行进程外的 JavaScript。所以我花了很多时间来确保功能成功发布,我想这对 Python 是不利的。
我得到了一些优秀工程师的帮助,也学到了很多东西。这项工作的核心是修改 Excel 的计算引擎,使其允许函数异步计算,允许用户在远程终端(JavaScript、Python 或其他工具)计算的同时继续处理电子表格的其他部分。以前,电子表格会在计算运行时被锁住,这对于长时间运行的无限计算来说不太友好。不知道我们当时构建的任何功能是否都被纳入了这项新功能。
现在,非常高兴看到这个功能,并期待去尝试。
微软表示,Python in Excel 的诞生,源自微软内部多个团队之间的密切合作,包括微软 Excel、微软开发者部门、微软安全部门、微软 Azure 以及微软研究院等。其中,Python 创建者、BDFL 荣誉退休人员、现任 Microsoft 杰出工程师 Guido van Rossum 也参与了这项工作,并帮助定义了 Excel 中的 Python 架构。
“我很高兴 Python 和 Excel 的这种出色的、紧密的集成现在已经面世。我希望两个社区都能在这次合作中找到有趣的新用途,从而增强每个合作伙伴的能力。三年前我加入 Microsoft 时,我做梦也没想到这会成为可能。Excel 团队非常出色!”Rossum 表示。
Rossum 如今已经 67 岁。2020 年 11 月,耐不住无聊退休生活的 Rossum 决定加入微软的开发者部门。当时,微软组建了一个团队来提高 Python 解释器的速度,他一方面参与 Python 自身的优化工作,还帮助微软的其他团队集成面向公众或面向开发人员的 Python 微软产品。
当然,除了官方团队,还有个人开发者也尝试过将 python 引入 Excel。开发者“bubblebobble”表示自己几年前构建了一个可用的“Excel 中的 Python”,还远程执行 sql 和 matlab&r。“当我要求进行 beta 测试的一些人说‘他们的公司不会为此付费’、让我觉得我在浪费时间时,我放弃了......”有网友安慰他:“你只是超前于你的时代!”
对于这项新功能,McKinney 公司数据与分析执行总监 Greg Barnes 称,“对 Python 的全面支持,是我在整个职业生涯中经历过的最令人兴奋的 Excel 更新!”他表示,在 Excel 中运行 Python 的功能,让 McKinney 成功简化了原有报告工作流程。“我们曾经在 Jupyter Notebook 中操作数据结构、过滤和聚合数据,并在 Excel 中构建视觉效果。但现在,我们可以在 Excel 中管理整个工作流,这使得 Excel 变得更加强大,也让 Python 在整个组织中更易于使用。”
而网友们也表示开心,但同时也有更多期待。“我希望它不仅仅由 Microsoft Cloud 提供支持,并且可以支持本地运行的 Python,但无论如何,我仍认为这会是巨大的项目,并且会在很大程度上使 Excel 现代化,仅此一点就可以消除只需要这种数据的网站的需求。我想到我以前做的一个项目,就是建立一个分析网站,内部只有少数几个人使用,如果当时有这样的东西,就能很好地满足他们的需求。”开发者“cableshaft”表示。
对此,网友“rawgabbit”称,“公平地说,Tableau Desktop、Tableau Prep 和 Tableau Cloud 虽然价格昂贵,但仍然是很棒的产品。借助 Tableau Prep,您可以获得可视化 ETL 工具。从技术角度来说,我更喜欢 SQL,但对于业务人员来说,Tableau Prep 更像是一个 REPL,因此他们可以看到自己的操作将要做什么。他们可以在 Tableau Cloud 中安排这些 Prep 流程,该流程将进行 ETL 并生成每日数据集,然后用户可以通过 Tableau Cloud 上的仪表板进行交互。在我看来,Excel 走在正确的道路上,它具有与 Salesforce、Azure 数据库等开箱即用的连接器。它真正需要的是带有 REPL 输出的完整 SQL,以便用户可以看到其 SQL 的效果。(Tableau Prep 的做法是默认对行进行采样以输出即时结果)。”
有开发者指出,云以及尽可能多的云集成是微软的核心战略。这是关于定期付款、锁定以及最终在他们自己计算机上真正拥有世界经济的知识和业务流程。这可能说明了为什么目前只支持云上运行。
还有网友指出,“Python 进入 Excel,成为压死 VBA 的最后一根稻草。”VBA 一直是 Excel 脚本编程的主要工具。VBA 简单易学、功能强大,在长达几十年的时间里为提高 Excel 工作效率作出了贡献。但随着 Python 的流行,越来越多的人用 Python 进行 Excel 脚本编程来提高工作效率,VBA 逐渐式微。
你对 Python in Excel 有什么看法?欢迎评论区分享哦~
参考链接:
https://techcommunity.microsoft.com/t5/excel-blog/announcing-python-in-excel-combining-the-power-of-python-and-the/ba-p/3893439
https://news.ycombinator.com/item?id=37222191
全行业视频化时代的技术革新:开源后的 BMF,将为视频处理领域带来哪些影响?
从传统存储到分布式存储,软件定义为我们找到了数据存储的全新答案,为了让大家更好地在业务中应用软件定义存储技术,InfoQ 联合天翼云策划了主题为《存储难题新解法,揭秘极致易用的 HBlock》的两期线上技术分享会,欢迎大家扫码或点击阅读原文报名,还可获得尝鲜期福利——至高 1PB 永久免费的私有云块存储服务!
读者福利
👆 中国企业研发高效能白皮书(合集)👆