查看原文
其他

《数亦有道》配套代码云端迁移进展

王树义老师 玉树芝兰 2022-06-08

在之前的 一篇文章 里,我给你分享了翟羽佳老师上传到百度飞桨 AI Studio 的 《数亦有道》 配套代码。

当时的迁移,可以让你及时下载书中的配套代码。但其实,我们还有更高的预期,就是连同运行环境,一起布置到云端。这样一来,书上的每一个示例,都可以一键部署为 AI Studio 项目。直接运行,就能出现对应的正确结果。

你再也不必因为书中代码运行环境与你本地环境的差异,被各种报错和非预期运行结果折磨。

从那时起,我们组织了数据科学系五名大一的同学,来做这个事儿。他们这学期,在学《数据科学导论》课。这个工作刚好也可以帮助他们,加深理解课程内容。

一个月的摸爬滚打,他们体验了各种花式报错。

多番讨论与测试后,目前大部分的代码都已经上线了。

他们做的结果,已经放到了这样一张可以随时更新的飞书表格中,与你共享。在我的公众号后台回复「数亦有道」,就可以获取链接了。

这张表格里,你可以看到代码对应的章节名称,以及做好的 AI Studio 项目链接。

你只需要点击「运行一下」就可以一键复制完整的环境。

运行的时候,只要选择的是 CPU ,则可以享受每天免费的运行时长。

我说说做这个事儿的必要性。

之前跟你说过,书上所使用的代码,在写书的那一刻可以正常执行,但是底层的环境不断变动。有些软件包升级的时候,调用方式也发生了改变,而且所用的硬件、操作系统、软件版本等区别,都有可能带来执行错误。

对于初学者来说,这些小问题,可能是灾难性的。想想看,两个小时都搞不定中文乱码,还怎么有足够的信心和兴趣继续往下学呢?

而换做在这个云端环境中运行你的代码,则因为环境统一,大概率可以消除各种稀奇古怪的问题

不过请注意,当你看到这篇文字的时候,可能距离本文写作和上述项目迁移,又过去了一段时间。我无法保证将来你执行的时候,所有的代码都能完美执行,不会报错。当然,我们后续也会不断更新云端代码。但是,这种更新,不可能随着无数底层软件包的更新,即刻发生。

若你在云端环境,真的遇到了报错,实际上是一个很好的学习机会

首先,我们已经把所有原理性的内容,都在书中进行了详细的讲解。这种详细,几乎是针对于每一行代码的。

因此,面对错误提示,你可以立即聚焦在出现问题的那个部分。翻看软件包更新文档,自行尝试对比调用方法的差异。然后修改调用方法,解决问题。

这就叫做必要难度,可以把你从「舒适区」引向「练习区」。我在知识星球里,写过一篇《刻意练习的辅助线》,强调过不断把自己置于练习区的方法与重要性。感兴趣的话,欢迎阅读这篇文章

其次,你要学会求助。我在《Python 编程遇问题,文科生怎么办?》一文里,给你介绍过遇到问题后的处理流程和步骤。尤其是该怎样求助,才能更有效。这部分内容收录在《数亦有道》一书的第 10 章,欢迎你翻看查阅。

有了和书中一致的运行结果作为起点,你就可以放开手脚,尝试去修改其中内容。例如使用你自己的数据,或者调用不同的分析与可视化功能,从而满足你对于数据分析和学习的个性化需要。



以下是几个说明事项:

第一,尽管本书大部分内容是在 Python 环境下编写的,但也有部分代码使用了 R 环境。写作本文时, AI Studio 尚不完整支持 Rstudio 环境,所以在这张表里没有使用 RStudio 对应内容的链接。如果你知道和 AI Studio 类似的免费云环境,可以支持 RStudio 的在线运行和链接公开便捷共享,欢迎在留言区分享给大家。谢谢。

第二,AI Studio 支持 GPU 环境,因此完全可以做深度学习。然而在框架上,它只支持自家的 PaddlePaddle ,而不支持 Tensorflow 或者 PyTorch 等框架。因而本书深度学习部分的代码(主要用的是 Keras 和 fast.ai)无法在 AI Studio 这个平台上给你展现。不过别着急,授课过程中我已经找到了一个替代平台,后续教程会连同新的教学案例,一起分享给你。

第三,你会注意到表格里还有部分同学没有完成。我没有催促。因为这个项目,是大伙儿自愿参加的,没有报酬,因而不能做强制要求。据反馈说,她是在分享链接环节遇到了阻碍,于是就一直卡在那里了。我在此也想通过这个实际的例子,给你提个醒——在学习和工作中,遇到问题没关系,但要注意多和老师,或者已经成功完成该步骤的同学沟通请教,而不要一个人和问题死磕。学会求助和协作,是提升实践经验的重要基础。对吧?

最后,我想感谢一下参与代码迁移工作的五位同学,他们分别是:

李子浩、屈毅恒、石梦雨、吕玥函和吕芷萱。尤其是班长屈毅恒同学,组织了任务的分配和复核设置,建立和完善了这个飞书文档。在项目进展中,她一直注重沟通、解惑和提醒,表现非常出色。赞一个!

希望五位同学保持数据科学的学习热情。在今后几年的本科学习中,再接再厉,勇攀高峰。

欢迎你,我亲爱的读者,查阅和使用这些云端化项目代码,使你学习数据科学的路径更加通畅。

人民邮电出版社的编辑老师告诉我,「双十二」还有本年度最后一次《数亦有道》大幅促销活动,价格很合适。请大家留意关注。


祝学习愉快!感谢你的陪伴和支持。

既然提到「双十二」了嘛,知识星球也来个优惠。时间一周,名额有限,先到先得。

延伸阅读

知识星球目前已发布了数十篇精华文章。

我把标题和链接做了个表格,放在了飞书文档。欢迎你通过下面的二维码查看。

请订阅我的微信公众号「玉树芝兰」,如果不加星标,会错过新推送提示。

感觉有用的话,请点「在看」,并且把它转发给你身边有需要的朋友。

欢迎关注我的视频号,时常更新。

由于微信公众平台的限制,文中部分链接可能无法正常显示与跳转。如需访问,请点击文末「阅读原文」链接,查看链接齐备的版本。 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存