查看原文
其他

学妹:大学四年以算法为重还是技术为重?

脚本之家 2022-04-23

The following article is from 编程指北 Author 编程指北

 关注
脚本之家
”,与百万开发者在一起
出处:编程指北(ID:cs_dev

如若转载请联系原公众号

经常有学妹问我(其实学弟也爱问):

大学应该更偏向技术还是算法和数据结构这类。

大家都是成年人了,这还用选吗?

当然是两者都要重点啃下来呀,算法和技术相辅相成的,一定不要有二选一的想法!

算法和数据结构可以说是技术(包括MySQL、Java、Redis、操作系统这些)的基石:

我当时大一也是觉得数据结构没啥用,哪有学个 JS、CSS 写个漂亮的网页炫酷?

什么算法,明明有 qsort 还要学快排、堆排?

这玩意有 qsort 快吗?

我直接一行就排好序了,你还要写十几行,真菜呀!

那时候以为的技术就是使用各种组件、调API,比如 Map:

但是越学到后面心里越没底,因为这些东西对自己都是黑盒子。

所以如果数据结构与算法掌握不好,那么这些 API 对于我们就是一堆的黑黑子,连什么时候用 Map(红黑树实现)、什么时候用 HashMap 都分不清。

Redis 这种组件,难道只需要了解如何get、set 就是算是掌握了吗?

那肯定不行,实际上想要要用得好,得要了解 Redis 底层的那些数据结构,比如简单动态字符串(SDS、链表、字典、跳跃表、整数集合、压缩列表,才能选择适当的存储结构。

如果要问我大学什么最后悔?那肯定是没有从大一就开始好好学算法,去打 ACM。

现在还在大一、大二的同学还不抓紧机会,别给自己留下遗憾。当然,不打 ACM,我们也是能够学好数据结构和算法的。

数据结构和算法你能在任何计算机领域里看到,比如在编译原理中寄存器的分配会用到贪心,死代码检测与消除会用到图论里不可达的知识;操作系统进程、线程调度会用到多级队列和调度算法;组成原理中 Cache 的替换会用到 LRU、FIFO 等算法;开发必备的数据库也离不开B+树、LSM 等数据结构和查找算法。

很多时候我们需要的算法都被封装到编程语言的基础库里了,以至于很多同学会觉得算法离我们太远,其实不是的。

所以学习算法有助于我们根据应用场景选择最合适的数据结构。

日常开发中也一定离不开算法,比如小北最近工作中涉及的某种嵌套 TLV(Tag-Length-Value)结构编码的解析,就需要用到递归、多叉树等知识。如果不学习算法,那么程序中只能见到大量的 if/else、while/for。。。

可以说不学算法的工程师一定不是一个优秀的工程师。

再来说操作系统、编译原理,这些里面也是蕴含着各种数据结构与算法的,就拿编译原理来说。

一、编译原理遇见算法

当你学完有限状态机以后,你会发现以前觉得很牛逼正则表达式似乎自己也能用 DFA、NFA 实现一下了。状态机的思想在编程中很多地方都用得上。

比如解析 HTTP 协议,如果没学过状态机思想,你可能会一行行的 if/else 去做解析,这里最麻烦的地方在于,if/else 需要提前将 HTTP 头部字段都接收到再来判断,而我们知道 HTTP 基于 TCP,而 TCP 是流式传输,所以你很有可能是几个字符一组组接收到的,这个时候用 if/else 写出来就很难看了。

而用状态机编写起来代码就会非常优雅。状态的转移是由规则驱动的,接收到一个字符就判断一个,非常的方便。

继续学完语法分析,你会掌握递归下降分析这样非常重要的思想,你可以使用递归下降快速的实现四则运算计算器。

如果不用递归下降你可能需要先中缀表达式转后缀,然后求值,这是我们大一数据结构课写的,当时用栈写的,有点麻烦。后来学完编译原理,又用递归下降重写了一遍,区区几十行代码遍搞定。

还有一类场景在实际开发中的用的很多,比如淘宝、京东这样的电商,它们的营销规则有很多,比如满减、直减、跨店等等,这样的规则是不可能写死在代码里的。

那是怎么做的呢?

一般会实现一个配置系统,并设计一个DSL(领域特定语言)来表达这些规则,将规则直接配置到系统中,这样可以非常方便的修改,那么如何在代码里去解析 DSL 定义的规则呢?这就需要为 DSL 写一个语法解析器,这里就会用到语法分析的方法。

DSL(Domain Specific Language),它是一种用于某个特定领域的程序设计语言。这种特定于某个领域是相对于 C、C++、Python 这种通用语言而言的,通用语言可以在各个领域使用,我们熟悉的大多数程序设计语言都是通用语言,它们都是图灵完备的。

像我们平常经常使用的 JSON、SQL、HTML 这些都算是一种 DSL,你甚至可以尝试用递归下降去写一个 JSON、XML 解析器,这比写电商网站更有价值的。

继续往下学你会了解到抽象语法树 AST 如何生成、如何转化为中间代码、如何对中间代码优化、最终又是怎么生成机器指令的。

你会看到贪心算法在寄存器分配中的应用,也会看到图论中的可达性分析又是如何实现死代码消除。

二、CS 基础课

所以无论是操作系统、计算机网络、编译原理这些基础CS课程,还是MySQL、Redis这些中间件,都是构建在各种精妙的数据结构与算法之上的,数据结构与算法必学,一定要重视!

如果你有 ACM 获奖经历,那 BAT 是很容易进的,但是也一定要掌握基本的CS基础课程知识,不能只重算法不重基础。

国外可能把题刷好就能拿到offer,但是国内不懂 OS、网络这些基础和一些语言八股文也是很难的!

三、CS 学习路线

很多大一大二的同学其实是不太清楚到底该计算机专业该如何自学,在这分享下我的学习路线吧:

我大学专业学计算机的,对 CS 本科课程还算了解,也经常了解学习国外 CS 课程。

CS 专业区别于其它专业很大特点就是:

  • 工作后的内容是和专业所学的内容强相关的

比如你学了数据结构、编译原理、操作系统、计算机网络,如果你从事的是研发岗,那一定离不开这些知识。

  • 主要靠自学

不管是科班还是非科班,想要快速持续的提高技术水平,就得靠自己去钻,尤其离不开自学。

知乎上其实很多问科班和非科班的差别在哪,其实我一直想说,你给自己充足时间去把科班的内容学习一遍,到底还能差在哪呢?

可能唯一差别就是少了一个 计算机学士学位。

也有人把这种自学出家的叫做民科,当然没有任何的讽刺意思哈。

四、那么计算机专业该如何自学呢?

最简单的方式就是参考 CS 科班同学的课程,比如下面这个:

img

其实看着很多,概况起来就是(下面只涉及CS专业课):

  1. 计算机导论 + 一门编程入门语言
  2. 算法与数据结构
  3. 操作系统
  4. 计算机网络
  5. 数据库系统
  6. 特定领域,如:计算机图形学、信息安全、System方向、分布式

学习的途径就是:

多看国外/国外的 CS 名校的一些开放课程 + 看经典的书 + 多写代码!!!

毕竟现在MOOC、Udemy、B站上学习的资源都是很丰富的。

唯一要做的就是筛选一些比较好的课程进行学习,在这里我主要推荐一些国外的计算机课程,他们很明显的一个特征就是注重实践。

一门课,除了理论以外,还会有配套的 Lab、assignment,而且这些老师设计 Lab 都很用心的,看视频/书 + 做 Lab,这应该算计算机科班同学一个比较好的学习方式了,有理论也有实践。

下面开始上干货:

一、计算机导论

首先建议从计算机导论课程开始,推荐下面这些课程:

  • Harvard的CS50  CS50: Introduction to Computer Science
  • Berkeley的CS61A  CS 61A: Structure and Interpretation of Computer Programs
  • MIT的6.001  mit-6.001

随后建议学习一门语言,可以是C、Java、或Python,我推荐 C语言(当然,也可以是Python!这不是重点,重点是要多去写,入门时提高对编程的兴趣)。

提到C语言,我这里推荐国内浙大翁凯老师的课,看过的都说好,分为两门:

第一门是面向高考结束想提前自学一点编程的,叫大学先修课:C语言程序设计CAP-大学先修课

虽然叫先修课,但是覆盖了C语言的主要知识点,也适合大一新生~

第二门是C语言程序设计进阶:C语言程序设计进阶

会带你用C语言完成一些有趣的项目,比如一些图形界面小游戏,先修课学习C语言语法基础,进阶课带你项目实操,搭配使用,你就是同学中的大神!

有了语言基础之后建议学数据结构与算法:

数据结构推荐:

  • Stanford CS106系列
  • CS106A: Programming Methodologies

算法推荐:

  • 6.046(进阶)  Design and Analysis of Algorithms - MIT
  • MIT的6.006  Introduction to Algorithms
  • Coursera上的Princeton课程
  • Berkeley的CS61A 和 CS61B

学习完经典的数据结构和算法之后就可以去刷题了。

操作系统推荐:

  • CMU的15-213
  • Berkeley的CS162,

这两个都是有视频有lab的好课

还有一个非常经典的 MIT 6.828,附带一个xv6 lab

课程:6.828: Operating System Engineering

组成原理、体系结构:

  1. MIT的6.004,
  2. CMU的15-213
  3. Berkeley的CS61C

计算机网络:

  • Stanford的CS144,lab 很有意思

五、新手快速自学的方法

  • 一个原则,来自翁凯老师:

学计算机一定要有一个非常强大的心理状态,计算机的所有东西都是人做出来的,别人能想的出来,我也一定能想得出来,在计算机的世界里没有任何的黑魔法,所有的东西只不过是我现在不知道而已,总有一天我会把所有的细节、所有的内部的东西全搞明白的

  • 建立抽象层,我自己的感悟

计算机里,几乎都是人造的概念,大部分的东西,只要你一直深挖下去,几乎都可以搞明白。

但是要注意时间成本,软件行业已经不是一般的复杂和巨大,任何一个领域的知识的复杂性都足够耗费掉我们一生的时间,所以一定要抓住主线,对于技术和知识,要学通用的、流行的,可以尝试面向面试学习。

“打破砂锅问到底”式的学习虽然精神可敬,但性价比并不划算。

一定要学会在适当的层次上抽象出一层,并且认可这一层提供的接口,不去深究内部实现,了解原理即可,不必深究内部实现。

比如学习 HTTP,那么就先认可 TCP 提供的稳定可靠传输,而不继续深挖 TCP 的内容,等到学习传输层的时候再去深入挖掘 TCP 具体实现。

也就是我们常说的面向接口/抽象编程。

  • 视频为主,看书为辅

新手,一定不要一直看书,保持看书的时间不超过 50%,按照下面的流程:

  1. 看书学习基本的理论
  2. 编程练习、实践
  3. 有了新领悟,继续看书

如此反复的循环。

向抗疫英雄 致敬!

悄悄告诉你成为「脚本之家」视频号粉丝,#对喜欢的内容,积极留言说出你的观点,即有机会获取脚本之家小程序积分编程书籍程序员专属T恤

  推荐阅读:

萌新第一次用鸿蒙跑hello world

一个双非软件工程本科生的逆风翻盘经历

在微软工作100天,谈谈我眼中的微软

摸鱼神器,最强“办公”软件更新了!!

“国货之光”力挺鸿蒙,华为不再孤单!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存