查看原文
其他

《Think Python》最新中译版:第一章

2016-03-02 EarlGrey 编程派



第一章:程序之道

The Way of the Program


本章词汇表及练习题,请查看本期推送的第二条图文消息。


本书的目标是教你像计算机科学家一样思考。这一思考方式集成了数学、工程以及自然科学的一些最好的特点。像数学家一样,计算机科学家使用形式语言表示思想(具体来说是计算)。像工程师一样,计算机科学家设计东西,将零件组成系统,在各种选择之间寻求平衡。像科学家一样,计算机科学家观察复杂系统的行为,形成假设并且对预测进行检验。


对于计算机科学家,最重要的技能是 解决问题的能力 。解决问题(problem solving)意味着对问题进行形式化,寻求创新型的解决方案,并且清晰、准确地表达解决方案的能力。事实证明,学习编程的过程是锻炼问题解决能力的一个绝佳机会。这就是为什么本章被称为“程序之道”。


一方面,你将学习如何编程,这本身就是一个有用的技能。另一方面,你将把编程作为实现自己目的的手段。随着学习的深入,你会更清楚自己的目的。



01什么是程序?



程序 是一系列说明如何执行计算(computation)的指令。计算可以是数学上的计算,例如寻找公式的解或多项式的根,也可以是一个符号计算(symbolic computation),例如在文档中搜索并替换文本或者图片,就像处理图片或播放视频。


不同编程语言中,程序的具体细节也不一样,但是有一些基本的指令几乎出现在每种语言当中:


  • 输入(input):

  • 从键盘、文件、网络或者其他设备获取数据。


  • 输出(output):

  • 在屏幕上显示数据,将数据保存至文件,通过网络传送数据,等等。


  • 数学(math):

  • 执行基本的数学运算,如加法和乘法。


  • 有条件执行(conditional execution):

  • 检查符合某个条件后,执行相应的代码。

  • 重复(repetition):

  • 重复执行某个动作,通常会有一些变化。


无论你是否相信,这几乎是程序的全部指令了。每个你曾经用过的程序,无论多么复杂,都是由跟这些差不多的指令构成的。因此,你可以认为编程就是将庞大、复杂的任务分解为越来越小的子任务,直到这些子任务简单到可以用这其中的一个基本指令执行。



2运行Python



Python入门的一个障碍,是你可能需要在电脑上安装Python和相关软件。如果你熟悉电脑的操作系统,特别是如果你能熟练使用命令行(command-line interface),安装Python对你来说就不是问题了。但是对于初学者,同时学习系统管理(system administration)和编程这两方面的知识是件痛苦的事。


为了避免这个问题,我建议你首先在浏览器中运行Python。等你对Python更加了解之后,我会建议你在电脑上安装Python。

网络上有许多网页可以让你运行Python。如果你已经有最喜欢的网站,那就打开网页运行Python吧。如果没有,我推荐PythonAnywhere。我在 http://tinyurl.com/thinkpython2e 给出了详细的使用指南。


目前Python有两个版本,分别是Python 2和Python 3。二者十分相似,因此如果你学过某个版本,可以很容易地切换到另一个版本。事实上,作为初学者,你只会接触到很少数的不同之处。本书采用的是Python 3,但是我会加入一些关于Python 2的说明。


Python的 解释器 是一个读取并执行Python代码的程序。根据你的电脑环境不同,你可以通过双击图标,或者在命令行输入python的方式来启动解释器。解释器启动后,你应该看到类似下面的输出:


Python 3.4.0 (default, Jun 19 2015, 14:20:21) [GCC 4.8.2] on linux Type "help", "copyright", "credits" or "license" for more information. >>>


前三行中包含了关于解释器及其运行的操作系统的信息,因此你看到的内容可能不一样。但是你应该检查下版本号是否以3开头,上面示例中的版本号是3.4.0。如果以3开头,那说明你正在运行Python 3。如果以2开头,那说明你正在运行(你猜对了)Python 2。


最后一行是一个提示符(prompt),表明你可以在解释器中输入代码了。如果你输入一行代码然后按回车(Enter),解释器就会显示结果:


>>> 1 + 1
2


现在你已经做好了开始学习的准备。接下来,我将默认你已经知道如何启动Python解释器和执行代码。



3第一个程序



根据传统,你用一门新语言写的第一个程序叫做“Hello, World!”,因为它的功能只不过是显示单词“Hello, World!”。在Python中,它看起来是这样:


>>> print('Hello, World!')


这是一个 print 函数的示例,尽管它并不会真的在纸上打印。它将结果显示在屏幕上。在此例中,结果是单词:


Hello, World!


程序中的单引号标记了被打印文本的首尾;它们不会出现在结果中。


括号说明 print 是一个函数。我们将在第三章介绍函数。在Python 2中, print是一个语句;不是函数,所以不需要使用括号。


>>> print 'Hello, World!'


很快你就会明白二者之间的区别,现在知道这些就足够了。


译者注:Python核心开发者Brett Cannon详细解释了 为什么print在Python 3中变成了函数



4算术运算符



接下来介绍算术。Python提供了许多代表加法和乘法等运算的特殊符号,叫做 运算符(operators)。


运算符 + 、- 和 * 分别执行加法、减法和乘法,详见以下示例:


>>> 40 + 242

>>> 43 - 142

>>> 6 * 742


运算符 / 执行除法运算:


>>> 84 / 2
42.0


你可能会问,为什么结果是42.0,而不是42。在下节中,我会进行解释。


最后,运算符 ** 执行指数运算;也就是说,它将某个数字乘以自身相应的次数:


>>> 6**2 + 6
42


某些语言使用 ^ 运算符执行指数运算,但是在Python中,它却属于一种位运算符,叫做XOR。如果你对位运算符不太了解,那么下面的结果会让你感到惊讶:


>>> 6 ^ 2
4


我不打算在本书中介绍位运算符,但是你可以阅读 Python官方百科 ,了解相关内容。



5值和类型



值(value) 是程序处理的基本数据之一,比如说一个单词或一个数字。我们目前已经接触到的值有:2,42.0,和 'Hello World!' 。


这些值又属于不同的 类型(types) :2是一个 整型数(integer),42.0 是一个 浮点数(floating point number),而 'Hello, World!' 则是一个 字符串(string),之所以这么叫是因为其中的字符被串在了一起(strung together)。


如果你不确定某个值的类型是什么,解释器可以告诉你:


>>> type(2)

<class 'int'>

>>> type(42.0)

<class 'float'>

>>> type('Hello, World!')

<class 'str'>


“class”一词在上面的输出结果中,是类别的意思;一个类型就是一个类别的值。


不出意料,整型数属于 int 类型,字符串属于 str 类型,浮点数属于 float 类型。


那么像 '2' 和 '42.0' 这样的值呢?它们看上去像数字,但是又和字符串一样被引号包围?


>>> type('2')

<class 'str'>

>>> type('42.0')

<class 'str'>


它们其实是字符串。


当你输入一个大数值的整型数时,你可能会想用逗号进行区分,比如说这样:1,000,000。在Python中,这不是一个合法的 整型数,但是确实合法的值。


>>> 1,000,000

(1, 0, 0)


结果和我们预料的完全不同!Python把1,000,000当作成了一个以逗号区分的整型数序列。在后面的章节中,我们会介绍更多有关这种序列的知识。


06形式语言和自然语言


自然语言(natural language) 是人们交流所使用的语言,例如英语、西班牙语和法语。它们不是人为设计出来的(尽管有人试图这样做);而是自然演变而来。


形式语言(formal languages)是人类为了特殊用途而设计出来的。例如,数学家使用的记号(notation)就是形式语言,特别擅长表示数字和符号之间的关系。化学家使用形式语言表示分子的化学结构。 最重要的是:


编程语言是被设计用于表达计算的形式语言。


语法规则有两种类型,分别涉及记号(tokens)和结构。记号是语言的基本元素,例如单词、数字和化学元素。 3+=3$6这个式子的问题之一,就是 $ 在数学中不是一个合法的记号 (至少据我所知)。类似的,2Zz 也不合法,因为没有一个元素的简写是 Zz。


译者注:微信里无法编辑出数学和化学标记,请点击阅读原文查看格式完整的版本。


第二种语法规则与标记的组合方式有关。3+=3这个方程是非法的,因为即使+和=都是合法的记号,但是你却不能把它们俩紧挨在一起。类似的,在化学式中,下标位于元素之后,而不是之前。


This is @ well-structured Engli$h sentence with invalid t*kens in it. This sentence all valid tokens has, but invalid structure with.


译者注:上面两句英文都是不符合语法的,一个包含非法标记,另一个结构不符合语法。


当你读一个用英语写的句子或者用形式语言写的语句时,你都必须要理清各自的结构(尽管在阅读自然语言时,你是下意识地进行的)。这个过程被称为 解析(parsing)。


虽然形式语言和自然语言有很多共同点——标记、结构和语法,它们也有一些不同:


  • 歧义性

  • 自然语言充满歧义,人们使用上下文线索以及其它信息处理这些歧义。形式语言被设计成几乎或者完全没有歧义,这意味着不管上下文是什么,任何语句都只有一个意义。


  • 冗余性

  • 为了弥补歧义性并减少误解,自然语言使用很多冗余。结果,自然语言经常很冗长。形式语言则冗余较少,更简洁。


  • 字面性

  • 自然语言充满成语和隐喻。如果我说“The penny dropped”,可能根本没有便士、也没什么东西掉下来(这个成语的意思是,经过一段时间的困惑后终于理解某事)。形式语言的含义,与它们字面的意思完全一致。


由于我们都是说着自然语言长大的,我们有时候很难适应形式语言。形式语言与自然语言之间的不同,类似诗歌与散文之间的差异,而且更加明显:


  • 诗歌

  • 单词的含义和声音都有作用, 整首诗作为一个整理,会对人产生影响,或是引发情感上的共鸣。 歧义不但常见,而且经常是故意为之。


  • 散文

  • 单词表面的含义更重要,句子结构背后的寓意更深。 散文比诗歌更适合分析,但仍然经常有歧义。


  • 程序

  • 计算机程序的含义是无歧义、无引申义的, 通过分析程序的标记和结构,即可完全理解。


形式语言要比自然语言更加稠密(dense),因此阅读起来花的时间会更长。另外,形式语言的结构也很重要,所以从上往下、从左往右阅读,并不总是最好的策略。相反,你得学会在脑海里分析一个程序,识别不同的标记并理解其结构。最后,注重细节。拼写和标点方面的小错误在自然语言中无伤大雅,但是在形式语言中却会产生很大的影响。


07调试


程序员都会犯错。出于比较奇怪的原因,编程错误被称为 故障(译者注:英文为bug,一般指虫子),追踪错误的过程被称为 调试(debugging)。


编程,尤其是调试,有时会让人动情绪。如果你有个很难的bug解决不了,你可能会感到愤怒、忧郁、抑或是丢人。


有证据表明,人们很自然地把计算机当人来对待。当计算机表现好的时候,我们认为它们是队友,而当它们固执或无礼的时候,我们也会像对待固执或无礼人的一样对待它们(Reeves and Nass, The Media Equation: How People Treat Computers, Television, and New Media Like Real People and Places)。


对这些反应做好准备有助于你对付它们。 一种方法是将计算机看做是一个雇员,拥有特定的长处, 例如速度和精度,也有些特别的缺点,像缺乏沟通以及不善于把握大局。


你的工作是当一个好的管理者:找到充分利用优点、摒弃弱点的方法。 并且找到利用你的情感来思考问题的方法, 而不是让你的情绪干扰你有效工作的能力。


学习调试的过程可能很令人泄气, 但是它对于许多编程之外的活动也是一个非常有价值的技能。 在每一章的结尾,我都会花一节内容介绍一些调试建议,比如说这一节。希望能帮到你!


相关阅读:




点击关键词查看对应内容:

Vim | Sublime Text 3 | Emacs | PyCharm 5 | 引力波 | Python简史 | MITx公开课 | 编码风格 | Python入门 | 程序员的日常


点击阅读原文”,查看更多Python编程相关内容

编程派 专注Python编程

人生苦短,我用Python

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存