社科大数据平台python学习系列 |Python 基本数据类型
目录
一、前言
二、Python 代码中的注释
三、为什么最先学习数据类型
四、基本数据类型一览
五、总结
本文共3115个字,阅读大约需要12分钟,欢迎指正!
Part1前言
近期我们开启了 Python 教程系列内容,上期文章,也就是教程首期文章,我们通过视频+图文的形式详细介绍了如何安装 Python 以及开发环境。那么在这一期文章中,我们将带大家正式学习 Python 编程,了解 Python 语言中基本的数据类型。
本文中所有 Python 代码均在集成开发环境 Visual Studio Code (VScode) 中使用交互式开发环境 Jupyter Notebook 编写。
Part2Python 代码中的注释
在正式介绍 Python 数据类型之前,咱们先来学习一下编程中一个非常人性化的设计——注释。代码中的辅助性文字就是注释。在程序运行时,注释会被解释器忽略,常用于程序编写者对代码的文字性解释说明。熟悉编程之后,注释还可以用在代码身上,在不删除代码的情况下使一部分代码不生效(不运行)。在 Stata 软件中,也可以在代码中写注释,不过相对而言 Stata 中注释规则、形式稍多一些,而在 Python 中,只有一种注释形式,所以学习 Python 注释要简单的多。
Python 中仅使用井号 “#” 来表示注释,详细的规则如下:
“#” 表示一行中注释的开始,使用多行注释时,每行注释开始之前使用 “#” 。 注释可以在一行中的任意位置开始,也可以独占一行。 一行中第一个 “#” 之后的所有内容会作为注释不被执行,第一个 “#” 之前的内容仍是 Python执行程序的一部分。
Part3为什么最先学习数据类型
Python 是一门以英语为基础的编程语言。对于初学者来说,学习 Python 就像学习一门自然语言一样。一些初学者可能会陷入误区,比如急于学习 Python 语法,这就像好比一个一年级小朋友向你抛出一个疑问:“为什么主语+谓语+宾语可以构成一个句子呢?”。这时你只能无奈地回答道:“咱还是先把拼音学会吧。”
从另一个角度来说,Python 作为数据处理领域最好的编程语言,几乎每行代码都要进行数据运算。那么了解、熟悉数据自然是学习 Python 的首要任务,就像学习英语要先学习 26 个英文字母一样。也就是说,走正确的学习路线会让我们的学习事半功倍。
Part4基本数据类型一览
简单易用是 Python 语言的理念之一,因此它致力于使用最少的数据类型完成同样多的事情。所以 Python 中最常使用的数据类型并不多,如下表所示。
数据类型类别 | 数据类型 (在 Python 中的表示) | 例子 |
数字 | int(整数) | 0,4,-7 |
float(浮点数) | 2.0,-1.8,0.0 | |
字符串 | str | '字符串',"123","""text""" |
特殊数据类型 | bool (布尔值) | 有且仅有 True 和 False,表示一种状态 |
None(空值) | 有且仅有 None | |
列表 | list | [1,True,'hello'] |
元组 | tuple | (1,3,'hello') |
集合 | set | {1,4,65,-34} |
字典 | dict | {'a':'hello', 'b':'world'} |
1数字
在 Python 中存在三种数字类型:整数(int)、浮点数(float)、复数(complex)。其中复数是由实部和虚部组成的数字,由于复数的使用场景太少了,为了把钱(时间)花在刀刃上,这里就不介绍复数了。
整数
没有小数部分的数字就是整数,包括正整数、负整数和 0。Python 中整数类型没有长度限制,支持任意大的整数,只受限于内存的大小。在 Python 中使用 “int” 表示整数类型,即 int 型就表示整数型。
浮点数
浮点数就是带有小数的数字。浮点数的精度要比整数高,在 Python 中,整数与浮点数运算会得到浮点数。在 Python 中使用“float”表示浮点数类型,即 float 型就表示小数型。
在数据处理中,要根据数字实际意义来使用整数和浮点数,比如 2022 年不能表示为 2022.0 年;圆周率 3.1415926…… 不能表示为 3。
除了认识整数和浮点数之外,还要了解整数与浮点数之间的转换。Python 内置了两个函数int()
和float()
,用于将数字转为对应的类型。
函数 | 描述 |
---|---|
int(x) | 将 x 转化为一个整数,只保留 x 的整数部分,x 可以是整数、浮点数或者整数字符串 |
float(x) | 将 x 转化为一个浮点数,x 可以是整数、浮点数或者数字字符串 |
函数int()
和float()
的使用如下图所示。
另外,在 Python 中,整数型(int) 数字和浮点型(float)数字做运算时,得到的结果往往是浮点型。这是因为浮点型(float)的精度要比整数型(int)高一些,数字之间的运算结果会以运算元素中精度最高的一个为基准,如下图所示。
2字符串
字符串其实就是由字符组成的序列,它是 Python 最基本的数据类型之一,在 Python 中使用“str”表示字符串类型。字符串中字符的数量可以是 0、1 或多个。字符串中字符的数量就是字符串的长度,字符串长度为 0 时,字符串为空字符。
在 Python 中,可以使用英文单引号或者双引号创建和表示字符串,如下图所示。
上图方式是最常见的表示字符串的方式,但有时候会出现一些不好处理的情况,比如,当字符串中存在引号本身,不就和两边的引号冲突了吗?
解决这个问题的方式有两种。
当需要表示字符单引号时,用双引号来表示字符串;当要表示字符双引号时,用单引号来表示字符串。
使用转义符
\
,用来防止引号起冲突,这种方式也可以同时表示字符单引号和字符双引号
另外,使用字符串单引号或者双引号表示字符串时,不方便使用换行(可以使用转义符\
来换行,但不推荐),导致字符串的可读性降低。
这时我们可以使用一对三引号(三引号是Python 中一个约定俗成的说法)来表示字符串
由于三引号中可以任意换行,字符串结构可以随意设计,所以在实际编程中三引号也可以用作注释,如下图所示。
Part5总结
万事开头难,学习一门编程语言更是不能例外。所以我们在第一期介绍的内容并不多,一方面是为了能让初学者轻松的学习,另一方面简单清晰的教程也可以为大家树立学习信心。
下期文章我们将会继续学习 Python,探索 Python 字符串的强大功能 。
我们将在数据治理板块中推出一系列原创推文,帮助读者搭建一个完整的社科研究数据治理软硬件体系。该板块将涉及以下几个模块(点击标题即可跳转至相应合集):
星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文 | 《社科领域大数据治理实务手册》
欢迎扫描👇二维码添加关注