查看原文
其他

数据治理 | 还在手动保存副本?那你一定还不知道这个小工具!

快点关注→ 数据Seminar 2022-12-31

目录

一、什么是版本控制?—— 每天在做却不自知

二、版本控制工具 —— 结束“手工管理”时代

三、Windows 安装 Git

四、总结

本文共1822个字,阅读大约需要8分钟,欢迎指正!

Part1什么是版本控制?—— 每天在做却不自知

经常写论文或者编写程序的读者一定有过这样的经历:想删除或修改文档中的几句话或一个函数,但又怕删改出错,这时,我们通常会保存一个副本(通常还会改名加上备份时间以示区别),然后再进行修改。这么做唯一的好处就是简单。但过不了多久,我们手头上就有一大堆的相似文档,以至于我们记不清对各个文档的操作历史。
细心的读者可能会同时维护一个清单,上面记录了每个文档的详细改动。如下图所示:
上述繁琐过程,其实就是在做一件事情:版本控制。

补充说明

  1. 版本控制诞生并发展于软件行业,但版本控制技术可以服务于任何行业。
  2. 在软件工程中,版本控制(也称为修订控制、源代码控制或源代码管理)是一类负责管理对计算机程序、文档、大型网站或其他信息集合的更改的系统。
  3. 版本控制最主要的任务就是追踪文件的变更。它将什么时候、什么人更改了文件的什么内容等信息忠实地了记录下来。

Part2版本控制工具 —— 结束“手工管理”时代

写论文有 Word,做表格有 Excel,这些专业的工具极大提升了工作效率。同样,版本控制也有专业好用的工具。
从上世纪80年代至今,已经诞生了多种版本控制工具。如下图所示:
如果想了解版本控制工具的发展历史可以阅读以下资料:
  1. https://initialcommit.com/blog/Technical-Guide-VCS-Internals
  2. https://zhuanlan.zhihu.com/p/95179354
我们主要介绍 Git 。它是目前最流行的开源免费的分布式版本控制工具。Git 的使用文档可以参考以下资料:
  1. https://www.progit.cn/
  2. https://git-scm.com/
Git 提供了丰富的版本控制相关功能,包括但不限于:
  1. 记录文档的变动
  2. 分析两个文档的差别
  3. 文本版本的回退 ......

补充说明

版本控制诞生并发展于软件行业,当我们阅读上述资料的时候,有些陌生的概念目前不必深究。我们主要目的是掌握Git软件使用。

Part3Windows 安装 Git

我们使用 Git 来管理我们的文档,首先要安装 Git 这个软件。软件的下载地址为:https://git-scm.com/download/win 。
下载完毕后,双击打开安装,安装期间一直点击“next”即可。
安装完毕后,点击鼠标右键,会出现 "Git GUI Here" 和 "Git Bash Here" 两个选项。如下图所示:
点击 "Git Bash Here" , 打开 Git 的交互窗口,输入 git -v 回车,显示当前的 Git 版本,说明安装成功。如下图所示:

Part4总结

版本控制我们每天都在做,使用手工整理的方式效率太过低下,也容易出错,因此,我们需要借助专业的工具。Git是目前最流行的版本控制工具,功能强大,大家赶快去安装 Git 吧 !下篇推文,我们会介绍 Git 的基本使用
我们将在数据治理板块中推出一系列原创推文,帮助读者搭建一个完整的社科研究数据治理软硬件体系。该板块将涉及以下几个模块(点击标题即可跳转至相应合集):
  1. 计算机基础知识
  2. 编程基础
  3. 数据采集
  4. 数据存储
  5. 数据清洗
  6. 数据实验室搭建
  7. 数据治理特别篇



星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧

往期推荐


数据可视化 | 为什么你需要使用哑铃图

基本无害 | 使回归有意义——异质性和非线性(2)

数据治理 | 不丢数据的秘籍:了解Python的内存管理机制

基本无害 | 第三章第二节(全)——回归和因果关系

数据可视化 | 那些年我们一起追过的温网

基本无害 | 使回归有意义——异质性和非线性(1)

数据治理 | 有效防止跑数据卡顿!社科人必须掌握的计算机知识





数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 《社科领域大数据治理实务手册》


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存