查看原文
其他

数据治理 | 一文看懂GIT的基本原理!

数据Seminar 2022-12-31

目录

一、Git 项目目录说明

二、git add 和 git commit

三、Git 分支

四、总结

本文共1778个字,阅读大约需要8分钟,欢迎指正!

上期的推文,我们讲述了如何使用Git管理个人文档
我们简单回顾一下使用Git管理个人文档的基本流程:
  1. 创建一个项目文件夹(空文件夹),放入需要被Git管理的文档
  2. 在项目文件夹中,用 git init 创建版本库
  3. 在项目文件夹中,用 git config 命令设置用户信息和添加防中文乱码配置
  4. 使用 git add . 和 git commit -m "注释" 将文档提交到版本库
  5. 使用 git reflog 查看 提交ID(前7位)
  6. 使用 git reset --hard 提交ID(前7位) 将文档切换到指定的版本
我们只需简单的几个步骤就可以实现版本控制,但如果不对Git的工作原理有所了解,也不太放心用它来管理重要的文档!毕竟对很多人社科学者来说,Git是一个陌生的工具。本期我们就来介绍Git的基本工作原理,并把上期的 “坑” 填上。

Part1Git 项目目录说明

我们先执行这两个步骤:

  1. 创建一个项目文件夹(空文件夹),放入需要被Git管理的文档
  2. 在项目文件夹中,用 git init 创建版本库
上面两步执行完成后,我们可以得到如下图所示文件夹:
  1. 【学习笔记】这个文件夹是我们的项目文件夹
  2. 【.git】隐藏文件夹是版本库,通过 git init 命令生成
  3. 在【学习笔记】文件夹中,【.git】文件夹之外的空间都可以被称为工作区

Part2git add 和 git commit

【.git】目录是项目的版本库,用于存储记录文档版本信息,主要包括:
  • 暂缓区( staga 或者叫 index ),需要提交的文件修改通通放到暂存区
  • 分支( master ), git 自动创建的第一个分支叫 master,用户也可以自定义分支。
  • HEAD 指针,用于指向当前分支,如果用户没有修改则指向 master 分支。
这么说有点抽象,我们可以用过 git add 和 git commit 两个命令来了解版本库中的内容。
如果我们需要用 Git 管理工作区中的文件,则需要执行如下命令:
  1. 首先,执行 git add . 将工作区所有文件添加到暂存区
  2. 然后,执行 git commit 从暂缓区,把文件放到 HEAD 指针所在的分支
  3. 此时,文件的当前状态被存储到版本库中
操作流程如下图所示:

Part3Git 分支

每个人可能都希望拥有创造分身的能力,让分身A去学习数学,让分身B去学习英语,当本体收回分身时,本体也就获取了分身习得的知识。
Git 起源并发展于软件开发行业,在软件开发中一般都需要多人协同。如果你准备开发一个新功能,需要两周才能完成,第一周你写了50%的代码,此时如果立刻提交,由于代码还没写完,而不完整的代码库会导致别人不能干活了。但如果等代码全部写完再一次提交,又存在丢失每天进度的巨大风险。
现在有了分支,就不用怕了。你创建了一个属于你自己的分支,别人看不到,还继续在原来的分支上正常工作,而你在自己的分支上干活,想提交就提交,直到开发完毕后,再一次性合并到原来的分支上,这样,既安全,又不影响别人工作。
对个人的文档管理而言,其实基本用不上这个分支的功能。我们会在后续的推文中介绍多人协作,届时,我们可以更深刻地体会到Git的强大之处。

Part4总结

本期我们回顾了个人文档管理的操作流程,并简单介绍了 git init 、git add 、git commit 的项目的影响,旨在减少大家使用git命令行管理文档的陌生感。下期,我们将介绍基于Git的多人协作,敬请期待。
我们将在数据治理板块中推出一系列原创推文,帮助读者搭建一个完整的社科研究数据治理软硬件体系。该板块将涉及以下几个模块(点击标题即可跳转至相应合集):
  1. 计算机基础知识
  2. 编程基础
  3. 数据采集
  4. 数据存储
  5. 数据清洗
  6. 数据实验室搭建
  7. 数据治理特别篇



星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧

往期推荐


基本无害 | 使回归有意义——回归的细节(1)

数据治理 | 随心所欲切换文档版本!误删什么的再也不怕啦~

基本无害 | 使回归有意义——异质性和非线性(1)

基本无害 | 使回归有意义——异质性和非线性(2)

基本无害 | 使回归有意义——异质性和非线性(3)





数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 《社科领域大数据治理实务手册》


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存