区块链中的哈希到底是什么?
什么是哈希?
哈希是将任意长的输入编程加密的固定长度输出的过程。哈希并不等同于加密方法,因为无法解密哈希值来获取原始数据。事实上哈希是一种单项加密函数。
有了哈希函数,就可以将互联网上的数据以固定长度字符串的形式来保存。其中一种方法就是SHA-256(安全哈希算法-256位),SHA-256是SHA-1的后继者,SHA-1的输出是160位的。
哈希是如何应用在区块链中的?
在区块链中,每个区块中都有前一个区块的哈希值,前一个区块叫做当前区块的父区块。由于每个区块都有前一个区块的哈希值,当修改当前区块的任意数据都会导致区块的哈希值发生变化,这会对前一个区块产生影响,因为其中含有前一个区块的地址。
比如,当前有两个区块,一个是当前区块,一个是父区块。当前区块中有父区块的地址,如果需要修改当前区块的数据,就需要对父区块链进行修改。如果只有两个区块就比较好修改数据,但事实上区块链上有很多的区块。
截至2020年1月24日12:32,一共有614272个区块,第614272个区块的哈希值为00000000000000000007a6be31011560f1e3abe8f125e356a31db6051753334e。如果想要修改第614272个区块的数据,那么614271区块的哈希地址就会发生改变,但是修改所有614271个区块的哈希值是不可能的,因此区块链中数据的不可篡改和可信赖的。区块链的第一个区块叫做Genesis(创始)区块。
研究人员对该过程进行了可视化:
如果对输入产生小的修改,都可能会导致输出产生大的改变。
哈希是区块链技术和不可篡改和潜力的核心基础和最重要的方面。哈希维护了记录和查看数据的真实性,区块链的完整性也是这样的。
这也是区块链技术最重要的技术特征的一部分,只有理解了哈希才能了解区块链不可篡改性的潜力和价值。
Merkle Tree(马尔科夫树)是什么?
当有大量数据需要验证时,就需要消耗大量的内存来存储和确保安全,这个过程很难。但是又了马尔科夫树(Merkle tree),就可以轻易解决这些问题。
马尔科夫树是区块链技术的基础,在该结构中,可以很容易地在大量数据中找出哪些数据发生了变化,整个数据验证的过程非常高效。比特币和以太坊中都使用了马尔科夫树。
从上图可以看出,所有的交易都在底部,最顶部的哈希值叫做Root hash或Merkle root(马尔科夫根)。
如上图所示,有4个交易A、B、C、D。A和B哈希后会形成一个哈希值,C和D会形成另一个哈希值,AB的哈希结果和CD哈希结果会组合来形成一个新的哈希值——Root hash或Merkle RootABCD。
Root hash有所有交易的信息。马尔科夫树会重复计算节点对的哈希值,直到只剩下一个哈希值,就是Root hash。
Merkle tree是一个二叉树,所以需要偶数个叶子结点,如果交易数是奇数,那么最后一个哈希值会复制一次来创建偶数个叶子节点。
如上图所示,可以看出奇数值的交易数中有复制的交易进行了哈希,表明Merkle tree会计算奇数的叶子树。
所有交易数据会总结称一个Root hash,保存在区块头(block header)中。数据中有任何改变,整个哈希值就会变化,如果哈希值变化了,Merkle root就会发生变化。Merkle tree可以帮助维护数据的完整性。
Merkle tree的另一个好处是如果想要了解特定交易的状态,无需下载整个区块链,只需要请求竖直证明(vertical proof)和树的特定分支,验证一个特定的交易分支。
如何用哈希来确保数据安全?
哈希还增加了数据的安全性。因为没有加密数据,所以无需也无法解密数据。因为哈希函数是单向加密函数,加密哈希函数需要满足一些关键特征才能保证是有用的,包括:
每个哈希值都是不同的
相同的消息会生成相同的哈希值
无法根据哈希值确定输入值
输入值的微小变化也会导致整个哈希值的变化
哈希可以帮助确定数据是否被修改过。比如,之前下载了一些重要信息,为确定数据是否被修改过,可以对数据进行哈希计算,并比较数据的哈希值和接收到的数据的哈希值。
如果哈希值相同,就表明数据没有被修改过,如果哈希值不匹配,就表明数据在发送后接收前被修改了。
推荐阅读
区块链的阴暗面 孟岩:疫情带来的暂停,会让区块链与数字经济迎来更大反弹|算力大学视频公开课全文 爱荷华大选 App 投票酿闹剧的反思:为什么我们在软件工程方面如此糟糕? 如何使用5个Python库管理大数据? 一文告诉你,如何使用Python构建一个“谷歌搜索”系统 | 内附代码 云蹦迪:伪风口,真狂欢
猛戳“阅读原文”,填写中国远程办公-调查问卷