区块链中的哈希到底是什么?

sw


编译:张涛

01什么是哈希?

哈希是将任意长的输入编程加密的固定长度输出的过程。哈希并不等同于加密方法,因为无法解密哈希值来获取原始数据。事实上哈希是一种单项加密函数。

有了哈希函数,就可以将互联网上的数据以固定长度字符串的形式来保存。其中一种方法就是SHA-256(安全哈希算法-256位),SHA-256是SHA-1的后继者,SHA-1的输出是160位的。

02哈希是如何应用在区块链中的?

在区块链中,每个区块中都有前一个区块的哈希值,前一个区块叫做当前区块的父区块。由于每个区块都有前一个区块的哈希值,当修改当前区块的任意数据都会导致区块的哈希值发生变化,这会对前一个区块产生影响,因为其中含有前一个区块的地址。

比如,当前有两个区块,一个是当前区块,一个是父区块。当前区块中有父区块的地址,如果需要修改当前区块的数据,就需要对父区块链进行修改。如果只有两个区块就比较好修改数据,但事实上区块链上有很多的区块。

截至2020年1月24日12:32,一共有614272个区块,第614272个区块的哈希值为00000000000000000007a6be31011560f1e3abe8f125e356a31db6051753334e。如果想要修改第614272个区块的数据,那么614271区块的哈希地址就会发生改变,但是修改所有614271个区块的哈希值是不可能的,因此区块链中数据的不可篡改和可信赖的。区块链的第一个区块叫做Genesis(创始)区块。

研究人员对该过程进行了可视化:


如果对输入产生小的修改,都可能会导致输出产生大的改变。

哈希是区块链技术和不可篡改和潜力的核心基础和最重要的方面。哈希维护了记录和查看数据的真实性,区块链的完整性也是这样的。

这也是区块链技术最重要的技术特征的一部分,只有理解了哈希才能了解区块链不可篡改性的潜力和价值。

03MerkleTree(马尔科夫树)是什么?

当有大量数据需要验证时,就需要消耗大量的内存来存储和确保安全,这个过程很难。但是又了马尔科夫树(Merkletree),就可以轻易解决这些问题。

马尔科夫树是区块链技术的基础,在该结构中,可以很容易地在大量数据中找出哪些数据发生了变化,整个数据验证的过程非常高效。比特币和以太坊中都使用了马尔科夫树。


如上图所示,有4个交易A、B、C、D。A和B哈希后会形成一个哈希值,C和D会形成另一个哈希值,AB的哈希结果和CD哈希结果会组合来形成一个新的哈希值——Roothash或MerkleRootABCD。

Roothash有所有交易的信息。马尔科夫树会重复计算节点对的哈希值,直到只剩下一个哈希值,就是Roothash。

Merkletree是一个二叉树,所以需要偶数个叶子结点,如果交易数是奇数,那么最后一个哈希值会复制一次来创建偶数个叶子节点。


如上图所示,可以看出奇数值的交易数中有复制的交易进行了哈希,表明Merkletree会计算奇数的叶子树。

所有交易数据会总结称一个Roothash,保存在区块头(blockheader)中。数据中有任何改变,整个哈希值就会变化,如果哈希值变化了,Merkleroot就会发生变化。Merkletree可以帮助维护数据的完整性。

Merkletree的另一个好处是如果想要了解特定交易的状态,无需下载整个区块链,只需要请求竖直证明(verticalproof)和树的特定分支,验证一个特定的交易分支。

04如何用哈希来确保数据安全?

哈希还增加了数据的安全性。因为没有加密数据,所以无需也无法解密数据。因为哈希函数是单向加密函数,加密哈希函数需要满足一些关键特征才能保证是有用的,包括:

每个哈希值都是不同的;

相同的消息会生成相同的哈希值;

无法根据哈希值确定输入值;

输入值的微小变化也会导致整个哈希值的变化。

哈希可以帮助确定数据是否被修改过。比如,之前下载了一些重要信息,为确定数据是否被修改过,可以对数据进行哈希计算,并比较数据的哈希值和接收到的数据的哈希值。

如果哈希值相同,就表明数据没有被修改过,如果哈希值不匹配,就表明数据在发送后接收前被修改了。

文章版权声明:除非注明,否则均为盛联管理咨询有限公司原创文章,转载或复制请以超链接形式并注明出处。

上一个 穿越时空,元明清时期济南兴盛的书院

下一个 丰网“卖身”,顺丰、极兔双赢!加盟商怎么办?