關(guān)于哈希(散列)函數(shù)你應(yīng)該知道的東西
無(wú)論安全從業(yè)人員用計(jì)算機(jī)做什么,有一種工具對(duì)他們每個(gè)人都很有用:加密哈希(散列)hash函數(shù)。這聽(tīng)起來(lái)很神秘、很專業(yè),甚至可能有點(diǎn)乏味,但是, 在這里,關(guān)于什么是哈希函數(shù)以及它們?yōu)槭裁磳?duì)你很重要,我會(huì)作出一個(gè)簡(jiǎn)潔的解釋。
加密哈希函數(shù),比如 SHA-256 或者 MD5,接受一組二進(jìn)制數(shù)據(jù)(通常是字節(jié))作為輸入,并且對(duì)每個(gè)可能的輸入集給出一個(gè)希望唯一hopefully unique的輸出。對(duì)于任意模式的輸入,給定的哈希函數(shù)的輸出(“哈希值”)的長(zhǎng)度都是一樣的(對(duì)于 SHA-256,是 32 字節(jié)或者 256 比特,這從名字中就能看出來(lái))。最重要的是:從輸出的哈希值反推回輸入,這從計(jì)算的角度是不可行的implausible(密碼學(xué)家討厭 “不可能impossible” 這個(gè)詞)。這就是為什么它們有時(shí)候被稱作單向哈希函數(shù)one-way hash function。
但是哈希函數(shù)是用來(lái)做什么的呢?為什么“唯一”的屬性如此重要?
在描述哈希函數(shù)的輸出時(shí),“希望唯一hopefully unique”這個(gè)短語(yǔ)是至關(guān)重要的,因?yàn)楣:瘮?shù)就是用來(lái)呈現(xiàn)完全唯一的輸出。比如,哈希函數(shù)可以用于驗(yàn)證 你 下載的文件副本的每一個(gè)字節(jié)是否和 我 下載的文件一樣。你下載一個(gè) Linux 的 ISO 文件或者從 Linux 的倉(cāng)庫(kù)中下載軟件時(shí),你會(huì)看到使用這個(gè)驗(yàn)證過(guò)程。沒(méi)有了唯一性,這個(gè)技術(shù)就沒(méi)用了,至少就通常的目的而言是這樣的。
如果兩個(gè)不同的輸入產(chǎn)生了相同的輸出,那么這樣的哈希過(guò)程就稱作“碰撞collision”。事實(shí)上,MD5 算法已經(jīng)被棄用,因?yàn)殡m然可能性微乎其微,但它現(xiàn)在可以用市面上的硬件和軟件系統(tǒng)找到碰撞。
另外一個(gè)重要的特性是,消息中的一個(gè)微小變化,甚至只是改變一個(gè)比特位,都可能會(huì)在輸出中產(chǎn)生一個(gè)明顯的變化(這就是“雪崩效應(yīng)avalanche effect”)。
哈希函數(shù)的典型用途是當(dāng)有人給你一段二進(jìn)制數(shù)據(jù),確保這些數(shù)據(jù)是你所期望的。無(wú)論是文本、可執(zhí)行文件、視 頻、圖像或者一個(gè)完整的數(shù)據(jù)庫(kù)數(shù)據(jù),在計(jì)算世界中,所有的數(shù)據(jù)都可以用二進(jìn)制的形式進(jìn)行描述,所以至少可以這么說(shuō),哈希是廣泛適用的。直接比較二進(jìn)制數(shù)據(jù)是非常緩慢的且計(jì)算量巨大,但是哈希函數(shù)在設(shè)計(jì)上非常快。給定兩個(gè)大小為幾 M 或者幾 G 的文件,你可以事先生成它們的哈希值,然后在需要的時(shí)候再進(jìn)行比較。
通常,對(duì)哈希值進(jìn)行簽名比對(duì)大型數(shù)據(jù)集本身進(jìn)行簽名更容易。這個(gè)特性太重要了,以至于密碼學(xué)中對(duì)哈希值最常見(jiàn)的應(yīng)用就是生成“數(shù)字”簽名。
由于生成數(shù)據(jù)的哈希值很容易,所以通常不需要有兩套數(shù)據(jù)。假設(shè)你想在你的電腦上運(yùn)行一個(gè)可執(zhí)行文件。但是在你運(yùn)行之前,你需要檢查這個(gè)文件就是你要的文件,沒(méi)有被hk篡改。你可以方便快捷的對(duì)文件生成哈希值,只要你有一個(gè)這個(gè)哈希值的副本,你就可以相當(dāng)肯定這就是你想要的文件。
下面是一個(gè)簡(jiǎn)單的例子:
如果我知道 fop 這個(gè)可執(zhí)行文件的 SHA-256 校驗(yàn)和,這是由供應(yīng)商(這個(gè)例子中是 Apache 基金會(huì))提供的:
然后我就可以確信,我驅(qū)動(dòng)器上的這個(gè)可執(zhí)行文件和 Apache 基金會(huì)網(wǎng)站上發(fā)布的文件是一模一樣的。這就是哈希函數(shù)難以發(fā)生碰撞(或者至少是 很難通過(guò)計(jì)算得到碰撞)這個(gè)性質(zhì)的重要之處。如果hk能將真實(shí)文件用哈希值相同的文件輕易的進(jìn)行替換,那么這個(gè)驗(yàn)證過(guò)程就毫無(wú)用處。
事實(shí)上,這些性質(zhì)還有更技術(shù)性 的名稱,我上面所描述的將三個(gè)重要的屬性混在了一起。更準(zhǔn)確地說(shuō),這些技術(shù)名稱是:
抗碰撞性 和 抗次原像性 也許聽(tīng)上去是同樣的性質(zhì),但它們具有細(xì)微而顯著的不同。抗次原像性 說(shuō)的是如果 已經(jīng) 有了一個(gè)消息,你也很難得到另一個(gè)與之哈希值相匹配的消息??古鲎残?使你很難找到兩個(gè)可以生成相同哈希值的消息,并且要在哈希函數(shù)中實(shí)現(xiàn)這一性質(zhì)則更加困難。
讓我回到hk試圖替換文件(可以通過(guò)哈希值進(jìn)行校驗(yàn))的場(chǎng)景?,F(xiàn)在,要在“外面”使用加密哈希算法(除了使用那些在現(xiàn)實(shí)世界中由獨(dú)角獸公司開(kāi)發(fā)的完全無(wú) Bug 且安全的實(shí)現(xiàn)之外),還有一些重要且困難的附加條件需要滿足。認(rèn)真的讀者可能已經(jīng)想到了其中一些,特別需要指出的是:
確保你能滿足這些條件絕對(duì)不是一件容易的事。這就是可信平臺(tái)模塊Trusted Platform Modules(TPM)成為許多計(jì)算系統(tǒng)一部分的原因之一。它們扮演著信任的硬件基礎(chǔ),可以為驗(yàn)證重要二進(jìn)制數(shù)據(jù)真實(shí)性 的加密工具提供保證。TPM 對(duì)于現(xiàn)實(shí)中的系統(tǒng)來(lái)說(shuō)是有用且重要的工具,我也打算將來(lái)寫(xiě)一篇關(guān)于 TPM 的文章。
【編輯推薦】
<div>10款Linux系統(tǒng),總有一款適合你 雙系統(tǒng)的日子結(jié)束了:Windows和Linux將合二為一 如何對(duì)你的Linux系統(tǒng)進(jìn)行壓力測(cè)試 系統(tǒng)管理員要學(xué)習(xí)的五大技能! 華為鴻蒙系統(tǒng)2.0曝光:9月發(fā)布 打通PC、手表、車機(jī)等聲明:免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認(rèn)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請(qǐng)發(fā)
送郵件至:operations@xinnet.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。本站原創(chuàng)內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)
需注明出處:新網(wǎng)idc知識(shí)百科