如果頻率分析撞上了凱撒密碼,后續(xù)
上次我試著用頻率表破解一個(gè)假裝偽裝字母偏移量的短篇文本,結(jié)果可以說是相當(dāng)?shù)牟豢叭肽?,?jiǎn)直就是一團(tuán)亂碼。
這一次我試著加大了文本量,以下是新一次的破解嘗試:
老規(guī)矩,假裝忘了設(shè)置的偏移量
我先摘錄了《野性的呼喚》以及《簡(jiǎn)·愛》原版當(dāng)中的部分片段,然后合并在了一起
接下來找了兩個(gè)加密網(wǎng)站進(jìn)行加密,如下:


放到wps里如下:

我用文檔里的功能給明文和密文都做了字?jǐn)?shù)統(tǒng)計(jì),然后放到表格,如下:

這里可以看出,頻率表已經(jīng)和原文有很大部分的重疊了,果然上次失敗是因?yàn)樽謹(jǐn)?shù)太少了
接下來是分析偏移量:(順便糾錯(cuò))

由于是從密文到原文計(jì)算的,所以偏移量為-3才對(duì)

偏移量已經(jīng)找到了,清一色的偏移量,凱撒密碼沒跑了。(如果我不知道的話)
接下來就是檢驗(yàn)頻率表了
經(jīng)過分析,發(fā)現(xiàn):
ETA,HI,DLUW在頻率表和原文之間完全一致
而ON,SR,PB,VK,XJ,QZ則是順序交換
MFCYG則是大型的錯(cuò)亂
不難看出,30000字的大小還是小了。
符合率只有9/26
看來有必要學(xué)一下編程,人工查找和替換簡(jiǎn)直就不是人干的活,而且錯(cuò)誤率還高
有意思的是,我在網(wǎng)上查找了一些26個(gè)字母的頻率表,結(jié)果全都不一樣。
不過E出現(xiàn)的頻率最高是共識(shí),但是第二位是T還是A,或者B就不一樣了
我不知道他們從哪里找來的數(shù)字,反正我是從紙質(zhì)資料上找到的。
如果各位有更加權(quán)威的字母頻率表,也歡迎發(fā)在評(píng)論區(qū)里