幻數(shù)據(jù)壓縮算法2
=數(shù)據(jù)壓縮算法=統(tǒng)計(jì)算法=
001100;001110;110001;110011;
把數(shù)據(jù)按照順序?qū)R:
001100;001110;110001;110011;
把數(shù)據(jù)按照大小對齊:
110011;110001;001110;001100;
把數(shù)據(jù)按照近似對齊:
110011和001100互為求反;110001和001110互為求反;
每一段數(shù)據(jù),都有多個(gè)標(biāo)簽,通過添加標(biāo)簽的方式,從而減少數(shù)據(jù)窮舉試錯(cuò)的次數(shù)。
=有限進(jìn)制速記算法=
把任何數(shù)都可以記錄為A^B*C!+D;A的B次方乘以C的階乘加D;
如43的37次方乘以31的階乘加499739
43^37*31!+499739
43^37=2.7436762028363398179986072951166e+60
31!=8.22283865417792281772556288e+33
43^37*31!=2.2560806735230762092253487562356e+94
=跳數(shù)統(tǒng)計(jì)速記算法=
如101001000100001000001000000100000001
123456789012345678901234567890123456→作者避免自己看看得眼睛疼,所以使用數(shù)字在特定字體下寬度和高度是一樣的方式,來進(jìn)行作為標(biāo)尺,數(shù)間隔多少位用的。
使用跳一位1的方式統(tǒng)計(jì),結(jié)果如下:
奇數(shù)次1生效:偶數(shù)次1被當(dāng)做0:1(中間有4個(gè)0,其中出現(xiàn)過一次1)1(中間有8個(gè)0,其中出現(xiàn)過一次1)1(中間有12個(gè)0,其中出現(xiàn)過一次1)+尾數(shù)00000001
偶數(shù)次1生效:頭數(shù)10+1(中間有6個(gè)0,其中出現(xiàn)過一次1)1(中間有10個(gè)0,其中出現(xiàn)過一次1)1(中間有14個(gè)0,其中出現(xiàn)過一次1)
然后把這些數(shù)據(jù)比對合并,就能得出源數(shù)據(jù)。
使用跳兩位1的方式統(tǒng)計(jì),結(jié)果如下:
第一個(gè)1對齊:1(中間有8個(gè)0,其中出現(xiàn)過兩次1)1(中間有17個(gè)0,其中出現(xiàn)過兩次1)1+尾數(shù)00000001
第二個(gè)1對齊:頭數(shù)10+1(中間有11個(gè)0,其中出現(xiàn)過兩次1)1(中間有20個(gè)0,其中出現(xiàn)過兩次1)1
第三個(gè)1對齊:頭數(shù)10100+1(中間有11個(gè)0,其中出現(xiàn)過兩次1)1(中間有14個(gè)0,其中出現(xiàn)過兩次1)1+尾數(shù)000000100000001
也就是說,當(dāng)1和0不連續(xù)的情況出現(xiàn)得越多,那么使用跳N個(gè)1(以及另一個(gè)注冊表中跳N個(gè)0)的統(tǒng)計(jì)數(shù)據(jù),N的取值越大,壓縮比例越高;當(dāng)1和0不連續(xù)的情況出現(xiàn)得越少,那么使用跳N個(gè)1(以及另一個(gè)注冊表中跳N個(gè)0)的統(tǒng)計(jì)數(shù)據(jù),N的取值越?。ú慌懦齆=0的情況),壓縮比例越高;
=數(shù)據(jù)對齊算法=
如:
101001000100001000001000000100000001
101010101010101010101010101010101010
100110011001100110011001100110011001
123456789012345678901234567890123456
第一種標(biāo)尺:10循環(huán)充滿
完全一致:(1,2,3,4,8,12,14,15,16,18,20,21,22,24,26,30,32,34)
完全單比特求反:(5,6,7,9,10,11,13,17,19,23,25,27,28,29,31,33)
第二種標(biāo)尺:1001循環(huán)充滿
完全一致:(1,2,7,11,14,18,19,21,22,23,26,27,28,30,31,34,35,36)
完全單比特求反:(3,4,5,6,8,9,10,12,13,15,16,17,20,24,25,29,32,33)
第N種標(biāo)尺:????
完全單比特一致:(*,*,*……)
完全雙比特一致:(*,*,*……)
完全多比特一致:(*,*,*……)
完全單比特求反:(*,*,*……)
完全雙比特求反:(*,*,*……)
完全多比特求反:(*,*,*……)
=作者的話=
使用的算法越多,那么算法所生成的數(shù)據(jù)就越多,相應(yīng)的就可以快速互相校驗(yàn),從而避免1個(gè)比特的篡改導(dǎo)致最終損失1ZB其中的900TB數(shù)據(jù)的極端壓縮文件異常災(zāi)難;畢竟壓縮率越高,就意味著一旦出現(xiàn)了壓縮文件缺失以及特定數(shù)據(jù)不可讀?。ū热缬布p壞,磁盤壞道,軟件權(quán)限不足)就會導(dǎo)致最終解壓縮所缺失的部分越多;壓縮率越高,就要求容錯(cuò)能力和糾錯(cuò)能力越強(qiáng),比如說,把1ZB的數(shù)據(jù),壓縮成1GB數(shù)據(jù),1GB數(shù)據(jù)中隨機(jī)有百分之五十的數(shù)據(jù)不可讀取,是否能夠通過剩下的百分之五十?dāng)?shù)據(jù)逆推出整個(gè)1GB數(shù)據(jù)內(nèi)容?從而可以解壓縮成原先的壓縮前的1ZB數(shù)據(jù)(當(dāng)然了,容錯(cuò)和糾錯(cuò)就難免會增加試錯(cuò)和窮舉的運(yùn)算量)。