最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

幻數(shù)據(jù)壓縮算法猜想

2021-01-06 16:53 作者:純白色提莫種蘑菇  | 我要投稿

=數(shù)據(jù)壓縮算法=速記算法=

遞增素?cái)?shù)之間,可以使用加法,得出相對(duì)小的數(shù),可以用乘法,得出相對(duì)大的數(shù),可以用乘方號(hào),得出很大很大的數(shù)。

當(dāng)使用特定長(zhǎng)度把一個(gè)大數(shù)據(jù)分割成N個(gè)小片段時(shí),就可以進(jìn)行統(tǒng)計(jì),比如全體相加,然后除以總數(shù)得到全局平均數(shù)。

然后使用1KB的平均數(shù),1MB的平均數(shù),1GB的平均數(shù)作為比大小基準(zhǔn)。

然后還有特定數(shù)(比如出現(xiàn)了一次以上的多次數(shù))(比如只出現(xiàn)了一次的一次數(shù))(比如出現(xiàn)的最大值)(比如出現(xiàn)的最小值)。

現(xiàn)在的問題就是,統(tǒng)計(jì)能夠獲得數(shù)據(jù)的被過(guò)濾掉了很多信息的被壓縮后的數(shù)據(jù),如何使用統(tǒng)計(jì)獲得的數(shù)據(jù),來(lái)逆推原始數(shù)據(jù)(包括各種統(tǒng)計(jì)的先后順序)(當(dāng)然,因?yàn)閿?shù)據(jù)的缺失,導(dǎo)致必須使用試錯(cuò)方式來(lái)實(shí)現(xiàn))。

在處理大數(shù)據(jù)時(shí),如何減少解壓縮時(shí)試錯(cuò)次數(shù),就是大數(shù)據(jù)壓縮專用算法的重難點(diǎn)。

[示例]

如果有一個(gè)二進(jìn)制數(shù)1010010010011100110001000100010,統(tǒng)計(jì)出其二進(jìn)制的1總共有12個(gè),二進(jìn)制的0總共有19個(gè);轉(zhuǎn)換為八進(jìn)制為12223461042,統(tǒng)計(jì)出其八進(jìn)制的0總共出現(xiàn)了1次,八進(jìn)制的1出現(xiàn)了2次,八進(jìn)制的2出現(xiàn)了4次,八進(jìn)制的3出現(xiàn)了1次,八進(jìn)制的4出現(xiàn)了2次,八進(jìn)制的6出現(xiàn)了1次;轉(zhuǎn)換為十進(jìn)制為1380868642,統(tǒng)計(jì)出其十進(jìn)制的0出現(xiàn)了1次,十進(jìn)制的1出現(xiàn)了1次,十進(jìn)制的2出現(xiàn)了1次,十進(jìn)制的3出現(xiàn)了1次,十進(jìn)制的4出現(xiàn)了1次,十進(jìn)制的6出現(xiàn)了2次,十進(jìn)制的8出現(xiàn)了3次(當(dāng)然了,為了加速碰撞,一般都是使用素?cái)?shù)進(jìn)制的方式,而不是使用這種方式,作者用這種方式示例,只是為了方便使用微軟自帶的程序員計(jì)算器換算進(jìn)制,從而進(jìn)行統(tǒng)計(jì)),那么接下來(lái),就需要通過(guò)進(jìn)制碰撞的方式,來(lái)逆推根據(jù)統(tǒng)計(jì)得出的原始數(shù)據(jù)。

當(dāng)然了,也可以使用MD4,MD5和其他的哈希值生成算法,用于快速生成哈希值,以及記錄上大小,然后是二進(jìn)制的0和1,然后是八進(jìn)制,16進(jìn)制(一般都采取2的正整數(shù)次方進(jìn)制的方式,來(lái)加速快速壓縮時(shí)的速度,換算更快)。

另外還有一種快速碰撞的方式,使用大于X的(Y+1次方),小于X的Y次方的方式。

第一次比大小范圍:

示例:取X=16;Y=18;

16^19=75,557,863,725,914,323,419,136

16^18=4,722,366,482,869,645,213,696

第二次比大小范圍:

示例:取X=15;Y=7;

15^8=2,562,890,625

15^7=170,859,375

當(dāng)然了,因?yàn)樽髡卟]有使用16^19-16^18,然后再把結(jié)果進(jìn)行開15次方,然后再進(jìn)行篩查,可能就會(huì)導(dǎo)致第二次和第一次的相關(guān)度不高。

一個(gè)二進(jìn)制數(shù)據(jù)根據(jù)位數(shù),可以表達(dá)多少數(shù)值?

1位二進(jìn)制,有兩種可能,1和0。

2位二進(jìn)制,有四種可能,00,01,10,11。

16位二進(jìn)制,有2的16次方種可能,然而一個(gè)數(shù)據(jù)本身使用這么多位是一種浪費(fèi)。

也就是說(shuō),一個(gè)16位二進(jìn)制所表達(dá)的數(shù),是一個(gè)固定數(shù),是大于或等于0,小于2的16次方+1。

就比如說(shuō),一個(gè)1ZB大小的數(shù)據(jù),只要其本身是固定的,那么就注定大于或等于0,然后小于2的多少次方來(lái)著???+1。

表達(dá)固定的數(shù),并不一定需要使用到很長(zhǎng)的長(zhǎng)度。

比如2的987654321次方,可以是一個(gè)很大的數(shù),其換算成二進(jìn)制,會(huì)占用多大的存儲(chǔ)空間?然后是不是可以逆推為算術(shù)內(nèi)容:2的987654321次方?

問題就是,并非所有的數(shù),都是規(guī)律數(shù),都可以使用A的B次方+C乘以D+E階乘方式正好等于該數(shù),也就導(dǎo)致往往只能采取使用比大小的方式,無(wú)限近似,大于某個(gè)最接近該數(shù)的小數(shù),小于某個(gè)最接近該數(shù)的大數(shù)。

比如說(shuō),想要記錄一個(gè)5,那么在只能使用素?cái)?shù)的表達(dá)方式時(shí),就可以記錄為該數(shù)大于3,小于7。

使用大于和小于之后,就可以獲得一個(gè)數(shù)據(jù)范圍,該范圍內(nèi)可能包含有有數(shù)的可能性,接下來(lái)的方法,就是把這個(gè)可能性減少,比如說(shuō)(3+7)/5=2,則表示這個(gè)數(shù)正好處于大于和小于的中間值,比如說(shuō)(3+7)/4=2.5,則表示這個(gè)數(shù)正好大于大于和小于的中間值;以此類推;

設(shè)定一個(gè)數(shù)為未知數(shù)B,A大于B小于C。

那么就可以取近似值(A+B)/C=D

一般情況下,D都是帶有小數(shù)的,那么把D的小數(shù)去掉,那么D的整數(shù)部分就可以作為第二輪的最小值,D+1就可以作為第二輪的最大值。

?。ˋ+B)/C=區(qū)間值1(也就是C更靠近A,還是更靠近B)。

(A-B)/(B-C)=區(qū)間值2

(A+C)/B=區(qū)間值3

(B+C)/A=區(qū)間值4

還有一種固定數(shù)大于小于法,就是A+→B←+C}總長(zhǎng)度為多少位,特定數(shù)大于某個(gè)可以用循環(huán)速記法記錄的數(shù),小于某個(gè)可以用循環(huán)速記法記錄的數(shù)。

然后就是使用特定算法生成一個(gè)數(shù),該數(shù)大于B,然后使用特定刷房生成一個(gè)數(shù),該數(shù)小于B。

示例:3*7=21;4*5=20;3*7大于B小于4*5;那么就可以獲得該數(shù)百分之八十的近似值,然后再使用不斷精準(zhǔn)的繼續(xù)用比大小法接近的方式,獲得。

比如3.1415926

第一次比大?。?大于圓周率大于3

第二次比大?。?.14小于圓周率小于3.15

第三次比大小:3.141592小于圓周率小于3.141593

比大小之后,就是使用一個(gè)算術(shù),來(lái)生成更接近的比大小精準(zhǔn)度。

比如第一次比大小,大和小之間相差2的16次方,第二次比大小,大和小之間相差2的14次方,第三次比大小,大和小之間相差2的12次方,以此類推,就能快速還原出原始數(shù)據(jù)。

=作者的話=

1TB的固定數(shù)據(jù),可以使用1GB的算法來(lái)生成,1GB算法當(dāng)做固定數(shù)據(jù),就能使用1KB的算法來(lái)生成,這就是TB2KB算法的原理。

幻數(shù)據(jù)壓縮算法猜想的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
新巴尔虎左旗| 遂川县| 晋州市| 邹平县| 乌拉特后旗| 凤山县| 昌图县| 宜昌市| 贵德县| 乐清市| 孝感市| 榕江县| 高雄县| 安达市| 东平县| 平顶山市| 新津县| 资阳市| 芒康县| 云梦县| 靖宇县| 龙里县| 凭祥市| 辽中县| 岐山县| 台南市| 马龙县| 息烽县| 辰溪县| 湖南省| 安义县| 临武县| 泗水县| 灵山县| 贵定县| 措勤县| 垣曲县| 沐川县| 华亭县| 汉中市| 太康县|