幻傳承和創(chuàng)新
=本文內(nèi)容純屬個(gè)人猜想,僅供參考=
=增量數(shù)據(jù)卡尺和減量數(shù)據(jù)卡尺=
增量數(shù)據(jù)和減量數(shù)據(jù),本身就是一種源文件+增量和減量和修改數(shù)據(jù)日志的方式來記錄。
本身就是對(duì)數(shù)據(jù)的每一次改動(dòng)和注釋,都可追溯。
比如:
某地星期一,西紅柿的售價(jià)是5元每斤;西瓜的售價(jià)是10元每斤;胡蘿卜的售價(jià)是2元每斤。
到了星期二,價(jià)格有所改變,西紅柿變成了3元每斤(記為星期一西紅柿價(jià)格-2元每斤=星期二西紅柿價(jià)格);西瓜變成9元每斤(記為星期一西瓜價(jià)格-1元每斤=星期二西瓜價(jià)格);胡蘿卜變成3元每斤(記為星期一胡蘿卜價(jià)格+1元每斤=星期二胡蘿卜價(jià)格)。
也就是說,當(dāng)一個(gè)大數(shù)據(jù),只有一部分有改動(dòng),改動(dòng)只要沒有達(dá)到百分之五十兼或設(shè)定值,那么就只能以日志的方式來存儲(chǔ),避免需要兩個(gè)三個(gè)數(shù)據(jù)庫(kù)硬件,一個(gè)數(shù)據(jù)庫(kù)硬件為源文件數(shù)據(jù)庫(kù),一個(gè)數(shù)據(jù)庫(kù)硬件為日志改動(dòng)數(shù)據(jù)庫(kù),還有一個(gè)數(shù)據(jù)庫(kù)為結(jié)果數(shù)據(jù)庫(kù),當(dāng)用源文件+日志=結(jié)果數(shù)據(jù)庫(kù)的方式,把結(jié)果數(shù)據(jù)庫(kù)作為源文件數(shù)據(jù)庫(kù),那么就能夠當(dāng)做新的源文件數(shù)據(jù)庫(kù),這對(duì)于不需要調(diào)用歷史數(shù)據(jù)的數(shù)據(jù)庫(kù)很方便,然而對(duì)于需要調(diào)用歷史數(shù)據(jù)庫(kù)的數(shù)據(jù),就很成問題。
特別是相互關(guān)聯(lián)數(shù)據(jù)的調(diào)用,這也就導(dǎo)致一個(gè)包含100年時(shí)間1ZB數(shù)據(jù)中,可能需要調(diào)用的,只是其中特定10年的1GB數(shù)據(jù),這就導(dǎo)致了無(wú)端的解壓縮過程中的硬件調(diào)用資源浪費(fèi),也就是非要把所有數(shù)據(jù)都解壓縮成壓縮前文件,才能應(yīng)用,那么問題來了,物理考古學(xué)家,需要特定10年的物理當(dāng)時(shí)的科研數(shù)據(jù),生物考古學(xué)家,需要特定100年的生物當(dāng)時(shí)的科研數(shù)據(jù),古語(yǔ)言學(xué)家需要調(diào)用20年當(dāng)時(shí)的語(yǔ)言數(shù)據(jù),而物理數(shù)據(jù)包含在一個(gè)100年時(shí)間1ZB數(shù)據(jù)中,生物數(shù)據(jù)包含在一個(gè)1000年1024ZB數(shù)據(jù)中,語(yǔ)言數(shù)據(jù)包含在一個(gè)5000年4096ZB數(shù)據(jù)中,怎么弄?
全部都全網(wǎng)在單機(jī),每個(gè)使用者對(duì)應(yīng)一個(gè)超級(jí)電腦用于解壓縮,然后索引需要用到的內(nèi)容?
70億個(gè)使用者呢?是不是需要建造70億個(gè)超級(jí)電腦硬件?。?/p>
特別是有很多歷史變遷問題,比如10年前,某個(gè)學(xué)科專有名詞的學(xué)術(shù)名是A,10年后,該學(xué)科專有名詞的學(xué)術(shù)名是B,然后每隔一段時(shí)間,學(xué)術(shù)名都有改變,突然一下去找100年前,這個(gè)學(xué)術(shù)名,那就麻煩了。
學(xué)科用大數(shù)據(jù)的應(yīng)用,如果只考慮到當(dāng)代使用,很容易就解決,可能最多需要3個(gè)超級(jí)電腦就足以應(yīng)對(duì),可是如果面對(duì)的是時(shí)間跨度可能需要百萬(wàn)年的古生物研究呢?地球考古學(xué)研究呢?歷史新聞研究呢?會(huì)面對(duì)什么問題?
還有一種問題,那就是語(yǔ)言是一種主觀存在,包含的含義,在每一代可能都有偏差,比如流氓一詞,可能某些詞義沒有被編寫進(jìn)入字典中,沒有編入辭典中,就被后來人當(dāng)做通假字論了,還不排除有的寫書的人,本身喜歡另辟蹊徑,自己創(chuàng)造一些詞語(yǔ)組合,也不排除創(chuàng)作者詞不達(dá)意。
這也就導(dǎo)致,搜索可能需要完全展開整個(gè)數(shù)據(jù)庫(kù)的所有內(nèi)容都變成最終的未壓縮版本,這是剛性需求,特別是使用者使用模糊搜索兼或用未來的術(shù)語(yǔ)來搜索歷史上的術(shù)語(yǔ)。
然而隨著數(shù)據(jù)采集越來越精密,很多全息數(shù)據(jù),都可以大到?jīng)]邊,把無(wú)限大+無(wú)限大+無(wú)限大的數(shù)據(jù),都聚集到數(shù)據(jù)庫(kù)中,能用很小的存儲(chǔ)硬件來存儲(chǔ)可以解壓縮成為無(wú)損數(shù)據(jù)來使用,然而解壓縮時(shí),硬件不足怎么辦?航線航天器,在飛行過程中,百分之八十都被隕石擊穿,而又沒有足夠的資源來修復(fù),而又急需用歷史數(shù)據(jù)來找到某個(gè)問題的參考答案?怎么弄?無(wú)參考答案的去創(chuàng)新方法來解決?
當(dāng)參考答案沒有變質(zhì),沒有過期,那么參考答案就是寶貝,多多益善;當(dāng)參考答案變質(zhì)了,過期了,不適合當(dāng)下和當(dāng)前環(huán)境了,那么參考答案就是垃圾,還不如就地創(chuàng)新,還浪費(fèi)了觀看者的時(shí)間去了解并不適用的參考答案。
越是歷史久遠(yuǎn)的文明,越容易累死在對(duì)歷史的繼承上,米國(guó)需要繼承的歷史很短,就100年,用不了1年時(shí)間就能講明白,中國(guó)需要繼承的歷史很長(zhǎng),上下5000年,可能需要用20年都不一定足以講明白。
打仗都知道需要有輕騎兵,需要有重騎兵,怎么說呢?中國(guó)就是有太多的歷史傳承,導(dǎo)致如同重騎兵一樣,尾大不掉,當(dāng)護(hù)甲(歷史)有用時(shí),護(hù)甲是個(gè)大寶貝,當(dāng)護(hù)甲(歷史)沒用時(shí),護(hù)甲是個(gè)大累贅。
米國(guó)的現(xiàn)狀是什么?歷史一窮二白,沒有幾千代的創(chuàng)業(yè)可以繼承,所以一個(gè)個(gè)成了現(xiàn)實(shí)主義者,一個(gè)個(gè)成為了群體急性子,必須創(chuàng)新,不創(chuàng)新就是空白。
中國(guó)的現(xiàn)狀是什么?歷史豐富多彩,有幾千代的創(chuàng)業(yè)可以繼承,所以一個(gè)個(gè)成了博大精深者,一個(gè)個(gè)成了群體慢性子,不是一定需要?jiǎng)?chuàng)新,不創(chuàng)新就照抄歷史,大不了交白卷。
中國(guó)創(chuàng)新難,不是因?yàn)橹袊?guó)文化什么的不行,而是因?yàn)樾枰獙W(xué)的東西太多太多,而這些東西之中,有重點(diǎn),有非重點(diǎn),可以抓重點(diǎn),然而不能只抓重點(diǎn),為什么有舍得的說法?因?yàn)橹袊?guó)的傳承之博大精深,導(dǎo)致了不可能樣樣全,不可能樣樣會(huì),所以需要有放棄的傳承,也有需要堅(jiān)持的傳承。
=作者的話=
是什么限制了傳承,導(dǎo)致對(duì)歷史的繼承一無(wú)所有?
是什么限制了創(chuàng)新,導(dǎo)致了把非歷史的應(yīng)用到現(xiàn)在的能力一無(wú)所有?