大數(shù)據(jù)是什么?
1、從“數(shù)據(jù)”到“大數(shù)據(jù)”
時至今日,“數(shù)據(jù)”變身“大數(shù)據(jù)”,“開啟了一次重大的時代轉型”。 “大數(shù)據(jù)”這一概念的形成,有三個標志性事件:
2008年9 月,美國《自然》(Nature)雜志??猅he next google,第一次正式提出“大數(shù)據(jù)”概念。
2011年2月1日,《科學》(Science)雜志專刊——Dealing with data,通過社會調查的方式,第一次綜合分析了大數(shù)據(jù)對人們生活造成的影響,詳細描述了人類面臨的“數(shù)據(jù)困境”。
2011年5月,麥肯錫研究院發(fā)布報告——Big data: The next frontier for innovation, competition, and productivity,第一次給大數(shù)據(jù)做出相對清晰的定義:“大數(shù)據(jù)是指其大小超出了常規(guī)數(shù)據(jù)庫工具獲取、儲存、管理和分析能力的數(shù)據(jù)集?!?/p>
2、什么是“大數(shù)據(jù)”

大數(shù)據(jù)是指以多元形式,自許多來源搜集而來的龐大數(shù)據(jù)組,往往具有實時性。在企業(yè)對企業(yè)銷售的情況下,這些數(shù)據(jù)可能得自社交網絡、電子商務網站、顧客來訪紀錄,還有許多其他來源。這些數(shù)據(jù),并非公司顧客關系管理數(shù)據(jù)庫的常態(tài)數(shù)據(jù)組。
3、大數(shù)據(jù)的技術支撐

4、存儲:存儲成本的下降
1)云計算出現(xiàn)之前
在云計算出現(xiàn)之前,數(shù)據(jù)存儲的成本是非常高的。例如,公司要建設網站,需要購置和部署服務器,安排技術人員維護服務器,保證數(shù)據(jù)存儲的安全性和數(shù)據(jù)傳輸?shù)臅惩ㄐ?,還會定期清理數(shù)據(jù),騰出空間以便存儲新的數(shù)據(jù),機房整體的人力和管理成本都很高。
2)云計算出現(xiàn)之后
云計算出現(xiàn)后,數(shù)據(jù)存儲服務衍生出了新的商業(yè)模式,數(shù)據(jù)中心的出現(xiàn)降低了公司的計算和存儲成本。例如,公司現(xiàn)在要建設網站,不需要去購買服務器,不需要去雇用技術人員維護服務器,可以通過租用硬件設備的方式解決問題。
存儲成本的下降,也改變了大家對數(shù)據(jù)的看法,更加愿意把1年、2年甚至更久遠的歷史數(shù)據(jù)保存下來,有了歷史數(shù)據(jù)的沉淀,才可以通過對比,發(fā)現(xiàn)數(shù)據(jù)之間的關聯(lián)和價值。正是由于存儲成本的下降,才能為大數(shù)據(jù)搭建最好的基礎設施。
5、計算:運算速度越來越快
海量數(shù)據(jù)從原始數(shù)據(jù)源到產生價值,期間會經過存儲、清洗、挖掘、分析等多個環(huán)節(jié),如果計算速度不夠快,很多事情是無法實現(xiàn)的。所以,在大數(shù)據(jù)的發(fā)展過程中,計算速度是非常關鍵的因素。
分布式系統(tǒng)基礎架構Hadoop的出現(xiàn),為大數(shù)據(jù)帶來了新的曙光;
HDFS為海量的數(shù)據(jù)提供了存儲;
MapReduce則為海量的數(shù)據(jù)提供了并行計算,從而大大提高了計算效率;
Spark、Storm、Impala等各種各樣的技術進入人們的視野。
6、智能:機器擁有理解數(shù)據(jù)的能力
大數(shù)據(jù)帶來的最大價值就是“智慧”,大數(shù)據(jù)讓機器變得有智慧,同時人工智能進一步提升了處理和理解數(shù)據(jù)的能力。例如:
谷歌AlphaGo大勝世界圍棋冠軍李世石
阿里云小Ai成功預測出《我是歌手》的總決賽歌王
iPhone上智能化語音機器人Siri
微信上與大家聊天的微軟小冰
7、大數(shù)據(jù)的意義
美國著名管理學家愛德華·戴明所言:“我們信靠上帝。除了上帝,任何人都必須用數(shù)據(jù)來說話。”
(1)有數(shù)據(jù)可說
在大數(shù)據(jù)時代,“萬物皆數(shù)”,“量化一切”,“一切都將被數(shù)據(jù)化”。人類生活在一個海量、動態(tài)、多樣的數(shù)據(jù)世界中,數(shù)據(jù)無處不在、無時不有、無人不用,數(shù)據(jù)就像陽光、空氣、水分一樣常見,好比放大鏡、望遠鏡、顯微鏡那般重要。
(2)說數(shù)據(jù)可靠
大數(shù)據(jù)中的“數(shù)據(jù)”真實可靠,它實質上是表征事物現(xiàn)象的一種符號語言和邏輯關系,其可靠性的數(shù)理哲學基礎是世界同構原理。世界具有物質統(tǒng)一性,統(tǒng)一的世界中的一切事物都存在著時空一致性的同構關系。這意味著任何事物的屬性和規(guī)律,只要通過適當編碼,均可以通過統(tǒng)一的數(shù)字信號表達出來。
因此,“用數(shù)據(jù)說話”、“讓數(shù)據(jù)發(fā)聲”,已成為人類認知世界的一種全新方法。
8、風馬??上嗉?/h1>
在大數(shù)據(jù)背景下,因海量無限、包羅萬象的數(shù)據(jù)存在,讓許多看似毫不相干的現(xiàn)象之間發(fā)生一定的關聯(lián),使人們能夠更簡捷、更清晰地認知事物和把握局勢。大數(shù)據(jù)的巨大潛能與作用現(xiàn)在難以進行估量,但揭示事物的相關關系無疑是其真正的價值所在。
經典案例:
(1)啤酒與尿布

(2)谷歌與流感

作者:尚學堂大數(shù)據(jù)學院
鏈接:大數(shù)據(jù)的概念
來源:AcFun
或許你看完還是不太明白,可以加深了解一下:
【尚學堂】b站播放量前十-大數(shù)據(jù)全套教程2020年終版_就業(yè)班全套共20個階段-新手小白必看視頻-大數(shù)據(jù)年終總結大放送