車流量、人流量、購物數據,你生活中無處不在的大數據
大數據行業(yè)越來越火熱,越來越多的人開始了解大數據,你知道其實我們身邊有很多大數據,這些都與我們生活息息相關。
我想好多人對大數據還沒有一個完整的概念,認為大數據距離自己是很遙遠的一件事情,其實呢,大數據離我們并不遙遠,并且大數據就在我們的身邊,與我們的生活是息息相關呢,那么什么是大數據呢?在百度百科,對大數據的定義如下:
大數據(big data),指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。

首先,可以肯定一點,大數據肯定是海量的,另外這些數據的價值需要進行處理,整理,分析,挖掘其潛在價值,如果只是一堆海量的數據在哪里放著,也將是毫無價值的,需要經過分析,整理,決策,這樣才能產生巨大的價值,如果我們將海量的數據叫做資源,將分析,整理,決策叫做計算,也就是資源+計算產生了巨大的價值,如果沒有資源就談不上計算了,如果只有資源,沒有計算也是毫無價值的。
在高速發(fā)展的的現代社會里,我們周圍充斥著大數據,在全球范圍內每秒鐘都會有海量的數據產生,并且24小時不間斷的持續(xù)產生著,接下來就舉例說明我們平時周圍所能看到的一些大數據吧!

每日的車流量
比如說在城市里,車來車往,小轎車的數量多如牛毛,電子監(jiān)控設備也是不計其數,每時每刻都會產生大量的數據,這些電子監(jiān)控設備都會不停的采集這些城市交通數據,每一輛車的車型,車牌號,出現的地理位置,以及路過的時間都不會逃出這些監(jiān)控設備的法眼。對這些數據的分析就能得到一些有價值的事情,比如哪個地段交通事故頻發(fā),需要采取進一步的安全措施,哪個地方違章頻發(fā),需要進一步分析什么原因造成的等等。
上下班地鐵站
在一些大都市,地鐵對每一個上班族來說,肯定是在熟悉不過的事情,地鐵的人流量大家也是深有體會的,通過一個小小的公交卡片就能非??旖莘奖闶占矫恳粋€地鐵站,每個時間段的客流量,根據這些客流量也能準確的計算出平時的出現高峰期,以及從而做出正確的決策,比如在哪個時間段,那個站點需要進行人流的控制來緩解交通出行的壓力。

每日的閱讀數據
現在基本上每個人都有一部智能手機,不論是商場,還是在家里,還是在其他任何地方,相信好多低頭族都在不停的刷著手機,也在每時每刻的的產生著海量數據。
每日的購物數據
各種各樣的電商網站,各種各樣的物品,都在時時刻刻的產生著海量的數據,自從有了互聯網,每分鐘的交易數與傳統的生意相比提高了成千上萬倍(遠遠不止成千上萬)。
這些種種活動背后都是有海量的數據產生,上面提到了,作為大數據核心兩點就是資源和計算,只有這兩點結合起來才能產生巨大的價值,那么大數據的具體處理流程應該什么樣一個過程呢?為什么說一個過程中,因為大數據不再是像傳統的小量數據,實時產生計算結果,他是一個流程化的過程,一般分成以下幾個環(huán)節(jié)。
數據的收集/采集
這是第一個步聚,數據的產生都是由這個環(huán)節(jié)引起的,這個環(huán)節(jié)只是簡單的收集數據,不考慮數據的重復性及有效性,就是簡單的數據錄入
數據的處理及格式轉換
這部的主要工作就是將數據加工處理及對數據的有效性及重復性校驗,及格式上進行轉換,轉換成事先設計好的格式,從而方便數據向固定的存儲介質上進行存儲

圖片來之互聯網
數據的存儲
上面說的存儲介質可能是數據庫或文件存儲系統等或者是幾種存儲方式的結合,將采集到的數據進行有效處理從而沉淀下來。
數據的統計分析
對存儲的起來的數據進行多個維度進行分析,得出相應的結論,這些維度都是一些技術人員或者業(yè)務專家共同探討制定出來的,按照這些維度能得出來好多有價值的結果!
數據的挖掘
通過對分析到各個維度得出的情況來挖掘他們背后的各種聯系,得出相應的策略,從而并很快的實施下去。
大家好,我是“上世是朵花”。如果你有什么好的看法或者觀點可以在評論區(qū)展現你的才華,互動交流,如果想進一步了解我,那就關注我吧!