學(xué)好數(shù)據(jù)分析,凸顯算法的重要性
數(shù)據(jù)分析是一門新時代產(chǎn)物,不是說以前沒有,而是最近幾年互聯(lián)網(wǎng)的推動,以及人工智能,各大購物網(wǎng)站推薦算法,各大電影推薦,視頻音樂等網(wǎng)站的電視劇推薦,音樂推薦,搜索引擎排名等,這些都是推薦算法的一種應(yīng)用。 說到數(shù)據(jù)分析,必須談到一個數(shù)據(jù)清洗,轉(zhuǎn)換,即所謂的ETL,像kettle工具,非常方便的完成一些數(shù)據(jù)轉(zhuǎn)換及作業(yè)。大數(shù)據(jù)時代,像Hadoop生態(tài),MR思想,這些都是一些初學(xué)者必須掌握的。 然而想成為一名架構(gòu)師,必須掌握算法的具體細(xì)節(jié),運行效率,空間時間復(fù)雜度。高等數(shù)學(xué)也需要掌握。研究生學(xué)習(xí)的時候,模式識別這本書,晦澀難懂,里面好多高深的數(shù)學(xué)理論知識,推薦各位數(shù)據(jù)分析的專業(yè)人士學(xué)習(xí)。 要搞科研的相關(guān)人士,每一章節(jié)搞熟,都能發(fā)幾篇核心期刊。像貝葉斯概率模型,kmeans算法,特征提取,分類,神經(jīng)網(wǎng)絡(luò)等,都是一些非常不錯的知識。在視頻音頻處理,必須了解圖像存儲的相關(guān)理論知識,java有javacv用于操作opencv的相關(guān)工具包,提取視頻每一幀,加水印,加濾鏡,改通道等。攝像監(jiān)控領(lǐng)域,有webcam,可以控制本地或遠(yuǎn)程計算機(jī),實時傳輸。 上面只是列舉了相關(guān)應(yīng)用,計算機(jī)傳輸都逃脫不了TCP/IP模型,在網(wǎng)絡(luò)通信中,TCP,UTP的連接,三次握手,四次揮手等,在java中的socket必須掌握,只有原理搞扎實,其他的網(wǎng)絡(luò)框架才了然于胸。 有空閑時間,建議讀讀《模式識別》,搞搞GNS網(wǎng)絡(luò)模擬實驗,數(shù)據(jù)分析應(yīng)用領(lǐng)域的深挖,我在之前想到一個應(yīng)用場景,估計實現(xiàn)好有一定的投入市場,就是敬老院里捕捉人摔跤的聲音自動報警,其他聲音可以擴(kuò)展,原理就是聲音識別,通過訓(xùn)練,在一些比較安靜的環(huán)境中還是可以達(dá)到高識別率。