計(jì)算機(jī)畢業(yè)設(shè)計(jì)Hadoop+Spark交通大數(shù)據(jù) 地鐵客流量大數(shù)據(jù) 交通實(shí)時(shí)分析 大數(shù)據(jù)畢設(shè)
2022-11-20 00:12 作者:計(jì)算機(jī)畢業(yè)設(shè)計(jì)之家 | 我要投稿
簡介
該項(xiàng)目主要分析深圳通刷卡數(shù)據(jù),通過大數(shù)據(jù)技術(shù)來研究深圳地鐵客運(yùn)能力及探索優(yōu)化服務(wù)的方向
主要講解Flink流處理實(shí)時(shí)分析部分,離線部分較簡單,暫時(shí)略過
項(xiàng)目流程:
采用python請求深圳地鐵數(shù)據(jù)API,將數(shù)據(jù)發(fā)送至Kafka和MySQL。
kafka部分用于實(shí)時(shí)計(jì)算,MySQL部分模仿業(yè)務(wù)數(shù)據(jù),用于離線分析
Flink連接Kafka進(jìn)行實(shí)時(shí)統(tǒng)計(jì)各站收入情況
將統(tǒng)計(jì)的結(jié)果Sink到Mysql進(jìn)行可視化展示
離線部分用sqoop將業(yè)務(wù)數(shù)據(jù)導(dǎo)入到hive中進(jìn)行分析,最終將分析完的數(shù)據(jù)導(dǎo)出到MySQL用于可視化展示
整體使用azkaban進(jìn)行調(diào)度
組件版本:
python 3.6.6
java ?1.8
scala 2.11
kafka_2.11-2.4.1
zookeeper_3.4.6
flink 1.14.0
hadoop 2.7.6
sqoop 1.4.6
hive 1.2.1
azkaban 2.5.0
mysql 5.7
FineReport 11?
運(yùn)行截圖






標(biāo)簽: