最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

馬哥Python數(shù)據(jù)分析3期

2023-06-23 21:52 作者:不知其幾千里耶  | 我要投稿

數(shù)據(jù)分析簡介

一、數(shù)據(jù)獲取

1.數(shù)據(jù)獲取手段

數(shù)據(jù)獲取的手段主要有四種:數(shù)據(jù)倉庫,監(jiān)測與抓取,填寫、埋點(diǎn)、日志,計(jì)算

1) 數(shù)據(jù)倉庫

(1) 將所有業(yè)務(wù)的數(shù)據(jù)經(jīng)匯總處理,構(gòu)成數(shù)據(jù)倉庫(DW)

  • 全部事實(shí)的記錄

  • 部分維度與數(shù)據(jù)的整理(數(shù)據(jù)集市-DM)

(2)數(shù)據(jù)庫VS倉庫

  • 數(shù)據(jù)庫面向業(yè)務(wù)存儲,倉庫面向主題存儲(主題:較高層次上對分析對象數(shù)據(jù)的一個完整并且一致的描述)

  • 數(shù)據(jù)庫針對應(yīng)用(OLTP:On-Line Transaction Processing),數(shù)據(jù)倉庫正對分析(OLAP:Online analytical processing)

  • 數(shù)據(jù)庫組織規(guī)范,倉庫可能冗余,相對變化大,數(shù)據(jù)量大

2) 監(jiān)測與抓取

(1) 監(jiān)測

使用監(jiān)測設(shè)備或或算法直接獲取數(shù)據(jù),如傳感器網(wǎng)絡(luò)等

(2) 抓取

  • 直接解析網(wǎng)頁、接口、文件的信息

  • Python常用工具

  • 抓取數(shù)據(jù): urllib、urllib2、 requests、scrapy

  • 解析路徑:PhantomJS(運(yùn)行JS代碼后才能解析)、BeautigulSoup、Xpath(lxml)


馬哥Python數(shù)據(jù)分析3期的評論 (共 條)

分享到微博請遵守國家法律
桂平市| 香港| 棋牌| 蚌埠市| 兴宁市| 元氏县| 壶关县| 中超| 平凉市| 新营市| 吐鲁番市| 东阳市| 仁布县| 平利县| 大英县| 沅陵县| 温泉县| 九寨沟县| 汕头市| 岳普湖县| 湟中县| 沐川县| 郧西县| 自治县| 南宫市| 宾阳县| 九寨沟县| 星座| 梅河口市| 甘孜| 奉节县| 富平县| 连平县| 台山市| 鹤峰县| 滕州市| 察哈| 平顺县| 静乐县| 岳阳市| 广昌县|