《利用Python進(jìn)行數(shù)據(jù)分析·第2版》第11章 時(shí)間序列

時(shí)間序列(time series)數(shù)據(jù)是一種重要的結(jié)構(gòu)化數(shù)據(jù)形式,應(yīng)用于多個(gè)領(lǐng)域,包括金融學(xué)、經(jīng)濟(jì)學(xué)、生態(tài)學(xué)、神經(jīng)科學(xué)、物理學(xué)等。在多個(gè)時(shí)間點(diǎn)觀察或測(cè)量到的任何事物都可以形成一段時(shí)間序列。很多時(shí)間序列是固定頻率的,也就是說,數(shù)據(jù)點(diǎn)是根據(jù)某種規(guī)律定期出現(xiàn)的(比如每15秒、每5分鐘、每月出現(xiàn)一次)。時(shí)間序列也可以是不定期的,沒有固定的時(shí)間單位或單位之間的偏移量。時(shí)間序列數(shù)據(jù)的意義取決于具體的應(yīng)用場(chǎng)景,主要有以下幾種:
時(shí)間戳(timestamp),特定的時(shí)刻。
固定時(shí)期(period),如2007年1月或2010年全年。
時(shí)間間隔(interval),由起始和結(jié)束時(shí)間戳表示。時(shí)期(period)可以被看做間隔(interval)的特例。
實(shí)驗(yàn)或過程時(shí)間,每個(gè)時(shí)間點(diǎn)都是相對(duì)于特定起始時(shí)間的一個(gè)度量。例如,從放入烤箱時(shí)起,每秒鐘餅干的直徑。
本章主要講解前3種時(shí)間序列。許多技術(shù)都可用于處理實(shí)驗(yàn)型時(shí)間序列,其索引可能是一個(gè)整數(shù)或浮點(diǎn)數(shù)(表示從實(shí)驗(yàn)開始算起已經(jīng)過去的時(shí)間)。最簡(jiǎn)單也最常見的時(shí)間序列都是用時(shí)間戳進(jìn)行索引的。
提示:pandas也支持基于timedeltas的指數(shù),它可以有效代表實(shí)驗(yàn)或經(jīng)過的時(shí)間。這本書不涉及timedelta指數(shù),但你可以學(xué)習(xí)pandas的文檔(http://pandas.pydata.org/)。
pandas提供了許多內(nèi)置的時(shí)間序列處理工具和數(shù)據(jù)算法。因此,你可以高效處理非常大的時(shí)間序列,輕松地進(jìn)行切片/切塊、聚合、對(duì)定期/不定期的時(shí)間序列進(jìn)行重采樣等。有些工具特別適合金融和經(jīng)濟(jì)應(yīng)用,你當(dāng)然也可以用它們來分析服務(wù)器日志數(shù)據(jù)。
閱讀全文:http://t.cn/RudtYGW