最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

Pandas數(shù)據(jù)結(jié)構(gòu)簡介(一)

2023-08-29 07:06 作者:背著星星追太陽  | 我要投稿


# -*- coding: utf-8 -*-



"""# 數(shù)據(jù)結(jié)構(gòu)簡介

首先,這里介紹的很多材料都來自[Pandas數(shù)據(jù)結(jié)構(gòu)入門教程]. 話雖如此,我希望通過告訴你我作為數(shù)據(jù)科學(xué)家日常使用的習(xí)語來增加一些Pandas學(xué)習(xí)的重要內(nèi)容。所以讓我們開始吧。

# Series

Pandas 有兩種數(shù)據(jù)結(jié)構(gòu),一個`Series`和一個`Dataframe`。`Series`就像excel中的一列,基本上是所有相同類型的數(shù)據(jù)點列表。創(chuàng)建`Series`對象的基本方法如下:

還有其他方法可以制作Series(例如從字典中),但總的來說,這是我唯一使用過的方法。所以請注意,一個系列基本上有三個重要部分:


1. 數(shù)據(jù)

2. 索引

3. 名稱


數(shù)據(jù)可以是數(shù)據(jù)列表,也可以是廣播的單個實例,如下所示:



(我們稍后將看到的廣播非常重要)。


數(shù)據(jù)基本上是你作為數(shù)據(jù)科學(xué)家感興趣的。`index`通常用時間序列,但除此之外,我真的不用`Series index`(現(xiàn)在我確實經(jīng)常使用DataFrame的索引!但請注意,每個數(shù)據(jù)點都與一個index相關(guān)聯(lián)。


最后是`name`。僅當(dāng)將`Series`添加到`Datafram`時,name才真正重要。在這種情況下,`Series`的name將成為`coliunms`。


到目前為止,您還沒有看到為什么`Series`如此有用,但現(xiàn)在我們開始進(jìn)入它。`Series`有多種方法可以索引到它們



一般來說,我不做上述任何操作 - 如果你發(fā)現(xiàn)自己使用它們,一定要考慮一下你是否應(yīng)該使用Pandas進(jìn)行這些操作,或者你是否應(yīng)該使用Numpy。


現(xiàn)在讓我向您展示一些我經(jīng)常使用的操作



# 或者 更加常用的操作


# 你也可以改變這些數(shù)據(jù)

# 但是你需要小心處理這些操作


但是關(guān)于序列的一件事非常有用,那就是您可以對它們進(jìn)行矢量化操作(對整個序列中的所有內(nèi)容進(jìn)行快速計算)。你已經(jīng)看到了一個。


# 只是需要小心這些操作

# 如果index 不匹配,你將得到NAN

這些類型的操作是跨列的,就是Pandas的目的。每當(dāng)你偏離對列的操作時,你應(yīng)該對自己說:Pandas是最適合我的工具嗎?


現(xiàn)在對一列執(zhí)行操作似乎很有用,但是對多列執(zhí)行操作呢?


# DataFrame


`Series`很好,但它們的真正好處是數(shù)據(jù)幀。`DataFrame`就像一個完整的Excel電子表格!正如您可能猜到的那樣,`Datafram`是一系列`Series`,每個`Series`都有一個name和相同的index。因此,創(chuàng)建`DataFrame`的一種簡單方法是使用`Series/list`的字典方式創(chuàng)建它:




# 實際上,我經(jīng)常使用np.arrays和標(biāo)量的方式創(chuàng)建



有很多方法可以創(chuàng)建這些東西之一,但一般來說,只要知道一個就足夠了。以后始終可以更改索引或列的值



DataFrame` 基本上只是`Columns/Series`的字典,因此您可以使用大多數(shù)與`DataFrame`本身的`Series`相同的技術(shù)。


引用列的一般方法如下:

"""



# 輸出一個有name的Series


然后,您可以使用我們上面所做的`Series`做任何事情。

有一個點符號快捷方式`df.one`,但最好不要知道它,因為如果使用不當(dāng),它可能會導(dǎo)致錯誤!

當(dāng)然,您也可以刪除和創(chuàng)建新列,也可以進(jìn)行廣播




同樣,還有其他插入列的方法(插入和分配方法),但我從不使用它們。使用其他方法的好處似乎也很小。


接下來,讓我們介紹一下使用Dataframe進(jìn)行索引和選擇?;旧嫌?種方法可以做到這一點:



## DataFrame 功能


除了執(zhí)行這些按列操作之外,還可以執(zhí)行一些`DataFrame`操作。


其中最有用的是復(fù)制方法:)




下一個我經(jīng)常使用的是DataFrame轉(zhuǎn)置功能"""



這會將行作為列,將列作為行。這可能是執(zhí)行逐行操作的好方法,但主要是我這樣做是為了顯示`DataFrame`值。以下是顯示`Dataframe`值的三種常用方法"""



"""但是,您會注意到,當(dāng)列數(shù)過多時,顯示會很混亂:"""



#transposing 來幫忙


有時這也會截斷。要查看更多內(nèi)容,您可以隨時更改下面的視圖選項(順便說一句,Pandas中有很多選項,您可以在此處或使用 ):`pd.set_option?`"""



## 總結(jié)

恭喜,這是基礎(chǔ)知識,現(xiàn)在您應(yīng)該能夠在這里進(jìn)行[練習(xí)]

關(guān)于Pandas還有很多事情要做,我們將在這里介紹更多!



Pandas數(shù)據(jù)結(jié)構(gòu)簡介(一)的評論 (共 條)

分享到微博請遵守國家法律
闵行区| 蒙阴县| 常宁市| 常德市| 晋宁县| 临夏县| 桂平市| 新化县| 湛江市| 三门峡市| 烟台市| 东至县| 葫芦岛市| 唐河县| 汤阴县| 鸡西市| 伊吾县| 儋州市| 涡阳县| 台南市| 荣昌县| 清镇市| 宁夏| 洛川县| 勐海县| 新平| 泌阳县| 连平县| 县级市| 屏山县| 图木舒克市| 右玉县| 桦川县| 黔江区| 孙吴县| 梅州市| 和田县| 图木舒克市| 谢通门县| 峨眉山市| 建始县|