【原】R語(yǔ)言與python對(duì)數(shù)據(jù)框的操作(對(duì)比筆記)

育種數(shù)據(jù)分析 2021-11-18

展開(kāi)全文

這篇主要比較R語(yǔ)言的data.talbe和python的pandas操作數(shù)據(jù)框的形式，學(xué)習(xí)兩者的異同點(diǎn)，加深理解兩者的使用方法。

1. data.table VS pandas

這里使用R語(yǔ)言的data.tablet包和python的pandas進(jìn)行對(duì)比.

主要分為三部分:

新建數(shù)據(jù)庫(kù)

行列選擇

行列篩選

2. data.table操作數(shù)據(jù)框

data.table介紹:

使用R語(yǔ)言, 通過(guò)data.table創(chuàng)建數(shù)據(jù)框.

library(data.table)
set.seed(123)
DT <- data.table(V1=c(1,2),V2=c("A","B","C"),V3=round(rnorm(4),4), V4=1:12)

2.1 行選擇

選擇單行

# 行選擇

DT[2]

DT[2,] # 同上

選擇多行

DT[3:5]

DT[3:5,]

選擇列

DT[,2]

可以使用.()號(hào), 返回?cái)?shù)據(jù)框

DT[,.(V2)] # 同上

或者使用list(), 等同于.()

DT[,list(V2)]

2.2 行列篩選

選擇V2等于A的列

DT[V2=="A"]

也可以使用下面這種形式

DT[V2=="A",]

如果選擇V2等于A或者等于B的列

DT[V2 == "A"|V2=="B"]

也可以使用%in%進(jìn)行多條件選擇

DT[V2 %in% c("A","B")]

新建一列V5

DT[,V5:=V3*V4]

DT

2.3 使用fwrite保存數(shù)據(jù)

fwrite(DT,"DT.csv")

3. pandas操作數(shù)據(jù)框

讀取數(shù)據(jù)

import pandas as pd
df = pd.read_csv("DT.csv")
df

3.1 行列選擇

選擇第一行, 需要給出區(qū)間, df[0]報(bào)錯(cuò), 要用df[0:1]

df[0:1] # 如果直接使用, 需要給出區(qū)間

也可以根據(jù)loc進(jìn)行提取

# loc 根據(jù)行名
df.loc[1] # 注意, python從0開(kāi)始

也可以根據(jù)iloc進(jìn)行提取

# iloc 根據(jù)行號(hào)
df.iloc[1]

注意, iloc是根據(jù)行號(hào), loc是根據(jù)行名

選擇多行

df[3:6] # 3包括, 6不包括

同上:

df.loc[3:5]

3.2 pandas選擇列

df["V2"]

也可以使用列數(shù)，使用iloc

df.iloc[:,1:2]

如果使用多個(gè)列名，要用[]

df[["V1","V2"]] # 用兩個(gè)[][]

效果同上。

df.iloc[:,0:2]

3.3 pandas行列篩選

df[df['V2']=="A"]

或者：

df[df['V2']=="A"]

多條件篩選

# 麻煩style: (df['V2']=='A')|(df['V2']=='B')
df[(df['V2']=='A')|(df['V2']=='B')]

也可以使用isin進(jìn)行操作：

# 使用.V2.isin()進(jìn)行多條件篩選
df[df.V2.isin(["A","B"])]

# 使用[].isin也可以
df[df['V2'].isin(["A","B"])]

創(chuàng)建新列V5

df.V5 = df.V3*df.V4
df

3.4 pandas保存文件

如果是R的思維：

write.csv(object, "file.csv")

但是pandas的風(fēng)格是

object.to_csv("file.csv")

正確有效的代碼：

df.to_csv("df.csv",index=0) # 對(duì)象.to_csv, 不是pd.write(df,"df.csv")!!!

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：育種數(shù)據(jù)分析 > 《待分類(lèi)》

舉報(bào)/認(rèn)領(lǐng)

0條評(píng)論

發(fā)表

請(qǐng)遵守用戶(hù) 評(píng)論公約

類(lèi)似文章 更多

育種數(shù)據(jù)分析

關(guān)注對(duì)話(huà)

TA的最新館藏

如逆水行舟不進(jìn)則退
單倍型分析：個(gè)體所對(duì)應(yīng)的單倍型是？
如何利用系譜或者SNP數(shù)據(jù)劃分家系？
如何利用DeepSeek的API搭建本地知識(shí)庫(kù)
群體遺傳三劍客第三篇：megacc和ggtree進(jìn)化樹(shù)分析
如何計(jì)算群體中的單倍型頻率

喜歡該文的人也喜歡更多

2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色