上篇【Python入門到底有多簡單】之groupby數(shù)據(jù)分類匯總(二)中,末尾我們生成文件phylum_1.xlsx,phylum列有單元格是合并狀態(tài),在pandas重新讀取后會出現(xiàn)NaN,因此需要對NaN數(shù)據(jù)進行填充后分析。本次介紹幾種填充方法。
In [1]:
import pandas as pdIn [2]:
df = pd.read_excel('data/ASV/phylum_1.xlsx') df
Out[2]:
2.1用數(shù)值或字符串填充
In [3]:
NaN處均填充數(shù)值666
df.fillna(666)Out[3]:
In [4]:
NaN處均填充uncultured
df.fillna('uncultured')Out[4]:
2.2用字典填充
In [5]:
字典格式{key1:value1,key2:value2,......}
df.fillna({'phylum':666})
Out[5]:
2.3method參數(shù)填充
2.3.1用前面的值填充
In [6]:
df.fillna(method='ffill')Out[6]:
2.3.2用后面的值填充
In [7]:
df.fillna(method='bfill')Out[7]:
2.3.2用后面的值填充
In [7]:
df.fillna(method='bfill')Out[7]:
2.3.3limit限制填充的個數(shù)
In [8]:
df.fillna(method='ffill',limit=2)Out[8]:
2.3.4axis=1 修改填充方向
默認參數(shù)數(shù)axis=0,按列填充。axis=1則按照行填充。bfill按照后面的值填充
In [9]:
df.fillna(method='bfill',axis=1)Out[9]:
inplace=True直接修改原對象
inplace參數(shù)默認為False,填充后不改變原數(shù)據(jù)。inplace=True則將原數(shù)據(jù)直接改變。
df.fillna(method='ffill',inplace=True) dfOut[10]:
往期相關(guān)鏈接:
1、R基礎(chǔ)篇
excel不熟練怎么辦,R來幫您(一)數(shù)據(jù)分類匯總; R相關(guān)軟件及R包安裝; 【零基礎(chǔ)學繪圖】之繪制venn圖(五);2、R進階
ggplot2參數(shù)設(shè)置麻煩?試試ggpar!;
【繪圖進階】之六種帶中心點的PCA 圖和三維PCA圖繪制(四);
【繪圖進階】之交互式可刪減分組和顯示樣品名的PCA 圖(三);
3.python基礎(chǔ)篇
【Python入門到底有多簡單】之groupby數(shù)據(jù)分類匯總(二);4、數(shù)據(jù)提交
3分鐘學會CHIP-seq類實驗測序數(shù)據(jù)可視化 —IGV的使用手冊;
10分鐘搞定多樣性數(shù)據(jù)提交,最快半天內(nèi)獲取登錄號,史上最全的多樣性原始數(shù)據(jù)提交教程;
20分鐘搞定GEO上傳,史上最簡單、最詳細的GEO數(shù)據(jù)上傳攻略;
5、表達譜分析
表達譜分析(二)通路富集分析和基因互作網(wǎng)絡(luò)圖繪制;miRNA靶基因預(yù)測軟件__miRWalk 3.0;
6、醫(yī)學數(shù)據(jù)分析
KING: 樣本親緣關(guān)系鑒定工具;【W(wǎng)GS服務(wù)升級】人工智能軟件SpliceAI助力解讀罕見和未確診疾病中的非編碼突變;
隱性疾病trio家系別忽視單親二倍體現(xiàn)象——天昊數(shù)據(jù)分析助力臨床疾病診斷新添UPD(單親二倍體)可視化分析工具;
【昊工具】Oh My God! 太好用了吧!疾病或表型的關(guān)鍵基因查詢數(shù)據(jù)庫,我不允許你不知道Phenolyzer;
天昊客戶服務(wù)中心
手機/微信號:18964693703
【本群將為大家提供】
分享生信分析方案
提供數(shù)據(jù)素材及分析軟件支持
定期開展生信分析線上講座
QQ號:1040471849
作者:大熊
審核:有才
來源:天昊生信團