1 python-數據描述與分析( 二 )


data = https://www.huyubaike.com/biancheng/{"name":["國科圖","國科圖","文獻情報中心","文獻情報中心"],"year":["2012","2013","2014","2015"],"local":["北四環西路","北四環西路","北四環西路","北四環西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF["name"])print (centerDF["student"])#output:a國科圖b國科圖c文獻情報中心d文獻情報中心Name: name, dtype: objecta甲b乙c丙d丁Name: student, dtype: object另外 , 可以看出按列進行獲取時他們的index標識是相同的,且每一列是一個Series 對象
按行進行數據獲??,其实是通过index進行操作,具體如下:
data = https://www.huyubaike.com/biancheng/{"name":["國科圖","國科圖","文獻情報中心","文獻情報中心"],"year":["2012","2013","2014","2015"],"local":["北四環西路","北四環西路","北四環西路","北四環西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF.loc["a"])#在使用進行DataFrame.ix進行表中的數據塊選擇的時候,會拋出’DataFrame’ object has no attribute ‘ix’,這個是由于在不同的pandas的版本中,DataFrame的相關屬性已過期,已不推薦使用導致的 。#參考代碼先鋒網

1 python-數據描述與分析

文章插圖
#output:year2012name國科圖local北四環西路student甲Name: a, dtype: object另外,同樣可以看出每一行是一個Series 對象,此時該Series的index其實就是DataFrame 的列名稱 , 綜上來看 , 對于一個DataFrame 來說 , 它是縱橫雙向進行索引 , 只是每個Series(縱橫)都共用一個索引而已
1.3 利用Pandas加載、保存數據在進行數據處理時我們首要工作是把數據加載到內存中 , 這一度成為程序編輯的軟肋,但是Pandas包所提供的功能幾乎涵蓋了大多數的數據處理的加載問題,如read_csv、read_ExcelFile
(1)加載csv格式的數據
import pandas as pddata_csv = pd.read_csv("D:/python_cailiao/test.csv")#它的默認屬性有sep=","data_csv#output:schoolinstitutegradesname0中國科學院大學文獻情報中心15級田鵬偉1中國科學院大學文獻情報中心15級李四2中國科學院大學文獻情報中心15級王五3中國科學院大學文獻情報中心15級張三data_csv = pd.read_csv("D:/python_cailiao/test.csv",sep="#")#更改默認屬性sep="#"data_csv#output:school,institute,grades,name0中國科學院大學,文獻情報中心,15級,田鵬偉1中國科學院大學,文獻情報中心,15級,李四2中國科學院大學,文獻情報中心,15級,王五3中國科學院大學,文獻情報中心,15級,張三【1 python-數據描述與分析】data_csv = pd.read_csv("D:/python_cailiao/test.csv",header=None,skiprows=[0])#不要表頭Headerdata_csv#output:schoolinstitutegradesname0中國科學院大學文獻情報中心15級田鵬偉1中國科學院大學文獻情報中心15級李四2中國科學院大學文獻情報中心15級王五3中國科學院大學文獻情報中心15級張三data_csv.columns=["school","institute","grades","name"]data_csv#自行添加表頭列#output:schoolinstitutegradesname0中國科學院大學文獻情報中心15級田鵬偉1中國科學院大學文獻情報中心15級李四2中國科學院大學文獻情報中心15級王五3中國科學院大學文獻情報中心15級張三另外,綜上,通過對csv格式的文件進行讀取,我們可以指定讀入的格式(sep=","),也可以指定他的header為空None , 最后添加column,而之所以可以后來添加的原因是讀入的csv已經是DataFrame格式對象
(2)保存csv數據
data_csv.loc[1,"name"]="顧老師"data_csv.to_csv("D:/python_cailiao/save.csv")
1 python-數據描述與分析

文章插圖
(1)加載excel格式的數據
data_excel = pd.read_excel("D:/python_cailiao/excel.xlsx",sheet_name="test")data_excel#output:schoolinstitutegradesname0中國科學院大學文獻情報中心15級田鵬偉1中國科學院大學文獻情報中心15級李四2中國科學院大學文獻情報中心15級王五3中國科學院大學文獻情報中心15級張三data_excel.loc[1,"name"]="顧立平老師"data_excel#output:schoolinstitutegradesname0中國科學院大學文獻情報中心15級田鵬偉1中國科學院大學文獻情報中心15級顧立平老師2中國科學院大學文獻情報中心15級王五3中國科學院大學文獻情報中心15級張三(2)保存數據
data_excel.to_excel("D:/python_cailiao/save.xlsx",sheet_name="test")
1 python-數據描述與分析

推薦閱讀