Series和DataFrame使用簡單入門

發布時間:2019-11-13 22:21 來源:互聯網 當前欄目:網站服務器

(1)、導入庫

from pandas import Series,DataFrame
import pandas
import numpy

(2)、Series簡單創建與使用

#Serires
obj = Series([4,7,-5,3]) #簡單創建Serires
print(obj) #簡單輸出
print(obj.values) #輸出值
print(obj.index)  #輸出索引

obj2 = Series([4,7,-5,3], index=['d','b','a','c'])  #指定索引
print(obj2)   #簡單輸出
print(obj2.index)  #輸出索引
print(obj2['a'])  #根據索引輸出單個值
obj2['d']=6   #根據索引修改值
print(obj2['d'])  #輸出
print(obj2[['d','a','c']]) #輸出多個值
print(obj2[obj2 > 0])  #按條件輸出
print('b' in obj2) #根據索引看數組里面是否有,返回True
print('e' in obj2) #返回False

(3)、根據字典創建Series

#根據字典創建Series
sdata = {'Oer':56,'asdgr':32,'rgg':89,'greg':44}
obj3 = Series(sdata)
print(obj3)

(4)、列表與字典進行匹配

#列表與字典進行匹配
sdata = {'Oer':56,'asdgr':32,'rgg':89,'greg':44}
states = ['Casfef','Oer','rgg','greg'] 
obj4 = Series(sdata, index = states)  #列表與字典進行匹配
print(obj4)
print(pd.isnull(obj4)) #查看數據是否為空
print(pd.notnull(obj4)) #查看數據是否非空

(5)、兩個Serires相加

#兩個Serires相加
obj1 = Series([3,7,-4,3], index=['q','b','a','c'])
obj2 = Series([4,7,-5,3], index=['d','b','a','g'])  
print(obj1 + obj2) #兩個Serires相加,具有共同索引的則相加,如果不是共同索引就置為NaN

(6)、修改索引的名字

#修改索引的名字
#obj = Series([4,7,-5,3], index=['d','b','a','g'])  
#obj.index = ['Bob','Steve','Jeff','Ryan']
#print(obj.index)

(7)、dataframe的簡單應用

#dataframe的簡單應用
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data)   #根據字典創建DataFrame
frame2 = DataFrame(data, columns= ['state', 'pop', 'year'])   #指定列的排列順序
frame3 = DataFrame(data, index= ['a','b','c','d'])   #指定行索引

(8)、獲取DataFrame其中的一列(相當于Series)

#獲取DataFrame其中的一列(相當于Series)
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根據字典創建DataFrame
print(frame['year'])  #獲取其中的一列
print(frame.loc['q2'])  #獲取其中的一行

(9)、修改DataFrame中的值

#修改DataFrame中的值
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根據字典創建DataFrame
frame['grg'] = numpy.arange(4) #修改某一列的值
val = Series([8.2,8.5,8.7], index=['q1','q3','q4'])   #修改指定列的值
frame['pop'] = val
print(frame)

(10)、輸出DataFrame整體值

#輸出DataFrame整體值
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根據字典創建DataFrame
print(frame.values)
        
 
  • 1、
  • 2、
  • 3、
  • 4、
  • 5、
  • 6、
  • 7、
  • 8、
  • 9、
  • 10、
  • 11、
  • 12、
  • 13、
  • 14、
  • 15、
  • 16、
  • 17、
  • 18、
  • 19、
  • 20、
  • 21、
  • 22、
  • 23、
  • 24、
  • 25、
  • 1、
  • 2、
  • 3、
  • 4、
  • 5、
  • 6、
  • 7、
  • 8、
  • 9、
  • 10、
  • 11、
  • 12、
  • 13、
  • 14、
  • 15、
  • 16、
  • 17、
  • 18、
  • 19、
  • 20、
  • 21、
  • 22、
  • 23、
  • 24、
  • 25、