这篇教程python-pandas创建Series数据类型的操作写得很实用,希望能帮到您。 1.什么是pandas
2.查看pandas版本信息输出: 3.常见数据类型常见的数据类型: - 一维: Series - 二维: DataFrame - 三维: Panel … - 四维: Panel4D … - N维: PanelND … 4.pandas创建Series数据类型对象1). 通过列表创建Series对象array = ["粉条", "粉丝", "粉带"]# 如果不指定索引, 默认从0开始;s1 = pd.Series(data=array)print(s1)# 如果不指定索引, 默认从0开始;ss1 = pd.Series(data=array, index=['A', 'B', 'C'])print(ss1) 输出: 0 粉条1 粉丝2 粉带dtype: objectA 粉条B 粉丝C 粉带dtype: object 2). 通过numpy的对象Ndarray创建Series;n = np.random.randn(5) # 随机创建一个ndarray对象;s2 = pd.Series(data=n)print(s2)# 修改元素的数据类型;ss2 = s2.astype(np.int)print(ss2) 输出: 0 -1.6497551 0.6074792 0.9431363 -1.7940604 1.569035dtype: float640 -11 02 03 -14 1dtype: int64 3). 通过字典创建Series对象;dict = {string.ascii_lowercase[i]:i for i in range(10)}s3 = pd.Series(dict)print(s3) 输出: a 0b 1c 2d 3e 4f 5g 6h 7i 8j 9dtype: int64 5.Series基本操作共同部分: import pandas as pdimport numpy as npimport stringarray = ["粉条", "粉丝", "粉带"]s1 = pd.Series(data=array)print(s1) 输出: 0 粉条1 粉丝2 粉带dtype: object 1). 修改Series索引.indexprint(s1.index) #输出:RangeIndex(start=0, stop=3, step=1)s1.index = ['A', 'B', 'C']print(s1) 输出: A 粉条B 粉丝C 粉带dtype: object 2). Series纵向拼接.appends1.index = ['A', 'B', 'C']array = ["粉条", "粉丝", "粉带"]# 如果不指定索引, 默认从0开始;s2 = pd.Series(data=array)s3 = s1.append(s2)print(s3) 输出: A 粉条B 粉丝C 粉带0 粉条1 粉丝2 粉带dtype: object 3). 删除指定索引对应的元素.drop(‘index')s3 = s3.drop('C') # 删除索引为‘C'对应的值;print(s3) 输出: A 粉条B 粉丝0 粉条1 粉丝2 粉带dtype: object 4). 根据指定的索引查找元素print(s3['B']) #粉丝s3['B'] = np.nan #索引B处的值替换为缺失值print(s3) 输出: A 粉条B NaN0 粉条1 粉丝2 粉带dtype: object 5). 切片操作 — 同列表print(s3[:2]) #显示前两个元素print(s3[::-1]) #逆序print(s3[-2:]) # 显示最后两个元素 输出: A 粉条B NaNdtype: object-------------------------2 粉带1 粉丝0 粉条B NaNA 粉条dtype: object-------------------------1 粉丝2 粉带dtype: object 6.Series运算先设置两个Series对象: import pandas as pdimport numpy as npimport strings1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))s2 = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8]))print(s1)print(s2) 
按照对应的索引进行计算, 如果索引不同,则填充为Nan; 1).加法addprint(s1 + s2)print(s1.add(s2)) 输出: a NaNb NaNc 4.0d 6.0e 8.0f NaNg NaNh NaNdtype: float64 2).减法subprint(s1 - s2)print(s1.sub(s2)) 输出: a NaNb NaNc 0.0d 0.0e 0.0f NaNg NaNh NaNdtype: float64 3).乘法mulprint(s1 * s2)print(s1.mul(s2)) 输出: a NaNb NaNc 4.0d 9.0e 16.0f NaNg NaNh NaNdtype: float64 4).除法divprint(s1 / s2)print(s1.div(s2)) 输出: a NaNb NaNc 1.0d 1.0e 1.0f NaNg NaNh NaNdtype: float64 5).求中位数median输出: 6).求和sum输出: 7).最大值max输出: 8).最小值min输出: 7.特殊的where方法series中的where方法运行结果和numpy中完全不同 import pandas as pdimport numpy as npimport strings1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))print(s1) 输出: a 0b 1c 2d 3e 4dtype: int64 大于3的显示,不大于3的为NaN 
# 对象中小于3的元素赋值为10;print(s1.where(s1 > 3, 10)) 
# 对象中大于3的元素赋值为10;print(s1.mask(s1 > 3, 10)) 
以上为个人经验,希望能给大家一个参考,也希望大家多多支持51zixue.net。如有错误或未考虑完全的地方,望不吝赐教。 python-opencv中的cv2.inRange函数用法说明 python 实现多线程的三种方法总结 |