pandas中的核心数据结构是序列Series数据框DataFrame

Series类似于numpy中的一维数组DataFrame类似于numpy中的二维数组。

Series是个定长的字典序列,有两个默认属性:索引index数据values索引默认是从0开始,也可以自己指定索引。

Series输出包含两列,索引列数据列,如下图,左边是索引列,右边是数据列。

数据可以通过索引来获取,例如a[索引]=数据,通过索引获取数据。

import pandas as pd
from pandas import Series,DataFrame
a = Series([1,2,3,4])
#不指定index索引,则默认索引从0开始
b = Series(data = [1,2,3,4],index = ['a','b','c','d'])
#指定index索引


print(a)
print(b)



#通过索引获取元素值
print(a[3]) #这里的3是索引号,索引3对应的是“4”这个元素
print(b['b'])   #这里的‘b’是索引号,‘b’对应的是2这个元素
print(a[[1,3]])
#a中的索引1和索引3的元素,索引号和值对应输出

 

数据框DataFrame是类似于二维数组有一列索引列多列数据列数据以表格形式存储,有对应的行和列。

DataFrame的创建方式:通过二维数组创建数据框,左边是索引最上面一行是列名,和表格形式一样。

pandas统计分析:

前序知识如下:

CSDNicon-default.png?t=M276https://mp.csdn.net/mp_blog/creation/editor/124152704

 

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐