下班后我都学了什么 | Python 如何高效的遍历DataFrame?
Python 如何高效的遍历DataFrame?
·
小小数据分析师~ 给自己充充电🔋,然后把笔记整理在博客~~
❤️ 如果我的总结对你有帮助,请点赞👍支持哦,谢谢!!
欢迎留言交流~~ 一起进步 💦
❤️ 「更多文章」
下班后我都学了什么 | 文章集合
🌟 目录
一、为什么学这个?
二、内容大纲
三、正文
四、脑图
一、为什么学这个?
背景:上周打比赛,对百万量级的DataFrame做遍历,用的for循环处理要将近6hours ……,效率低下。
因此,除了for循环,用更好的方法优化吗?
二、内容大纲 👇
- 0 参考资料
- 1 查询DataFrame的方法?
- 1.0 数据说明
- 1.1 []切片方
- 1.2 loc
- 1.3 iloc
- 1.4 at
- 1.5 iat
- 1.6 ix
- 2 遍历DataFrame 的方法及比较
- 2.0 数据说明
- 2.1 用不同方法实现:两元素相加 # aaa + bbb
(1)python 循環 + iloc 定位
(2)python 循環 + iat 定位
(3)pandas.DataFrame.iterrows() 迭代器
(4)pandas.DataFrame.apply 迭代
(5)pandas.DataFrame.apply 迭代 + 只讀兩列
(6)列表構造
(7)pandas 數組操作
(8)numpy 數組操作
- 3 结论
- 3.1 运行速度
- 3.2 建议
(1)优先使用numpy数组操作;不能数组操作的时候用列表构造!
(2)能用at/iat就不用loc/iloc;能用apply就不用迭代,能用数组操作就不用其他方法。
二、正文
三、脑图

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)