Python本地文件合并(csv)
在本地目录中打开该文件:二、单个文件夹底下多个文件合并=============================================================================csv_list=glob.glob(‘…/input/covid19temp/2020/*.csv’)print(csv_list)for i in csv_list:fr=open(i,‘
在本地目录中打开该文件:
=============================================================================
csv_list=glob.glob(‘…/input/covid19temp/2020/*.csv’)
如果不加上的话拿到的就是目录的名称,如果加上,拿到的就是完整的目录数据
print(csv_list)
for i in csv_list:
fr=open(i,‘r’).read()
with open(‘2020csvdata.csv’,‘a’) as f:
f.write(fr)
f.close()
print(‘数据文件合并完成!’)
csv_list=glob.glob(‘…/input/covid19temp/2020/*’)
for i in csv_list:
fr=open(i,‘rb’).read()
with open(‘2020csvdata2.csv’,‘ab’) as f:
f.write(fr)
f.close()
print(‘数据文件合并完成!’)
csv_list=glob.glob(‘…/input/covid19temp/2020/*’)
csvdatadf=pd.DataFrame()
for i in csv_list:
csvdata=pd.read_csv(i)
csvdatadf=csvdatadf.append(csvdata)
print(‘数据文件合并完成!’)
合并之后使用pd.read_csv读取文件数据,一共有20W+的疫情数据记录:
=============================================================================
import os
import pandas as pd
import glob
import openpyxl
import numpy as np
path=‘…/input/covid19temp’ # 写的路径
csv_lists=[] # 该列表的作用
是否更新目录判断:
if os.path.isdir(path): #使用os.path.isdir判断path是否是路径
if not path.endswith(“/”):# 如果该路径的最后没有加上’/'的话,会帮忙加一个/
path+=“/”
print(path)
如上图所示,路径后面多了一个 ‘/’
,否则路径会找不到
文件操作:
-
os.listdir():
列出路径下所有的文件 -
os.path.join():
连接文件的作用 -
os.path.isdir():
判断是否是文件夹
import os
import pandas as pd
import glob
import openpyxl
import numpy as np
path=‘…/input/covid19temp’ # 写的路径
csv_lists=[] # 该列表的作用
是否更新目录判断:
if os.path.isdir(path): #使用os.path.isdir判断path是否是路径
if not path.endswith(“/”):# 如果该路径的最后没有加上’/'的话,会帮忙加一个/
path+=“/”
print(path)
for each in os.listdir(path):# os.listdir(): 列出路径下所有的文件
print(each)
import os
import pandas as pd
import glob
import openpyxl
import numpy as np
path=‘…/input/covid19temp’ # 写的路径
csv_lists=[] # 该列表的作用
是否更新目录判断:
if os.path.isdir(path): #使用os.path.isdir判断path是否是路径
if not path.endswith(“/”):# 如果该路径的最后没有加上’/'的话,会帮忙加一个/
path+=“/”
print(path)
for each in os.listdir(path):# os.listdir(): 列出路径下所有的文件
print(each)
sub_path=path+each
path_list=[]
if os.path.isdir(sub_path):
path_list.append(sub_path)
csv_lists.append(path_list) # 生成主目录下路径列表(非文件)
根据路径进行路径下文件列表的生成
csvlists=[]
for i in range(len(csv_lists)):
print(i)
csvlists.append(glob.glob(csv_lists[i][0]+‘/*.csv’))
csvlists
获取每年的文件路径
csvfilelist=[]
for j in range(len(csvlists)):
for k in csvlists[j]:
csvfilelist.append(k)
csvfilelist
csvdatadf=pd.DataFrame()
for m in csvfilelist:
filesize=os.path.getsize(m)
if filesize>0:
csvdata=pd.read_csv(m)
csvdatadf=csvdatadf.append(csvdata)
else:
continue
print(‘数据合并完成’)
============================================================================
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
mg-blog.csdnimg.cn/img_convert/6c361282296f86381401c05e862fe4e9.png)
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)


GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)