在爬虫进行文件保存的时候发现 文件名字如果包含一下的字符

\:*?"<>|/

那么会提示你这个文件无法保存

那么我们需要对爬取下来的信息进行一定的更改调整。

为了批量使用replace,我使用for循环的方式解决这个问题。

 

(在例子中我选择将出现的这些字符用 空格 的方式代替)

sample = '我正在<新闻爬取>,这是|例子|,你以为呢贺贺贺?'    

char = '\:*?"<>|/'

for flag in char:
        sample = sample.replace(flag, " ")

结果是

sample:我正在 新闻爬取 ,这是 例子 ,你以为呢贺贺贺

 

希望这个帖子可以帮助到你^_^

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐