Python在数据科学中拥有十分重要的地位,numpy, scipy, pandas, scikit-learn这些高效易用、接口统一的科学计算包使其在数据分析处理过程更加方便快捷,其强大的数据可视化工具也是重要组成部分。在Python中,使用的最多的数据可视化工具是matplotlib。以绘制散点图为例,一起来学习matplotlib吧。

import numpy as np  #pip install numpy
import matplotlib.pyplot as plt  #pip install matplotlib

绘制散点图

height = [161,179,184,175,170,160]
weight = [50,58,85,70,66,40]
plt.scatter(height,weight)
plt.show()

#不相关

N = 5000
x = np.random.randn(N)
y1 = np.random.randn(N)
plt.scatter(x,y1)
plt.show()

正相关

N = 2000
x = np.random.randn(N)
y2 = x + np.random.randn(N) * 0.5
plt.scatter(x,y2)
plt.show()

负相关

N = 2000
x = np.random.randn(N)
y2 = -x + np.random.randn(N) * 0.5
plt.scatter(x,y2)
plt.show()

导入文件(.csv)数据

open,close = np.loadtxt('data.csv',delimiter=',',skiprows=1,usecols=(1,4),unpack=True)
#skiprows=1:指跳过第一行   usecols=[1,4]:是指只使用1,4两列,参数类型为list
change = close - open
yesterday = change[:-1]
today = change[1:]
# s 面积 c颜色 marker 形状 alpha  透明度
plt.scatter(yesterday,today,s=10,c='r',marker='<',alpha=0.8)
plt.show()

在这里插入图片描述

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐