机器学习入门--循环神经网络原理与实践

该文章介绍了如何使用Python代码实现一个简单的循环神经网络（RNN）模型来预测波士顿房价，并可视化训练过程中损失的变化。在代码中，首先加载并标准化了数据集，然后定义了一个包含RNN层和全连接层的SimpleRNN模型进行训练，最后使用matplotlib库可视化损失曲线并对新数据进行预测。这篇文章提供了一个实现RNN模型的示例，并通过可视化损失曲线来帮助读者更好地理解模型性能。

waiting for future

1177人浏览 · 2024-02-15 16:58:33

waiting for future · 2024-02-15 16:58:33 发布

循环神经网络

循环神经网络（RNN）是一种在序列数据上表现出色的人工神经网络。相比于传统前馈神经网络，RNN更加适合处理时间序列数据，如音频信号、自然语言和股票价格等。本文将介绍RNN的基本数学原理、使用PyTorch和Scikit-Learn数据集实现的代码。

数学原理

RNN是一种带有循环结构的神经网络，其在处理序列数据时将前一次的输出作为当前输入的一部分。这使得RNN能够记住先前的状态和信息，并且在处理长期依赖关系时表现出色。

RNN的基本公式可以表示为：

$h_t = f(W_{hh}h_{t-1} + W_{xh}x_t)$

其中 $h_t$ 是RNN在时间步 $t$ 的隐藏状态， $f$ 是激活函数， $W_{hh}$ 是隐藏状态的权重矩阵， $h_{t-1}$ 是上一次的隐藏状态， $W_{xh}$ 是输入 $x_t$ 和隐藏状态 $h_t$ 之间的权重矩阵， $x_t$ 是时间步 $t$ 的输入。

在RNN的训练过程中，我们需要使用反向传播算法计算梯度并更新权重。由于RNN具有时间上的依赖关系，每一步的梯度都取决于前一步的梯度，这意味着我们需要使用反向传播算法的变体——反向传播通过时间（BPTT）算法来计算梯度。

代码实现

我们将使用PyTorch和Scikit-Learn数据集实现一个简单的RNN模型，用于预测时间序列数据。以下是代码：

import torch
import torch.nn as nn
import torch.optim as optim
from sklearn.datasets import load_boston
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

# 加载数据集
data = load_boston()
X = data.data
y = data.target

# 数据标准化
scaler = StandardScaler()
X = scaler.fit_transform(X)
y = y.reshape(-1, 1)

# 转换为PyTorch张量，并增加时间步维度
X = torch.tensor(X, dtype=torch.float32).unsqueeze(1)
y = torch.tensor(y, dtype=torch.float32)

# 定义RNN模型
class SimpleRNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleRNN, self).__init__()
        self.hidden_size = hidden_size
        self.rnn = nn.RNN(input_size, hidden_size, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        out, _ = self.rnn(x)
        out = self.fc(out[:, -1, :])
        return out

# 创建模型实例
input_size = X.shape[2]  # 更新input_size的值
hidden_size = 32
output_size = 1
model = SimpleRNN(input_size, hidden_size, output_size)

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 启用异常检测
torch.autograd.set_detect_anomaly(True)

# 训练模型
num_epochs = 10000
# 记录损失
loss_list = []

for epoch in range(num_epochs):
    optimizer.zero_grad()
    outputs = model(X)
    loss = criterion(outputs, y)
    loss.backward()
    optimizer.step()
    if (epoch+1) % 100 == 0:
        loss_list.append(loss.item())
        print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item()}')

# 关闭异常检测
torch.autograd.set_detect_anomaly(False)

# 可视化损失曲线
plt.plot(range(100), loss_list)
plt.xlabel('num_epochs')
plt.ylabel('loss of RNN Training')
plt.show()
plt.savefig('Loss_of_RNN_Training.png')

# 预测新数据
new_data_point = X[0].reshape(1, 1, -1)  # 假设使用第一个数据点进行预测
prediction = model(new_data_point)
print(f'Predicted value: {prediction.item()}')

上述代码实现了一个简单的循环神经网络（RNN）模型来预测波士顿房价，并可视化训练过程中损失的变化。代码首先加载并标准化了波士顿房价数据集，然后定义了一个包含RNN层和全连接层的SimpleRNN模型，并使用均方误差作为损失函数和Adam优化器进行训练。训练完成后，使用matplotlib库绘制训练过程中损失的变化曲线（如下图所示）。最后，使用训练好的模型对新的数据点进行预测，并输出预测值。这段代码可以为初学者提供一个实现RNN模型的参考，并通过可视化训练过程中的损失曲线来帮助理解模型的性能。
RNN 损失曲线

总结

本文介绍了RNN的基本数学原理、使用PyTorch和Scikit-Learn数据集实现的代码，以及如何解读代码并总结。RNN是一种在序列数据上表现出色的神经网络，常用于处理时间序列数据，如音频信号、自然语言和股票价格等。我们可以使用PyTorch和Scikit-Learn数据集来实现一个简单的RNN模型，并用它来预测未知的时间序列数据。

天启AI社区

GitCode 天启AI是一款由 GitCode 团队打造的智能助手，基于先进的LLM（大语言模型）与多智能体 Agent 技术构建，致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话，还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力，真正做到“一句话，让 Al帮你完成复杂任务”。

更多推荐