PyTorch实现神经网络房价预测模型

言曌 2024年04月20日22:50:45 0 1834 views

博主分享免费Java教学视频，B站账号：Java刘哥，长期提供技术问题解决、项目定制：本站商品点此

原理就是，已经有了506条样本数据，其中13列是房子的特征数据，1列是房价数据。

取496条作为训练数据，10条最后测试验证。

根据496条数据，训练一个模型，输入13个特征，能返回一个预测房价pred。

然后将pred和我们真实的价格比较，计算误差。不断更新权重，训练一万次，每次打印误差。

一、模型定义、训练、保存等功能

demo_reg.py

import torch

# 1、初始化数据 data
import numpy as np
import re

ff = open("housing.data").readlines()
data = []
print(ff)
for item in ff:
    out = re.sub(r"\s{2,}", " ", item).strip()  # 将多个空格替换为一个空格
    data.append(out.split(" "))

data = np.array(data).astype(np.float32)
print(data)
print(data.shape)  # (506, 14)

# 所有数据
Y = data[:, -1]  # 取最后一列，为标签(房价)
X = data[:, 0:-1]  # 取前面所有列，为特征
# 训练数据
X_train = X[0: 496, ...]  # 取前496个样本, ... 表示取所有维度
Y_train = Y[0: 496, ...]
# 测试数据
X_test = X[496:, ...]  # 取后10个样本
Y_test = Y[496:, ...]


# print(X_train.shape)  # (496, 13) 表示 496行13列的 2维矩阵
# print(Y_train.shape)  # (496,) 表示 496行1列的 1维向量
# print(Y_test.shape)  # (10,) 表示 10行1列的 1维向量
# print(Y_test.shape)  # (10,) 表示 10行1列的 1维向量
# 注意：
# (1,1) 表示 1行1列的 2维矩阵
# (1,) 表示 1行1列的 1维向量

# 2、定义一个神经网络 net
class Net(torch.nn.Module):
    def __init__(self, n_feature, n_output):
        # 构造方法有2个参数，n_feature是输入特征数，n_output是输出特征数
        super(Net, self).__init__()
        self.hidden = torch.nn.Linear(n_feature, 100)
        self.predict = torch.nn.Linear(100, n_output)

    def forward(self, x):
        out = self.hidden(x)
        out = torch.relu(out)
        out = self.predict(out)
        return out


net = Net(13, 1)  # 输入特征数是13，输出特征数是1

# 3、定义损失函数 loss
loss_func = torch.nn.MSELoss()  # 均方误差

# 4、定义优化器 optimizer
# optimizer = torch.optim.SGD(net.parameters(), lr=0.01)  # 随机梯度下降
# optimizer = torch.optim.SGD(net.parameters(), lr=0.0001)  # 随机梯度下降
optimizer = torch.optim.Adam(net.parameters(), lr=0.01)  # 随机梯度下降

# 4、训练数据 training
for i in range(10000):
    # train
    x_data = torch.tensor(X_train, dtype=torch.float32)  # 将numpy数组转换为tensor, x_data是二维矩阵，496行13列
    y_data = torch.tensor(Y_train, dtype=torch.float32)  # y_data是一维向量，496行1列
    pred = net.forward(x_data)  # 前向传播,计算预测值
    pred = torch.squeeze(pred)  # 二维降为一维，去掉维度为1的维度，[496,1] 变成 [496,] 之所以要维度压缩，是因为计算损失时，要求两个维度一致
    loss_train = loss_func(pred, y_data) * 0.001  # 计算损失
    # print(pred.shape)
    # print(y_data.shape)
    optimizer.zero_grad()  # 梯度清零
    loss_train.backward()  # 反向传播
    optimizer.step()  # 更新参数
    print("ite:{}, loss_train:{}".format(i, loss_train.item()))

    # # test
    # x_data = torch.tensor(X_test, dtype=torch.float32)
    # y_data = torch.tensor(Y_test, dtype=torch.float32)
    # pred = net.forward(x_data)
    # pred = torch.squeeze(pred)
    # loss_test = loss_func(pred, y_data) * 0.001
    # print("ite:{}, loss_test:{}".format(i, loss_test.item()))

# 5、保存模型
torch.save(net, "model/model.pkl")  # 保存整个模型
# torch.save(net.state_dict(), "model/model_params.pkl")  # 只保存模型参数

二、模型加载、测试

demo_reg_inference.py

import torch

# 1、初始化数据 data
import numpy as np
import re

ff = open("housing.data").readlines()
data = []
print(ff)
for item in ff:
    out = re.sub(r"\s{2,}", " ", item).strip()  # 将多个空格替换为一个空格
    data.append(out.split(" "))

data = np.array(data).astype(np.float32)
# print(data)
# print(data.shape)  # (506, 14)

# 所有数据
Y = data[:, -1]  # 取最后一列，为标签(房价)
X = data[:, 0:-1]  # 取前面所有列，为特征
# 训练数据
X_train = X[0: 496, ...]  # 取前496个样本, ... 表示取所有维度
Y_train = Y[0: 496, ...]
# 测试数据
X_test = X[496:, ...]  # 取后10个样本
Y_test = Y[496:, ...]


# 2、定义一个神经网络 net
class Net(torch.nn.Module):
    def __init__(self, n_feature, n_output):
        # 构造方法有2个参数，n_feature是输入特征数，n_output是输出特征数
        super(Net, self).__init__()
        self.hidden = torch.nn.Linear(n_feature, 100)
        self.predict = torch.nn.Linear(100, n_output)

    def forward(self, x):
        out = self.hidden(x)
        out = torch.relu(out)
        out = self.predict(out)
        return out

# 3、加载已经训练好的模型
net = torch.load("model/model.pkl")

# 4、定义损失函数 loss
loss_func = torch.nn.MSELoss()

# 5、进行测试
x_data = torch.tensor(X_test, dtype=torch.float32)
y_data = torch.tensor(Y_test, dtype=torch.float32)
pred = net.forward(x_data)
pred = torch.squeeze(pred)
loss_test = loss_func(pred, y_data) * 0.001 # 求误差，乘以0.001是为了将loss放大，方便查看
print("loss_test:{}".format(loss_test.item()))

参考资料：https://coding.imooc.com/class/chapter/440.html

数据文件：链接：https://pan.baidu.com/s/1kZ36rkhfeTXqf9lGB-3cuw?pwd=4rt0

提取码：4rt0

历史上的今天

四月

20日

微信
交流学习，资料分享

个人淘宝
店铺名：言昭博客咨询部
(部分商品未及时上架淘宝)

言昭博客

PyTorch实现神经网络房价预测模型

一、模型定义、训练、保存等功能

二、模型加载、测试

历史上的今天

发表评论取消回复

微信

在线咨询

一、模型定义、训练、保存等功能

二、模型加载、测试

历史上的今天

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

发表评论 取消回复

微信

在线咨询

发表评论取消回复