您当前的位置：首页 > IT编程 > python
\| C语言 \| Java \| VB \| VC \| python \| Android \| TensorFlow \| C++ \| oracle \| 学术与代码 \| cnn卷积神经网络 \| gnn \| 图像修复 \| Keras \| 数据集 \| Neo4j \| 自然语言处理 \| 深度学习 \| 医学CAD \| 医学影像 \| 超参数 \| pointnet \| pytorch \| 异常检测 \| Transformers \| 情感分类 \| 知识图谱 \|

自学教程：解决Pytorch中的神坑:关于model.eval的问题

51自学网 2021-10-30 22:39:21

这篇教程解决Pytorch中的神坑:关于model.eval的问题写得很实用，希望能帮到您。

有时候使用Pytorch训练完模型，在测试数据上面得到的结果令人大跌眼镜。

这个时候需要检查一下定义的Model类中有没有 BN 或 Dropout 层，如果有任何一个存在

那么在测试之前需要加入一行代码：

#model是实例化的模型对象model = model.eval()

表示将模型转变为evaluation（测试）模式，这样就可以排除BN和Dropout对测试的干扰。

对于BN，训练时通常采用mini-batch，所以每一批中的mean和std大致是相同的；而测试阶段往往是单个图像的输入，不存在mini-batch的概念。所以将model改为eval模式后，BN的参数固定，并采用之前训练好的全局的mean和std；

对于Dropout，训练阶段，隐含层神经元先乘概率P，再进行激活；而测试阶段，神经元先激活，每个隐含层神经元的输出再乘概率P。

如下图所示：

补充：pytorch中model.eval之后是否还需要model.train的问题

正确的写法是

在这里插入图片描述

for循环之后再开启train，

循环之后的评估model.eval之后就会再次回到model.train

以上为个人经验，希望能给大家一个参考，也希望大家多多支持51zixue.net。