您当前的位置:首页 > IT编程 > python
| C语言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 学术与代码 | cnn卷积神经网络 | gnn | 图像修复 | Keras | 数据集 | Neo4j | 自然语言处理 | 深度学习 | 医学CAD | 医学影像 | 超参数 | pointnet | pytorch | 异常检测 | Transformers | 情感分类 | 知识图谱 |

自学教程:Pytorch 如何查看、释放已关闭程序占用的GPU资源

51自学网 2021-10-30 22:39:39
  python
这篇教程Pytorch 如何查看、释放已关闭程序占用的GPU资源写得很实用,希望能帮到您。

看代码吧~

import torch print(torch.cuda.current_device())print(torch.cuda.device_count())print(torch.cuda.get_device_name())print(torch.cuda.is_available())

打开terminal输入nvidia-smi可以看到当前各个显卡及用户使用状况,如下图所示,使用kill -9 pid(需替换成具体的编号)即可杀掉占用资源的程序,杀完后结果如下图所示,可以发现再也没有对应自己的程序了!

补充一下师弟帮忙的记录截图,方便以后查询使用:

补充:如何处理Pytorch使用GPU后仍有GPU资源未释放的情况

使用PyTorch设置多线程(threads)进行数据读取(DataLoader),其实是假的多线程,他是开了N个子进程(PID都连着)进行模拟多线程工作,所以你的程序跑完或者中途kill掉主进程的话,子进程的GPU显存并不会被释放,需要手动一个一个kill才行

具体方法描述如下:

1.先关闭ssh(或者shell)窗口,退出重新登录

2.查看运行在gpu上的所有程序:

fuser -v /dev/nvidia*

3.kill掉所有(连号的)僵尸进程

以上为个人经验,希望能给大家一个参考,也希望大家多多支持51zixue.net。


pytorch 如何查看数据类型和大小
解决pytorch下只打印tensor的数值不打印出device等信息的问题
万事OK自学网:51自学网_软件自学网_CAD自学网自学excel、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。