这篇教程pytorch中的matmul与mm,bmm区别说明写得很实用,希望能帮到您。 pytorch中matmul和mm和bmm区别 matmulmmbmm结论 先看下官网上对这三个函数的介绍。 matmul
mm
bmm顾名思义, 就是两个batch矩阵乘法. 
结论从官方文档可以看出 1、mm只能进行矩阵乘法,也就是输入的两个tensor维度只能是( n × m ) (n/times m)(n×m)和( m × p ) (m/times p)(m×p) 2、bmm是两个三维张量相乘, 两个输入tensor维度是( b × n × m ) (b/times n/times m)(b×n×m)和( b × m × p ) (b/times m/times p)(b×m×p), 第一维b代表batch size,输出为( b × n × p ) (b/times n /times p)(b×n×p) 3、matmul可以进行张量乘法, 输入可以是高维. 补充:torch中的几种乘法。torch.mm, torch.mul, torch.matmul 一、点乘点乘都是broadcast的,可以用torch.mul(a, b)实现,也可以直接用*实现。 >>> a = torch.ones(3,4)>>> atensor([[1., 1., 1., 1.], [1., 1., 1., 1.], [1., 1., 1., 1.]])>>> b = torch.Tensor([1,2,3]).reshape((3,1))>>> btensor([[1.], [2.], [3.]])>>> torch.mul(a, b)tensor([[1., 1., 1., 1.], [2., 2., 2., 2.], [3., 3., 3., 3.]]) 当a, b维度不一致时,会自动填充到相同维度相点乘。 二、矩阵乘矩阵相乘有torch.mm和torch.matmul两个函数。其中前一个是针对二维矩阵,后一个是高维。当torch.mm用于大于二维时将报错。 >>> a = torch.ones(3,4)>>> b = torch.ones(4,2)>>> torch.mm(a, b)tensor([[4., 4.], [4., 4.], [4., 4.]]) >>> a = torch.ones(3,4)>>> b = torch.ones(5,4,2)>>> torch.matmul(a, b).shapetorch.Size([5, 3, 2]) >>> a = torch.ones(5,4,2)>>> b = torch.ones(5,2,3)>>> torch.matmul(a, b).shapetorch.Size([5, 4, 3]) >>> a = torch.ones(5,4,2)>>> b = torch.ones(5,2,3)>>> torch.matmul(b, a).shape报错。 以上为个人经验,希望能给大家一个参考,也希望大家多多支持51zixue.net。如有错误或未考虑完全的地方,望不吝赐教。 pytorch-autograde-计算图的特点说明 解决Numpy与Pytorch彼此转换时的坑 |