Python中torch.load()加载模型以及其map_location参数详解
参考
TORCH.LOAD
torch.load()
函数格式为:torch.load(f, map_location=None, pickle_module=pickle, **pickle_load_args)
,一般我们使用的时候,基本只使用前两个参数。
模型的保存
模型保存有两种形式,一种是保存模型的state_dict()
,只是保存模型的参数。那么加载时需要先创建一个模型的实例model
,之后通过torch.load()
将保存的模型参数加载进来,得到dict
,再通过model.load_state_dict(dict)
将模型的参数更新。
另一种是将整个模型保存下来,之后加载的时候只需要通过torch.load()
将模型加载,即可返回一个加载好的模型。
具体可参考:PyTorch模型的保存与加载。
模型加载中的map_location参数
具体来说,map_location
参数是用于重定向,比如此前模型的参数是在cpu
中的,我们希望将其加载到cuda:0
中。或者我们有多张卡,那么我们就可以将卡1中训练好的模型加载到卡2中,这在数据并行的分布式深度学习中可能会用到。
首先定义一个AlexNet,并使用cuda:0
将其训练了一个猫狗分类,之后把模型存储起来。
map_location=None
我们先把state_dict
加载进来。
model_path = "./cuda_model.pth"
model = torch.load(model_path)
print(next(model.parameters()).device)
结果为:
cuda:0
因为保存的时候就是模型就是cuda:0
的,所以加载进来也是。
map_location=torch.device()
model_path = "./cuda_model.pth"
model = torch.load(model_path, map_location=torch.device('cpu'))
print(next(model.parameters()).device)
结果为:
cpu
模型从cuda:0
变成了cpu
。
map_location={xx:xx}
model_path = "./cuda_model.pth"
model = torch.load(model_path, map_location={'cuda:0':'cuda:1'})
print(next(model.parameters()).device)
结果为:
cuda:1
模型从cuda:0
变成了cuda:1
。
model_path = "./cuda_model.pth"
model = torch.load(model_path, map_location={'cuda:2':'cpu'})
print(next(model.parameters()).device)
结果为:
cuda:0
模型还是cuda:0
,并没有变成cpu
。因为这个map_location
的映射是不对的,原始的模型就是cuda:0
,而映射是cuda:2
到cpu
,是不对的。这种情况下,map_location
返回None
,也就是和不加map_location
相同。
总结
到此这篇关于Python中torch.load()加载模型以及其map_location参数详解的文章就介绍到这了,更多相关torch.load()加载模型map_location参数内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341