Pytorch报错解决——(亲测有效)RuntimeError: Distributed package doesn‘t have NCCL built in
短信预约 -IT技能 免费直播动态提醒
在我跑SLADD模型的时候,出现了如下报错:
上网搜寻一番后,发现了解决方法
第一步:在本文件的开头机上这样两行代码:
import osos.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"
第二步:在本文件代码中找到这样一部分代码:
把dist.init_process_group(backend='nccl', init_method='env://', world_size=args.world_size, rank=rank)
这一行中的nccl换成gloo
若要解释原因就是windows系统不支持NCCL,只能换用GLOO
亲测这个报错就没了,然而接下来还有好多别的报错…我继续去解决了,解决完再分享别的~
来源地址:https://blog.csdn.net/m0_61787307/article/details/129638108
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341