我的编程空间,编程开发者的网络收藏夹
学习永远不晚

服务器上运行跑深度学习代码(一)

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

服务器上运行跑深度学习代码(一)

文章目录

重现论文里的代码

我准备复现的是Point2roof的代码。这是第一次复现论文代码,所以记录一下^ _ ^。

从GitHub找到他的项目point2roof项目
先把工程down下来 ^ _ ^ 。
看他工程里面提供的README。
在这里插入图片描述
这篇里面提到他的数据集,我也顺便下载下来了。目前只是想跑一下代码,好像没必要下载数据集?
接下来按照他说的安装环境。
在这里插入图片描述
我这里是先从网上把PyTorch下载到本地,然后通过WinSCP拖到实验室的服务器里面。WinSCP使用过程就不介绍了。

主要是下载时要注意服务器里面的python的版本。
服务器里面已经安装了CUDA驱动和 Anaconda ,我们几个共用一个账号,前面的兄弟已经装起来了,所以我直接用现成的。
他记录的配置环境的博客Linux服务器上配置论文代码环境。


先看服务器上的python版本。
在这里插入图片描述
乌龙了!我之前服务器没没进去,查看的时本地的python版本,所以下载的时3.9版本的。(T_T)。
在这里插入图片描述

PyTorch下载的时候要看CUDA的版本和自己python的版本。

查看CUDA版本命令如下:
在这里插入图片描述

对了CUDA是使用GPU的时候选的版本,如果时使用CPU的话,选CPU的版本就好。下载地址PyTorch下载地址
感觉python版本是不是可以根据

更新服务器python版本

搞错了,这里应该先用conda创建虚拟环境,之后再安装更新python。

conda 创建虚拟环境
在这里插入图片描述
先查看一下已经创建的虚拟环境。

conda 创建虚拟环境的命令为:conda create -n your_env_name python=3.9
在这里就可以选择python的版本。

在这里插入图片描述

删除配置的虚拟环境:conda env remove --name your_env_name

删除前面测试时配置的虚拟环境pointnet

在这里插入图片描述
现在激活我们创建的point2roof虚拟环境。conda activate your_env_name
推出命令是:conda deactivate
在这里插入图片描述

现在开始安装PyTorch (灬ºωº灬)
在这里插入图片描述
先进入自己下载的安装包的路径下。然后使用pip install torch-1.9.1+cu102-cp39-cp39-linux_x86_64.whl 开始安装

安装完成进入python验证一下。
在这里插入图片描述
安装成功。

按照README提示的命令运行一下。
在这里插入图片描述
然后到有test.py 的路劲下命令行输入:python test.py
按照提示缺什么包就安装什么包。
需要注意的是
安装 yaml这个库pip 里要加py前缀
安装sklearn时使用的时scikit-learn这个包。

在这里插入图片描述
在这里插入图片描述

——>遇到找不到路径的问题时,按照提示修改路劲。

程序提示torch 找不到CUDA!!!

我在外面检查torch时显示找到了CUDA,但是程序开始跑的时候,就找不到CUDA!!!
在这里插入图片描述
看了这篇No CUDA GPUs are available问题解决我在最前面加了

print(torch.cuda.is_available())

在这里插入图片描述

不在报这个错误了!!

文件中路径的选择

看清楚服务器中当前程序运行时的路径是什么!!!
我的是在这里
在这里插入图片描述

完整的路径应该是“/home/c1316/hqq/point2roof/Point2Roof-master/model_cfg.yaml”
要看vscode打开的路劲,而不是test.py文件所在路径

(感觉理解有点问题!!!!)

test.txt中的路径修改为如下
在这里插入图片描述

batch size 的设置与程序的运行有关系?

原始程序batch size设置为1.我运行,就会莫名奇妙奔溃,有时会如下错误报错
在这里插入图片描述
报错如下:
在这里插入图片描述
看这篇<测试模型时RuntimeError: >说调整batch size 大小就可以改善。我设置为20 有时能跑,有时又跑不起来,始终跑不完.如下:
在这里插入图片描述
运行到这就奔溃了!!!T_T
值调整为40 程序能跑完,但是结果不太正确!
在这里插入图片描述
边缘精度为nan.
不知道哪里出错了!!

但是这个环境应该是可以了吧!
(batch size 不会影响影响程序的,如果过大会导致资源不够会溢出,过小应该不会又问题!!!)
后面针对这个问题在找一下具体原因。- _ -!!!

来源地址:https://blog.csdn.net/qq_35021992/article/details/129404925

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

服务器上运行跑深度学习代码(一)

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

云服务器一直运行python代码

打开控制面板:在控制面板中,打开“管理工具”选项。选择“服务”:在服务列表中,找到“AmazonS3”服务。停止该服务:单击“停止”按钮,然后选择“已禁用”选项。重启服务器:选择“服务”选项卡,然后单击“启动”按钮。如果您无法立即停止云服务器,则可以按照以下步骤操作:在服务列表中,找到“AmazonS3”服务。停止该
2023-10-27

如何在阿里云服务器上运行代码

阿里云服务器租用是云计算技术的重要组成部分,它提供了虚拟化的计算资源,可以满足企业和个人的各种计算需求。在阿里云服务器上运行代码是一种常见的操作,它可以快速开发和部署应用程序,提高工作效率。在阿里云服务器上运行代码的步骤如下:创建阿里云服务器:首先,你需要在阿里云官网上创建一个阿里云服务器。在创建服务器时,你需要选择合
如何在阿里云服务器上运行代码
2023-11-02

使用PyCharm在Github上保存代码并在服务器上运行方式

本指南详细介绍了如何使用PyCharm将代码保存到GitHub并将其部署到服务器:保存代码到GitHub创建GitHub仓库初始化本地仓库将文件添加到暂存区提交并推送更改在服务器上运行代码在服务器上设置Git仓库克隆GitHub仓库安装依赖项创建运行环境运行代码PyCharm集成集成GitHub用于简化代码保存提供部署配置,用于在服务器上运行代码其他考虑因素确保服务器权限使用日志监控代码运行定期更新服务器代码考虑使用CI/CD工具自动化流程
使用PyCharm在Github上保存代码并在服务器上运行方式
2024-04-02

编程热搜

目录