常见问题
Q:登录服务器时,输入密码时终端无反应。
A:这是正常现象,请正常输入你的密码然后按下[Enter]登录即可。
Q:如何在服务器和本地计算机之间传输文件?
A:可以使用 scp 或 WinScp 等工具。了解更多>>
Q:在服务器运行编译好的 C 程序或者 MEX 文件时,会报告‘GLIBC version 2.14 not found’的错误。
A:请将源码在服务器上重新编译一遍,因为不同环境下编译出来的二进制可执行文件的运行条件是不同的。
Q:提交任务时,任务显示在‘PD’(Pending)状态,但是有空闲的计算资源存在。
A:每个用户提交的任务的数量和占用的核数有一定限制,请使用 squeue 查看任务
无法运行的原因。
Q:我如何才能保存计算过程中控制台中输出的结果?
A:请使用输出重定向符号‘>’。例如将程序 text 的控制台输出重定向到文件 ‘out.txt’ 中
如果使用 matslm.rb 提交任务,则只需要指定 -o 选项即可。
Q:集群的联网情况如何?
A:集群的所有机器中,只有管理节点 admin 可以直接访问互联网,其余的计算节点需要通过 admin 进行互联网的访问。
管理节点访问网络的范围仅限于免费地址,能够访问国内绝大多数网址,不能访问某些国际网址(例如 github.com )。
由于我们的 IP 是固定的,因此无法在服务器上连接个人的北大网关。请大家尽量不要运行需要网络连接的任务。
Q:为什么我在自己的机器上无法登录账号,启动 SSH 连接时显示超时。但是使用别的机器就可以登录?
A:为了服务器的安全,当同一个设备连续登录失败 2 次以上时,该设备的 IP 将会被封禁 24 小时,无法从
此 IP 地址登录。遇到这种情况请及时联系管理员解封。另外,配置 SSH 无密码登录是一个好习惯。
Q:我可以在服务器上安装服务器上没有的软件吗?
A:可以。需注意的是,绝大多数软件的安装不需要管理员(root)权限,为此,你可能无法像使用你的个人计算机那样
使用 apt/yum 进行软件的安装。
软件安装完毕后,需要根据软件配置自己的环境变量。自行安装的软件无法被别的用户使用。
Q:如何将自己的作业提交到指定的机器上(例如 comput1)?
A:在申请任务所需资源时使用 #SBATCH --nodelist=comput1 即可,其中 comput1
为计算节点的主机名。如果对应主机正忙仍然需要排队。
Q:为何在运行任务的时候有时会提示内存不足或显示程序‘‘已杀死(Killed)’’?
A:作业调度系统为作业分配的内存和 SLURM 脚本中申请的单节点 CPU 核心数成正比,
如果内存不够请适当增加 --cpus-per-task 或 --tasks-per-node 参数。
Q:用 conda 或 pip 下载 python 包很慢怎么办?
A:请使用清华镜像源。具体方式请到这里查看。
|