crestart#

命令#

crestart - 重启检查点作业

概要#

crestart[csub 选项] [-f] checkpoint_dir[job_ID | job_ID[index]”]

crestart [-h | -V]

选项列表#

-B
-f
-N
-x
-b 开始时间
-C core限制
-c [小时:][/主机名 |/主机模型]
-D 数据限制
-E “预执行命令[参数…]
-F 文件限制
-m 主机名[+[优先级]] |主机组[+[优先级]] …
-G 用户组
-M 内存限制
-q 队列名称
-S 堆栈限制
-t 终端时间
-w 依赖表达式
-W 运行时限[/主机名|/主机型号]| checkpoint_dir[job_ID |job_ID[index]”]
[-h | -V]

描述#

使用保存在 checkpoint_dir/last_job_ID/ 中的检查点文件重新启动已进行检查点处理的作业。只有已成功进行检查点处理的作业才能重新启动。

作业将重新提交并分配新的作业 ID。检查点目录将使用新的作业 ID 重命名,即 checkpoint_dir/new_job_ID/.

默认情况下,作业将使用与原始作业相同的输出文件和文件传输规范、作业名称、窗口信号值、检查点目录和周期以及重新运行选项重新启动。

要在另一台主机上重新启动作业,两台主机必须二进制兼容、运行相同的操作系统版本、有权访问可执行文件、有权访问所有打开的文件(AIP 必须使用绝对路径名定位它们)以及有权访问检查点目录。

作业重新启动时,环境变量 CB_RESTART 设置为 Y。

AIP 调用 CB_SERVERDIR (/opt/skyformai/sbin) 中的 erestart 可执行文件来执行重新启动。

只有此处列出的 csub 选项可以与 crestart 一起使用。

选项#

只有上面选项列表中列出的 csub 选项可以用于 crestart。除以下选项外,有关 crestart 选项的说明,请参阅 csub

-f

即使存在不可重启的条件(这些条件特定于操作系统),也强制重启作业。

另请参阅#

csubcjobscmodcqueuescchkpntechkpnterestart

限制#

在内核级检查点中,您无法使用 crestart 更改核心限制、CPU 限制、堆栈限制或内存限制的值。