crestart¶
命令¶
crestart - 重启检查点作业
概要¶
crestart[csub 选项] [-f] checkpoint_dir[job_ID | “job_ID[index]”]
crestart [-h | -V]
选项列表¶
描述¶
使用保存在 checkpoint_dir/last_job_ID/ 中的检查点文件重新启动已进行检查点处理的作业。只有已成功进行检查点处理的作业才能重新启动。
作业将重新提交并分配新的作业 ID。检查点目录将使用新的作业 ID 重命名,即 checkpoint_dir/new_job_ID/.。
默认情况下,作业将使用与原始作业相同的输出文件和文件传输规范、作业名称、窗口信号值、检查点目录和周期以及重新运行选项重新启动。
要在另一台主机上重新启动作业,两台主机必须二进制兼容、运行相同的操作系统版本、有权访问可执行文件、有权访问所有打开的文件(AIP 必须使用绝对路径名定位它们)以及有权访问检查点目录。
作业重新启动时,环境变量 CB_RESTART 设置为 Y。
AIP 调用 CB_SERVERDIR (/opt/skyformai/sbin) 中的 erestart 可执行文件来执行重新启动。
只有此处列出的 csub 选项可以与 crestart 一起使用。
选项¶
只有上面选项列表中列出的 csub 选项可以用于 crestart。除以下选项外,有关 crestart 选项的说明,请参阅 csub 。
- -f
即使存在不可重启的条件(这些条件特定于操作系统),也强制重启作业。
另请参阅¶
csub 、 cjobs 、 cmod 、 cqueues 、 cchkpnt 、 echkpnt 、 erestart 。
限制¶
在内核级检查点中,您无法使用 crestart 更改核心限制、CPU 限制、堆栈限制或内存限制的值。