crestart#
命令#
crestart - 重启检查点作业
概要#
crestart[csub 选项] [-f] checkpoint_dir[job_ID | “job_ID[index]”]
crestart [-h | -V]
选项列表#
-B
-f
-N
-x
-b 开始时间
-C core限制
-c [小时:]分[/主机名 |/主机模型]
-D 数据限制
-E “预执行命令[参数…]“
-F 文件限制
-m “主机名[+[优先级]] |主机组[+[优先级]] …“
-G 用户组
-M 内存限制
-q “队列名称…“
-S 堆栈限制
-t 终端时间
-w ‘依赖表达式‘
-W 运行时限[/主机名|/主机型号]| checkpoint_dir[job_ID |“job_ID[index]”]
[-h | -V]
描述#
使用保存在 checkpoint_dir/last_job_ID/ 中的检查点文件重新启动已进行检查点处理的作业。只有已成功进行检查点处理的作业才能重新启动。
作业将重新提交并分配新的作业 ID。检查点目录将使用新的作业 ID 重命名,即 checkpoint_dir/new_job_ID/.。
默认情况下,作业将使用与原始作业相同的输出文件和文件传输规范、作业名称、窗口信号值、检查点目录和周期以及重新运行选项重新启动。
要在另一台主机上重新启动作业,两台主机必须二进制兼容、运行相同的操作系统版本、有权访问可执行文件、有权访问所有打开的文件(AIP 必须使用绝对路径名定位它们)以及有权访问检查点目录。
作业重新启动时,环境变量 CB_RESTART 设置为 Y。
AIP 调用 CB_SERVERDIR (/opt/skyformai/sbin) 中的 erestart 可执行文件来执行重新启动。
只有此处列出的 csub 选项可以与 crestart 一起使用。
选项#
只有上面选项列表中列出的 csub 选项可以用于 crestart。除以下选项外,有关 crestart 选项的说明,请参阅 csub 。
- -f
即使存在不可重启的条件(这些条件特定于操作系统),也强制重启作业。
另请参阅#
csub 、 cjobs 、 cmod 、 cqueues 、 cchkpnt 、 echkpnt 、 erestart 。
限制#
在内核级检查点中,您无法使用 crestart 更改核心限制、CPU 限制、堆栈限制或内存限制的值。