runtask#

命令#

runtask - 在一组主机上启动远程并行作业子任务

概要#

runtask [-x] [-n] [-u 主机列表文件 |-z 主机名… | 主机名] 命令 [命令参数…]

runtask[-h | -V]

描述#

许多并行应用程序(包括 MPI 实现)都使用 无密码 SSH 作为启动机制。runtask 命令 提供了一种替代 SSH 的透明方法,用于在 AIP 中启动并行应用程序,如MPI、多机AI模型训练、多机推理任务等。

runtask 支持命令行类似 SSH:ssh 主机名 命令

所有其他 SSH 选项均不支持。

runtask 透明地直接连接到远程主机上的 CBEXE, 然后创建并跟踪远程任务,并将连接返回到 AIP。runtask 会监控和收集完整的作业进程资源使用情况, 可以通过 cjobs -l 查看。

runtask 仅在 AIP 下工作。它只能用于在作业分配的远程主机上启动任务。它不能用作独立命令,也不能在不属于作业主机分配的主机上运行任务。

选项#

-n

标准输入来自 /dev/null。

-u 主机列表文件

主机列表文件 中列出的所有主机上执行任务。

指定包含主机名列表的文件的路径。每个主机名必须在主机列表文件中单独一行列出。

此选项与 -z 选项互斥。

主机名

远程任务启动的主机名。

-x

此选项仅用于 SSH 兼容性,不影响 runtask 功能。

-z主机名 …

在所有指定的主机(多个主机名以空格隔开)上执行任务。

指定要执行任务的主机列表。如果指定了多个主机名,则必须用引号掩码(“或’”)括起来,并用空格分隔。

此选项与 -u 选项互斥。

命令 [命令参数…]

指定要执行的命令。这必须是命令行中的最后一个参数。

-h

将命令用法打印到标准错误输出并退出。

-V

将产品发行版本打印到标准错误输出并退出。

环境变量#

一下环境变量影响远程任务运行:

CB_TASK_DOCKER_IMAGE

指定用于在 Docker 容器内运行任务的 Docker 镜像名称。默认情况下,此变量未设置,任务将在不使用 Docker 的主机上运行。示例: “CB_TASK_DOCKER_IMAGE=centos:7”。

CB_TASK_DOCKER_CONTAINER

该任务在现有的 Docker 容器内运行。此变量指示正在运行的 Docker 容器 ID。

CB_TASK_DOCKER_OPTIONS

在 Docker 容器中运行任务时,指定其他 docker 命令选项。此变量是可选的。例如: “CB_TASK_DOCKER_OPTIONS=’–mount type=bind,source=/share/apps,target=/share/apps’”。

CB_TASK_DOCKER_ENVS

在“name=value”格式中指定空格分隔的字符串作为 Docker 容器任务的环境变量。例如: “CB_TASK_DOCKER_ENVS=’class=4 type=ty’”。