runtask#
命令#
runtask - 在一组主机上启动远程并行作业子任务
概要#
runtask [-x] [-n] [-u 主机列表文件 |-z 主机名… | 主机名] 命令 [命令参数…]
runtask[-h | -V]
描述#
许多并行应用程序(包括 MPI 实现)都使用 无密码 SSH 作为启动机制。runtask 命令 提供了一种替代 SSH 的透明方法,用于在 AIP 中启动并行应用程序,如MPI、多机AI模型训练、多机推理任务等。
runtask 支持命令行类似 SSH:ssh 主机名 命令 …
所有其他 SSH 选项均不支持。
runtask 透明地直接连接到远程主机上的 CBEXE, 然后创建并跟踪远程任务,并将连接返回到 AIP。runtask 会监控和收集完整的作业进程资源使用情况, 可以通过 cjobs -l 查看。
runtask 仅在 AIP 下工作。它只能用于在作业分配的远程主机上启动任务。它不能用作独立命令,也不能在不属于作业主机分配的主机上运行任务。
选项#
- -n
标准输入来自 /dev/null。
- -u 主机列表文件
在 主机列表文件 中列出的所有主机上执行任务。
指定包含主机名列表的文件的路径。每个主机名必须在主机列表文件中单独一行列出。
此选项与 -z 选项互斥。
- 主机名
远程任务启动的主机名。
- -x
此选项仅用于 SSH 兼容性,不影响 runtask 功能。
- -z “主机名 …”
在所有指定的主机(多个主机名以空格隔开)上执行任务。
指定要执行任务的主机列表。如果指定了多个主机名,则必须用引号掩码(“或’”)括起来,并用空格分隔。
此选项与 -u 选项互斥。
- 命令 [命令参数…]
指定要执行的命令。这必须是命令行中的最后一个参数。
- -h
将命令用法打印到标准错误输出并退出。
- -V
将产品发行版本打印到标准错误输出并退出。
环境变量#
一下环境变量影响远程任务运行:
- CB_TASK_DOCKER_IMAGE
指定用于在 Docker 容器内运行任务的 Docker 镜像名称。默认情况下,此变量未设置,任务将在不使用 Docker 的主机上运行。示例: “CB_TASK_DOCKER_IMAGE=centos:7”。
- CB_TASK_DOCKER_CONTAINER
该任务在现有的 Docker 容器内运行。此变量指示正在运行的 Docker 容器 ID。
- CB_TASK_DOCKER_OPTIONS
在 Docker 容器中运行任务时,指定其他 docker 命令选项。此变量是可选的。例如: “CB_TASK_DOCKER_OPTIONS=’–mount type=bind,source=/share/apps,target=/share/apps’”。
- CB_TASK_DOCKER_ENVS
在“name=value”格式中指定空格分隔的字符串作为 Docker 容器任务的环境变量。例如: “CB_TASK_DOCKER_ENVS=’class=4 type=ty’”。