cload#

命令#

cload - 显示主机的负载信息

概要#

cload [-l] [-w] [-N | -E] [-o格式”] [-Iload_index[:load_index] ] [-n 主机数] [-S] [-R 资源需求] 主机名 … …

cload -s [资源名 …]

cload [-h | -V]

描述#

显示主机的负载信息。负载信息可以 按主机或按资源显示。

默认情况下,显示本地集群中所有主机的负载信息(按主机排序)。

默认情况下,显示原始负载指标。

默认情况下,资源的负载信息根据 CPU 和分页负载显示。

选项#

-l

长格式。显示不带截断的负载信息,以及 I/O 和外部负载指标的附加字段。

此选项将覆盖使用 -I 选项指定的指标名称。

-w

以宽格式显示负载信息。字段显示不带截断。

-N

显示规范化的 CPU 运行队列长度负载指标。规范化的 CPU 运行队列长度负载是把从操作系统 获得的指标除以CPU因子。

-E

显示有效的 CPU 运行队列长度负载指标。选项 -N 和-E 互斥。有效的 CPU 运行队列长度负载指标 是把从操作系统获得的指标除以CPU核数(物理核或者逻辑核,取决于 cb.yaml 里定义的 define_ncpus参数)。

-I load_index[:load_index] …

仅显示指定负载索引的负载信息。负载索引名称必须用冒号分隔(例如,r1m:pg:ut)。

-n主机数

仅显示请求数量的主机的负载信息。最多显示 主机数 个最符合资源要求的主机的信息。

-o字段 … [delimiter=分隔符’]”

通过字段名称指定自定义输出格式。使用 delimiter= 来设置显示在不同标题和 字段之间的分隔符。分隔符必须是单个字符。默认情况下,分隔符为空格。

如果字段没有值,则输出为短划线 (-)。

可用的字段名称包括:

host_name:主机名

status:状态。参见输出

r15s:”r15s” 的负载。参见输出

r1m:”r1m” 的负载。参见输出

r15m:”r15m” 的负载。参见输出

ut:”ut” 的负载。参见输出

io:”io” 的负载。参见输出

tmp:”tmp” 的负载。参见输出

mem:”mem” 的负载。参见输出

swp:“swp”的负载。参见输出

pg:“pg”的负载。参见输出

up:“up”的负载。参见输出

-R资源需求

仅显示满足指定资源要求的主机的负载信息。有关内置资源名称列表,请参阅 cinfo

主机的负载信息根据指定资源的负载排序。

如果 资源需求 包含特殊资源名称,则仅显示提供这些资源的主机的负载信息(请参阅 chinfo 以了解每个主机上可用的资源)。

如果指定了一个或多个主机名,则仅显示满足资源要求的主机的负载信息。

-S

显示“正常”主机数量和“不可用”主机数量的摘要。

主机名

仅显示指定主机的负载信息。

主机名也可以采用 xxxx[001-100] 的格式指定。

-s [资源名 …]

显示集群中配置的所有动态共享资源的信息。

如果指定了资源,则仅显示指定资源的信息。资源名 必须是动态共享资源名称。

-h

将命令用法打印到 stderr 并退出。

-V

将 AIP 发行版本打印到 stderr 并退出。

输出#

基于主机的输出(默认输出)#

显示数值型动态非共享资源。res_req 的选择和排序部分控制显示哪些主机信息以及如何排序。

显示的默认负载信息包含以下字段:

HOST_NAME

AIP 使用的标准主机名。

Status

主机状态。状态前面可能出现减号 (-),表示主机上的 AIP 远程执行服务器 (CBEXE) 未运行。

可能的状态包括:

ok

主机处于正常状态,可以接受远程作业。

lockU

主机已被 AIP 管理员或 root 锁定。

unavail

主机已关闭电源或 AIP 的CBLS未正常运行。

负载指标值

内置负载指标包括 r15s、r1m、r15m、ut、pg、io、up、it、 swp、mem 和 tmp(见下文)。外部负载指标由 RESS 配置(参见 ress )。

r15s

15 秒指数平均 CPU 运行队列长度。

r1m

1 分钟指数平均 CPU 运行队列长度。

r15m

15 分钟指数平均 CPU 运行队列长度。

ut

过去一分钟内 CPU 利用率的指数平均值,单位是百分数(%),介于 0 到 100 之间。

pg

过去一分钟内内存分页速率的指数平均值,以每秒页数为单位。

io

过去一分钟内网络 I/O 速率的指数平均值,以每秒 KB 为单位(仅当指定 -l 选项时可用)。

up

主机正常运行时间uptime(分钟)。

it

在 Linux 系统中,主机的空闲时间(所有登录会话中未触摸键盘的时间),以分钟为单位。

swp

可用的交换空间大小。

mem

可用内存大小。

tmp

/tmp 中的可用空间大小。

external_index

任何站点配置的全局外部负载索引(请参阅 ress )。 仅当使用 -l 选项或带有索引名称的 -I 选项时可用。

备注

external_index 不应包含共享资源。

基于资源的输出 (cload -s )#

显示有关动态共享资源的信息。每行提供资源实例的值及其关联的主机。有关配置动态共享资源的信息,请参阅 ress(8) 和 cb.yaml(5)。

显示的信息包含以下字段:

RESOURCE

资源名称。

VALUE

资源实例的值。

LOCATION

与资源实例关联的主机。

示例#

% cload -R “select[r1m<=0.5 && swp>=20 && type==ALPHA]”

或者,使用受限格式:

%cload -R r1m=0.5:swp=20:type=ALPHA

显示交换空间至少为 20 MB,且 1 分钟运行队列长度小于 0.5 MB 的 ALPHA 主机的负载。

% cload -R “select[(1-swp/maxswp)<0.75] order[pg]”

显示交换空间利用率低于 75% 的主机的负载。结果主机按分页率排序。

%cload -I r1m:ut:io:pg

显示集群中所有主机的 1 分钟 CPU 原始运行队列长度、CPU 利用率、磁盘 I/O 和分页率。

%cload -E

显示所有主机的负载,按 r15s:pg, 排序,其中 CPU 运行队列长度为有效运行队列长度。

%cload -s verilog_license

显示所有 verilog_license 动态共享资源实例的值和位置。

诊断#

如果检测到 AIP 问题或指定了无效的资源名称,则退出状态为 -10。

如果指定了无效参数,则退出状态为 -1,否则 cload 返回 0。