cb.conf

配置文件

cb.conf

概述

SkyForm AIP 命令配置参数。

描述

cb.conf里配置用户命令所设的缺省环境变量。这些变量影响AIP命令的输出。

位置

cb.conf 的位置为 $CB_ENVDIR(/opt/skyformai/etc)。

格式

cb.conf 中的每个条目都采用bash设置环境变量的格式:

NAME=VALUE

每个 NAME 后面必须跟等号 =

等号 = 后面必须有值

变量(NAME)、=、值(VALUE)之间不能有空格。

以井号 (#) 开头的行是注释,会被忽略。

参数

CB_AUTH_NTRIES

语法CB_AUTH_NTRIES=次数

说明:当csub/bsub命令命令本地主机资源不足(如打开过多的文件句柄、内存不足、过多进程等),导致本地用户认证失败重试的次数,每1秒重试一次。

默认值:5次

CB_EXE_PORT

语法CB_EXE_PORT=端口号

说明:指定cbexe使用的端口。

默认值:16323

CB_JM_PORT

语法CB_JM_PORT=端口号

说明:指定cbjm使用的端口。

默认值:16325

CB_LIMIT_VIEW

语法CB_LIMIT_VIEW=任意值

说明:指定用户运行chosts和cqueues命令时,只显示用户可用的队列名和主机名。

默认值:没有定义。用户运行chosts时显示集群中的所有主机。用户运行cqueues时,如果cb.yaml中user_view_alljobs: yes, 则显示集群中所有队列,如果cb.yaml中user_view_alljobs: no或未定义,则显示用户可用的队列。

CB_LOG_MASK

语法CB_LOG_MASK=LOG_DEBUG | LOG_INFO | LOG_WARNING | LOG_ERR

说明:指定AIP服务日志的级别。

默认值:LOG_INFO。

CB_LS_PORT

语法CB_LS_PORT=端口号

说明:指定cbls使用的端口。

默认值:16322

CB_NORESREQ_CHECK

语法CB_NORESREQ_CHECK=任意值

说明:csub命令不检查-R资源参数的合法性,若不合法,作业会永久等待。

默认值:无,csub命令调用chinfo命令检查-R资源参数的合法性。

警告

由于csub默认会运行chinfo命令从cbls获得集群主机配置,在负载高的环境中可能会引起master cbls的高负载。建议设置该参数关闭语法检查。

CB_NTRIES

语法CB_NTRIES=次数

说明:当AIP命令连接不上调度器时(网络堵塞、本地主机资源不足,或者调度器服务异常等原因)重试的次数,每10秒重试一次。

默认值:无限

CB_SCHED_PORT

语法CB_SCHED_PORT=端口号

说明:指定cbsched使用的端口。

默认值:16324

CB_SERVER_HOSTS

语法CB_SERVER_HOSTS=host1 host2 …

说明:AIP客户端命令通过这些主机获取master主机名。AIP客户端命令需要知道哪台主机是master,以便提交作业或查询信息,命令通过这个参数中定义的主机获取master主机的信息。

默认值:cb.yaml中hosts的前3台主机

CB_SERVICE_PORT

语法CB_SERVICE_PORT=端口号

说明:指定jservice使用的端口。

默认值:16329

CB_SHORT_HOSTLIST

语法CB_SHORT_HOSTLIST=1|0

说明:当取值为1时,显示并行作业中 cjobs 和 chist 的主机列表(简化版),其中多个作业作业槽分配在同一主机上。多个作业槽的显示格式为:作业槽数*主机名

例如,如果一个并行作业在hosta 上分配了 5 个作业槽,则信息显示如下:

5*hosta

当取值为0时,cjobs和chosts的输出中,每个作业单独列出主机名。

默认值:1。

SCHED_MAX_JOBS_SCHED

语法SCHED_MAX_JOBS_SCHED=数值

说明:指定调度器每次调度最多等待作业数。等待按作业提交时间排序,越早提交的作业排越前面。

默认值:100000(十万)

排错

这个文件只影响用户命令,与AIP服务无关。修改后无需重启任何AIP服务。

用户可以在自己的环境中用环境变量覆盖这两个参数的值。