文件
cb.acct - AIP 的批处理作业会计文件
版本:10.25.0
描述
AIP 调度程序 CBSCHED 会为每个作业的完成或失败生成一条记录。该记录会附加到作业日志文件 cb.acct 中。该文件位于 CB_SHAREDIR/data 目录下,其中 CB_SHAREDIR 一般是/opt/skyformai/work/data。作业日志文件是一个 ASCII 文件,每行一条记录。记录的各个字段以空格分隔。如果某个字段的值不可用,则记录字符串为“”,记录时间和数字为 0,记录资源使用情况为 -1。
cb.acct文件为当前月份中的作业记录。cb.data.1为上个月的作业记录,cb.data.2为上上的月的记录,以此类推。缺省情况下,cb.data文件可以有无数个。总个数由cb.yaml配置文件中的max_cbacct_num参数决定。
字段
每个作业记录的字段按以下顺序排列:
事件类型(%s)
始终为“ JFIN ”
版本号(%s)
日志文件格式的版本号,如10250。
记录时间 (%d)
记录事件的时间(Linux时间戳)
作业号 (%d)
作业号ID
用户 ID (%d)
提交者的 Linux 用户 ID
选项(%d)
作业处理的位标志(内部使用)
处理器数量(%d)
最初请求执行的处理器数量
提交时间 (%d)
作业提交时间
开始时间 (%d)
作业开始时间 - 工作应在此时间或之后开始运行
结束时间 (%d)
作业终止期限 - 工作应在此时间终止
开始运行时间 (%d) -
作业调度时间 - 作业调度执行的时间
用户名 (%s)
提交者的用户名
队列(%s)
提交作业的作业队列的名称
作业资源需求(%s)
用户提交作业时指定的资源需求
依赖条件(%s)
用户提交作业时指定的作业依赖条件
预执行命令(%s)
用户指定的预执行命令(pre_exec)
来自主机(%s)
提交主机名
cwd (%s)
当前工作目录
输入文件 (%s)
标准输入文件名
输出文件(%s)
标准输出文件名
错误文件(%s)
标准错误输出文件名
作业文件(%s)
作业脚本文件名。这是AIP为作业生成的内部使用的作业启动脚本
请求主机数量 (%d)
限制作业调度的主机名数量
请求主机名(%s)
作业调度受限的主机名列表(每个主机名占 %s);如果最后一个字段值为 0,则为空白。如果有多个主机名,则每个附加主机名将在其自己的字段中返回
作业运行作业槽数量 (%d)
用于执行的作业槽数量
运行作业槽主机名(%s)
运行作业槽所在的主机名列表(每个主机名占 %s);如果上一个字段值为 0,则为空白
jStatus (%d)
作业状态。数字 32 表示EXIT,64 表示DONE
主机CPU因子 (%f)
第一个执行主机的CPU因子
作业名 (%s)
作业名称
命令(%s)
完成用户指定的作业命令
cbRusage
以下字段包含作业的资源使用情况信息。如果某些字段的值不可用(由于作业中止或操作系统差异),则会记录 -1。时间以秒为单位,大小以 KB 为单位。
ru_utime (%f)
用户使用CPU时间
ru_stime (%f)
所用系统CPU时间
ru_maxrss (%d)
最大共享文本大小
ru_ixrss (%d)
共享文本大小随时间变化的积分(以千字节秒为单位)
ru_ismrss (%d)
共享内存大小随时间变化的积分(仅在 Ultrix 上有效)
ru_idrss (%d)
未共享数据大小随时间变化的积分
ru_isrss (%d)
非共享堆栈大小随时间变化的积分
ru_minflt (%d)
页面回收次数
ru_magflt (%d)
缺页次数
ru_nswap (%d)
进程被换出的次数
ru_inblock (%d)
块输入操作数
ru_oublock (%d)
块输出操作数
ru_ioch (%d)
读取和写入的字符数(仅在 HP-UX 上有效)
ru_msgsnd (%d)
已发送的 System V IPC 消息数
ru_msgrcv (%d)
收到的消息数量
ru_nsignals(%d)
接收信号数量
ru_nvcsw (%d)
自愿上下文切换次数
ru_nivcsw (%d)
非自愿上下文切换次数
ru_exutime (%d)
用户使用的准确时间(Linux上无效)
邮件用户(%s)
收到工作相关邮件的用户的姓名
项目名称(%s)
项目名称
退出状态(%d)
Linux作业的退出吗
最大处理器数量 (%d)
为作业指定的最大处理器数量
登录shell(%s)
用于工作的登录shell
idx(%d)
作业阵列索引
最大RMem(%d)
作业中所有进程的最大驻留内存使用量(以 KB 为单位)
最大RSwap (%d)
作业中所有进程的最大虚拟内存使用量(以 KB 为单位)
inFileSpool(%s)
假脱机输入文件
命令池(%s)
假脱机命令文件
运行时间(%d)
作业运行时间(以秒为单位)。运行时间是作业结束时间和开始时间之间的时长减去作业暂停的时间。
平均内存 (%d)
作业运行期间的平均内存使用量(以千字节为单位)。
运行时间限制(%d)
作业运行限制(以秒为单位)。
作业描述 (%s)
提交作业时指定的作业描述。如果使用命令“aip j r”提交作业,则作业描述为 JSON 格式的作业规范。
任务数量(%d)
通过 runtask 启动的作业的远程任务数(runtask,rsh,blaunch的任务数)。
任务信息
远程任务信息(如果 numTasks > 0)。
应用名(%s)
在作业提交中通过 -A 或 -app 选项指定的应用程序名称。
资源分配(%s)
调度程序以 JSON 格式分配作业资源。
ugroup(%s)
该作业所属的用户组。
gpu_reserved(%d)
作业保留的 GPU 数量。
最大 ngpus (%d)
作业使用的最大 GPU 数量。
req_memmb (%d)
作业请求的或队列中配置的内存量(以 MB 为单位)。
组合请求 (%s)
作业的综合资源需求,合并资源需求。