升级AIP#

同版本更新#

若版本不变,更新SkyForm AIP的代码只需停掉各主机上的AIP服务,更新AIP文件,然后重启AIP服务。更新不会影响正在运行或等待的作业。

  1. 更新AIP文件:

    install –shared=top_share_dir –localtop=local_top_dir

    install脚本不会清除或修改已有配置文件和作业数据

    例子:

    ./install --shared=/share/skyformai_shared --localtop=/opt/skyformai
    

    小技巧

    install脚本的所有选项参考 install

  2. 在master上重启所有主机上的AIP服务:

    aip admin rs all # 重启所有主机上的AIP daemon
    aip admin rcs    # 重启调度器
    

    警告

    升级过程中不要用Linux服务控制对AIP服务进行操作systemctl start|stop|restart aip,否则正在运行的作业会退出。

版本间升级#

升级SkyForm AIP的升级只需更新AIP文件,然后重新运行host-setup脚本,升级不会影响正在运行或等待的作业。

  1. 更新AIP文件:

    install –shared=top_share_dir –localtop=local_top_dir

    install脚本不会清除或修改已有配置文件和作业数据

    小技巧

    install脚本的所有选项参考 install

  2. 在集群的每台主机上运行host-setup:

    ./host-setup –shared=top_share_dir –distro={new_version} –upgrade

    例子:

    ./host-setup --shared=/share/skyformai_shared --distro=10.25.0 --upgrade
    

    若有hosts文件,其中每行列出集群里的hostname,则可用以下的脚本在每个主机上自动运行host-setup:

    #!/bin/bash
    for host in \`cat hosts \| awk '{print $2}'\`; do
        ssh $host ./host-setup --shared=/share/skyformai_shared --distro=10.24.0 --upgrade
    done
    

    警告

    升级使用host-setup必须定义–-upgrade参数,否则正在运行的作业会退出。

    小技巧

    host-setup脚本的所有选项参考 host-setup

  3. 在master上重启所有主机上的AIP服务和调度器:

    aip admin rs all    # 重启所有主机上的AIP daemon
    aip admin rcs       # 重启调度器
    

    警告

    升级过程中不要用Linux服务控制对AIP服务进行操作systemctl start|stop|restart aip,否则正在运行的作业会退出。

Web门户代码版本升级#

SkyForm AIP的web门户代码包的安装脚本为portal-install。升级代码只需在解压新版的AIP包后,以root在解压包的目录里运行命令:

./portal-install