升级AIP#
同版本更新#
若版本不变,更新SkyForm AIP的代码只需停掉各主机上的AIP服务,更新AIP文件,然后重启AIP服务。更新不会影响正在运行或等待的作业。
更新AIP文件:
install –shared=top_share_dir –localtop=local_top_dir
install脚本不会清除或修改已有配置文件和作业数据
例子:
./install --shared=/share/skyformai_shared --localtop=/opt/skyformai
小技巧
install脚本的所有选项参考 install
在master上重启所有主机上的AIP服务:
aip admin rs all # 重启所有主机上的AIP daemon aip admin rcs # 重启调度器
警告
升级过程中不要用Linux服务控制对AIP服务进行操作systemctl start|stop|restart aip,否则正在运行的作业会退出。
版本间升级#
升级SkyForm AIP的升级只需更新AIP文件,然后重新运行host-setup脚本,升级不会影响正在运行或等待的作业。
更新AIP文件:
install –shared=top_share_dir –localtop=local_top_dir
install脚本不会清除或修改已有配置文件和作业数据
小技巧
install脚本的所有选项参考 install
在集群的每台主机上运行host-setup:
./host-setup –shared=top_share_dir –distro={new_version} –upgrade
例子:
./host-setup --shared=/share/skyformai_shared --distro=10.25.0 --upgrade
若有hosts文件,其中每行列出集群里的hostname,则可用以下的脚本在每个主机上自动运行host-setup:
#!/bin/bash for host in \`cat hosts \| awk '{print $2}'\`; do ssh $host ./host-setup --shared=/share/skyformai_shared --distro=10.24.0 --upgrade done
警告
升级使用host-setup必须定义–-upgrade参数,否则正在运行的作业会退出。
小技巧
host-setup脚本的所有选项参考 host-setup
在master上重启所有主机上的AIP服务和调度器:
aip admin rs all # 重启所有主机上的AIP daemon aip admin rcs # 重启调度器
警告
升级过程中不要用Linux服务控制对AIP服务进行操作systemctl start|stop|restart aip,否则正在运行的作业会退出。
Web门户代码版本升级#
SkyForm AIP的web门户代码包的安装脚本为portal-install。升级代码只需在解压新版的AIP包后,以root在解压包的目录里运行命令:
./portal-install