Logo SkyForm AIP

目录

  • 概览
  • 管理
  • 使用
  • 组件
  • 参考
  • 软件许可
  • 产品常见问题

目录

  • 概览
    • 简介
    • SkyForm算力调度系统(AIP)快速安装指南
  • 管理
    • 集群和节点环境准备
    • 安装AIP
    • 安装登录节点和Web门户
    • 升级AIP
    • 配置
    • 调度器动态配置参数
    • 资源管理
    • 队列
    • 集群管理员命令
    • 安装共享数据分析和机器学习工具
    • 基于License的调度
    • 监控仪表盘
    • 配置Web门户
    • Web门户应用集成
    • TCP/IP代理服务aipproxy
    • 节电调度插件
    • 大机群或者高通量负载集群操作系统调参
    • 故障处理
  • 使用
    • 作业定义和管理
    • 机器学习和数学分析作业
    • GPU作业
    • NVIDIA多实例GPU调度
    • MPI作业
    • Docker容器作业
    • Singularity/Apptainer容器作业
    • 使用Jupyter Lab
    • 使用VSCodes
    • 使用RStudio
    • 使用Nextflow
    • Cron作业
  • 组件
    • VNC和SSH访问门户
    • SkyForm AIP的REST API服务
    • AIP监控数据分析系统
    • AIP DNS
  • 参考
    • 命令
    • 配置文件
    • 服务进程
  • 软件许可
    • 天云融创软件许可
    • 第三方软件许可
  • 产品常见问题
    • 什么是算力调度系统,它为什么重要
    • SkyForm算力调度系统有哪些特色,提供哪些价值
    • SkyForm算力调度系统是怎样收费的
    • 对于AI模型训练,调度系统提供哪些功能
    • 对于推理服务,调度系统提供哪些功能
    • 对于AI应用开发,调度系统提供哪些功能
    • 系统支持哪些类型的CPU
    • 系统支持哪些类型的GPU或加速芯片
    • SkyForm算力调度系统可以在不用虚拟机的场景中支持vGPU吗
    • 系统怎样实现任务间的资源隔离
    • 系统支持哪些容器类型
    • 系统支持哪些操作系统
    • 系统支持哪些MPI框架
    • 系统支持哪些AI框架和大语言模型
    • 如果算力节点出现故障,任务怎样恢复
    • 调度系统有节能的功能吗
    • 调度系统支持哪些接口

管理#

  • 集群和节点环境准备
  • 安装AIP
  • 安装登录节点和Web门户
  • 升级AIP
  • 配置
  • 调度器动态配置参数
  • 资源管理
  • 队列
  • 集群管理员命令
  • 安装共享数据分析和机器学习工具
  • 基于License的调度
  • 监控仪表盘
  • 配置Web门户
  • Web门户应用集成
  • TCP/IP代理服务aipproxy
  • 节电调度插件
  • 大机群或者高通量负载集群操作系统调参
  • 故障处理
  • SkyForm算力调度系统(AIP)快速安装指南
  • 集群和节点环境准备
© 版权所有 2025, 天云融创软件.
由 Sphinx 5.0.0创建。