AIStation 人工智能开发平台,面向深度学习开发场景,整合计算资源、数据资源以及AI开发环境,实现计算资源统一分配调度、训练数据集中管理并加速、模型流程化开发训练,为AI 研发构建敏捷高效的一体化平台。支持具有资源池化特性的GP
产品功能
训练数据管理
- 统一管理个人数据及开发数据集,支持数据共享协同
- 对接企业数据存储系统,支持NFS、HDFS、BeeGFS等文件系统
- 支持文件上传、下载、压缩、解压、新建和删除等
- 支持用户访问及下载权限设置,保证数据安全可靠
AI计算资源集中管理调度
- GPU服务器及GPU卡池化管理,使用状态一览展示
- GPU资源使用情况实时统计分析
- 开发用户按需申请资源、动态分配
- GPU多维细粒度调度
- 智能化资源调度策略
GPU性能监控
- AI服务器性能及状态监控,CPU利用率、MEM利用率、网络IO、IB流量、磁盘分区、节点负载
- GPU性能监控,GPU利用率、显存利用率、时钟频率、功耗、温度、
- 存储系统及磁盘分区使用监控,各用户存储使用量监控
AI计算资源运维管理
- 实时统计用户组/用户资源使用
- 实时查看计算节点资源占用情况
- 管理员控制各用户资源使用配额
- 管理员快速清理回收资源,再分配
交互式模型开发训练过程
- 集成主流AI开发框架
- 打通数据集、计算资源、框架工具
- 提供丰富完整的AI开发工具链
- 对接pycharm、vscode等IDE工具
分布式训练任务编排
- 不同深度学习框架模板,通过模板快速提交训练任务
- 多机分布式任务跨节点自动分配计算资源,自动编排计算进程
- 按需申请计算资源的CPU核数和GPU卡数内存和训练集等
- 提供CLI方式任务提交及管
Copyright © 2019-2024 青岛希诺智能科技有限公司版权所有 备案号:鲁ICP备19042003号-1
技术支持:微动力网络