1. 简介 > 
  2. Kubflow > 
  3. kubeflow

kubeflow

本项目使用kubeflow做分布式深度学习训练,可自行参考kubeflow文档。

  • PyTorch Training (PyTorchJob)

这里有一个完整的 pytorch ddp 使用 kubeflow 的例子 pytorch-ddp-example

Relearn
  • Home

  • Kubflow
    • kubeflow
  • 基础知识
    • 概念介绍
  • 管理员手册
    • Kubernetes 介绍
    • Kubernetes 存储
      • Nfs Provider
      • Longhorn 分布式存储
      • Rook 部署 ceph 集群
    • 部署 jupyterhub
    • Kubespray 部署 K8s
    • Kubernetes 节点 GPU 支持
    • Kubernetes 问题排查
    • Kubernetes Monitoring
    • Containerd 镜像配置
  • Jupyterhub 用户手册
    • Jupyterhub 用户手册
    • 自定义镜像
    • Argocd 发布应用
    • 镜像中心使用教程

  •  
  •  
  •  

Built with by Hugo