K8S项目实践(12): GPU共享方案Time Slicing
本文主要分享 GPU 共享方案,包括如何安装、配置以及使用,最后通过分析源码了 TimeSlicing 的具体实现。通过配置 TimeSlicing 可以实现 Pod 共享一块物理 GPU(使用GRID GP
本文主要分享 GPU 共享方案,包括如何安装、配置以及使用,最后通过分析源码了 TimeSlicing 的具体实现。通过配置 TimeSlicing 可以实现 Pod 共享一块物理 GPU(使用GRID GP
本文主要分析了在 K8s 中创建一个 Pod 并申请 GPU 资源,最终该 Pod 时怎么能够使用 GPU 的,具体的实现原理,以及 device plugin、nvidia-container
本文主要分析 k8s 中的 device-plugin 机制工作原理,并通过实现一个简单的 device-plugin 来加深理解。 1. 背景 默认情况下,k8s 中的 Pod 只能申请 CPU 和 Memory 这两种资源,就像下面这样: resources:
1. 引言 为了学习AI应用、算法与算力等技术,应用需跑在GPU卡上,需要在节点上安装 GPU Driver、Container Toolkit 等组件,当集群规模较大时
1. 引言 本文主要分享在不同环境,例如ECS、Docker 和 Kubernetes 等环境中如何使用 GPU。 注:由于没有物理机裸机,在阿里云上申请ECS也可满足学习使
1. 规划 使用 kubeadm 安装 Kubernetes 集群并使用 containerd 作为容器运行时(container runtime)是一种常见的安装方法。 OS 配置 用途 备注 aliOS(172.17.197.69) 2核(vCPU) 4GiB 5 Mbps
简介 chatgpt在2022年开始爆发,随着越来越多的人在使用,于是也打算尝试安装使用。 chatgpt ChatGPT是一种基于人工智能技术的聊天机器人,
简介 Webhook就是一种HTTP回调,用于在某种情况下执行某些动作,Webhook不是K8S独有的,很多场景下都可以进行Webhook,比
简介 NFS(Network File System,网络文件系统)是当前主流异构平台共享文件系统之一。主要应用在UNIX环境下。最早是由Sun Micr
简介 外部存储接入 Kubernetes 的方式主要有两种:In-Tree 和 Out-of-Tree。其中 In-Tree 是指存储驱动的源码都在 Kubernetes 代码库中,与 Kubernetes 一起发布、迭代、管理