KServe一个健壮且可扩展的云原生模型服务器
如果你熟悉Kubeflow,你会知道KFServing是平台的模型服务器和推理引擎。去年9月,KFServing项目进行了转型,变成了KServe。
除了名字的改变,KServe现在是一个独立的组件,从Kubeflow项目中毕业。这种分离允许KServe开发成一个独立的、云原生的推理引擎,并将其部署为独立的模型服务器。当然,它将继续与Kubeflow紧密集成,但它们将被视为独立的开源项目并进行维护。
KServe由Google、IBM、彭博、Nvidia和Seldon开发,是Kubernetes的开源云原生模型服务器。最新的0.8版本侧重于将模型服务器转换成一个独立的组件,并更改了分类和命名。
先来了解一下KServe的核心功能。
服务器用于机器学习模型,就像应用程序用于编写二进制代码一样。两者都为部署提供了运行时和执行上下文。作为模型服务器,KServer为机器学习和大规模学习模型提供了基础。
KServe可以部署为传统的Kubernetes部署或支持零扩展的无服务器部署。对于无服务器,它利用了面向无服务器的K原生服务的优点,并具有自动伸缩的功能。Istio被用作向API消费者公开服务端点的门户。Istio和Knative服务的组合支持令人兴奋的场景,例如模型的蓝/绿和淡黄色部署。
Kserve架构图
RawDeployment模式允许您在不使用Knative服务的情况下使用KServe。它支持传统的缩放技术,如水平pod自动缩放(HPA),但不支持缩放到零。
KServe架构
KServe模型服务器有一个控制平面和一个数据平面。控制平面管理并协调负责推理的客户资源。在无服务器模式下,它管理与已知资源协调的自动扩展。
KServe控制平面的核心是KServe控制器,负责管理推理服务的生命周期。它负责创建服务、门户资源、模型服务器容器、模型代理容器、记录请求/响应、批处理以及从模型存储中提取模型。模型存储是在模型服务器上注册的模型的存储库。它通常是一种对象存储服务,如亚马逊S3、谷歌云存储、Azure Storage或MinIO。
数据平面管理特定模型的请求/响应周期。它有一个预测器、转换器和解释器组件。
AI应用程序向预测器端点发送REST或gRPC请求。预测器充当调用转换器组件的推理管道,转换器组件可以预处理入站数据(请求)和后处理出站数据(响应)。或者,可能有一个解释器组件,它将AI解释能力带到托管模型中。KServe鼓励使用可互操作和可扩展的V2协议。
数据平面也有端点来检查模型的就绪性和健康状况。它还公开了用于检索模型元数据的API。
支持的框架和运行时
KServe支持广泛的机器学习和深度学习框架。深度学习框架和运行时与现有的服务基础设施(如TensorFlow Serving、TorchServe和Triton Reasoning Server)一起工作。KServe可以通过Triton托管TensorFlow、ONNX、PyTorch和TensorRT运行时。
XGBoost、Spark MLLib和LightGBM KServe基于SKLearn的经典机器学习模型依赖于Seldon的MLServer。
KServe的可扩展框架使它能够插入任何符合V2推理协议的运行时。
使用模型网格的多模式服务
KServe为每个推理部署一个模型,将平台的可伸缩性限制在可用的CPU和GPU上。当推理在GPU这种昂贵而稀缺的计算资源上运行时,这种局限性就变得很明显。
通过多模式服务,可以克服基础设施的限制:3354个计算资源,最大pod,最大IP地址。
由IBM开发的Meshserving是一个基于Kubernetes的平台,用于实时服务ML/DL模型,并针对高容量/密度用例进行了优化。与管理流程以充分利用可用资源的操作系统类似,ModelMesh优化部署的模型,以便在集群中高效运行。
通过跨部署的pod集群智能地管理内存中的模型数据,并随着时间的推移使用这些模型,系统可以充分利用可用的集群资源。
Meshserving推理基于KServe v2数据平面API,这使得它可以部署为类似于NVIDIA Triton推理服务器的运行时。当一个请求到达KServe数据平面时,它被简单地委托给ModelMesh服务。
目前,meshserving和KServe的集成处于Alpha阶段。随着这两个项目的成熟,将会有更紧密的集成,这将使得混合和匹配两个平台的功能和能力成为可能。
随着模型服务成为MLOP的核心构件,像KServe这样的开源项目变得非常重要。KServe的可扩展性使它能够使用现有的和即将到来的运行时,从而成为一个独特的模型服务平台。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
万象汽车试驾,轻松搞定试驾。只需几步,即可开启您的驾驶体验之旅。首先,通过官网或APP预约试驾时间,选择心...浏览全文>>
-
北汽瑞翔试驾流程主要包括以下几个步骤:首先,客户到达4S店后,由销售顾问接待并了解客户需求。随后,销售顾...浏览全文>>
-
试驾MG4 EV全攻略:MG4 EV是一款主打年轻、智能与续航的纯电车型。外观时尚,车身紧凑,适合城市通勤。内饰...浏览全文>>
-
预约试驾奥迪SQ5 Sportback,可线上与线下结合操作。首先,访问奥迪官网或官方APP,选择“试驾预约”,填写个...浏览全文>>
-
红旗试驾预约通常需要以下条件:1 年龄要求:申请人需年满18周岁,部分门店可能要求20岁以上。2 驾驶证...浏览全文>>
-
特斯拉试驾全攻略试驾特斯拉前,建议提前在官网预约,选择最近的体验中心。到店后,工作人员会引导你完成基础...浏览全文>>
-
宝马预约试驾全攻略想要体验宝马的驾驶乐趣?提前预约试驾是关键。首先,访问宝马官网或使用“宝马中国”官方A...浏览全文>>
-
道郎格试驾,感受豪华与科技的完美融合。一进入车内,高端质感扑面而来,真皮座椅、精致内饰,尽显奢华。智能...浏览全文>>
-
预约奇瑞新能源试驾,新手可按以下步骤操作:1 选择车型:登录奇瑞官网或官方App,浏览新能源车型,如艾瑞...浏览全文>>
-
奔驰GLE试驾预约,开启非凡旅程。作为豪华SUV的典范,GLE集优雅设计与强大性能于一身,为您带来前所未有的驾驶...浏览全文>>
- 特斯拉试驾全攻略
- 宝马预约试驾全攻略
- 奔驰GLE试驾预约,畅享豪华驾乘,体验卓越性能
- 零跑C16试驾全攻略
- 试驾海豚,轻松几步,畅享豪华驾乘
- 奇瑞预约试驾的流程及注意事项
- 小鹏G7试驾,新手必知的详细步骤
- 如何在 IPHONE 16E 和 IPHONE 16 之间进行选择
- 这个隐藏的 ANDROID 设置可以释放大屏幕的全部潜力
- 三星 ONE UI 7 更新:比预期更早到来
- IPHONE 15 PRO 和 PRO MAX 将很快获得视觉智能
- 使用这些必备的 ANDROID 应用程序改变你的主屏幕
- PS5 PRO 销量与 PS4 PRO 竞争
- 超薄 Galaxy S25 Edge揭晓其新功能
- Android 15 QPR2 Beta 2.1 将修复与崩溃相关的问题
- Garmin 的 Fenix 7 Pro Sapphire Solar 降至 591 美元
- Galaxy S25 Ultra 的 S Pen 可能会失去蓝牙功能
- 惠普在 CES 上推出搭载 Copilot+ 的全新一体机和迷你电脑
- 首批 Galaxy S25 系列壁纸来了 但只有两张
- 1,000 马力的 911 Turbo S GT-R 与杜卡迪一较高下