使用 NIXL#

警告

此页面记录了 LMCache 的进程内模式（已弃用）的行为。请考虑使用 LMCache MP 模式以获得更好的功能支持和性能。有关此页面的 MP 模式等效项，请参见分离式预填充。

NIXL（NVIDIA 推理传输库）是一个高性能库，旨在加速 AI 推理框架中的点对点通信。它通过模块化插件架构提供对各种类型内存（CPU 和 GPU）和存储的抽象，使得推理管道中不同组件之间的数据传输和协调更加高效。

LMCache 支持将 NIXL 作为分离式 Prefill-解码的底层通信库。

有关使用 NIXL 安装 LMCache 的详细说明，请参阅我们的安装指南。

示例#