更多示例#

警告

本页记录了 LMCache 的进程内模式（已弃用）的行为。请考虑使用 LMCache MP 模式以获得更好的功能支持和性能。

本节提供快速示例，以帮助您开始使用 LMCache 的关键功能。

KV Cache 卸载#

KV Cache 卸载允许您将 KV 缓存从显存移动到 CPU 内存或其他存储设备。此功能在以下情况下特别有用：

通过卸载 KV 缓存，LMCache 可以减少首次令牌时间 (TTFT) 和显存周期。

有关更多详细信息，请参见示例：将 KV Cache 卸载到 CPU。

分离式 Prefill 将预填充和解码阶段分开，使用不同的计算资源。此方法：

这种架构在大规模部署场景中尤其有价值，在这些场景中，最大化资源效率和保持稳定的生成速度都很重要。

有关更多详细信息，请参见示例：分离式 Prefill。

LMCache 独立启动器允许您将 LMCacheEngine 作为独立服务运行，而无需 vLLM 或 GPU 依赖。这对于以下情况特别有用：

有关更多详细信息，请参阅独立启动器。