vLLM 动态连接器#

上游集成:#

LMCache 与官方上游 vLLM 的集成是在 2025 年 2 月初 中引入的。

vLLM 从 lmcache 包导入连接器,并将其封装在 vllm/distributed/kv_transfer/kv_connector/v1/lmcache_connector.py 中:

from lmcache.integration.vllm.vllm_v1_adapter import LMCacheConnectorV1Impl

这意味着对 LMCache 连接器的任何更新都需要在上游 vLLM 中同步/更新。

vLLM 上游连接器的示例用法:

Pythonic Transfer Config:

from vllm.config import KVTransferConfig
ktc = KVTransferConfig(
    kv_connector="LMCacheConnectorV1",
    kv_role="kv_both",
)

命令行传输配置:

vllm serve "YOUR_MODEL" \
    --kv-transfer-config \
    '{"kv_connector":"LMCacheConnectorV1", "kv_role":"kv_both"}'

动态连接器:#

在 2025 年 6 月,vLLM 支持动态加载 KV 连接器实现,因此我们可以直接引用 LMCache 包中的连接器,而无需更新 vLLM。

来自 LMCache 的动态连接器示例用法:

Pythonic Transfer Config:

from vllm.config import KVTransferConfig
ktc = KVTransferConfig(
    kv_connector="LMCacheConnectorV1Dynamic",
    kv_role="kv_both",
    kv_connector_module_path="lmcache.integration.vllm.lmcache_connector_v1",
)

命令行传输配置:

vllm serve "YOUR_MODEL" \
    --kv-transfer-config \
    '{"kv_connector":"LMCacheConnectorV1Dynamic","kv_role":"kv_both","kv_connector_module_path":"lmcache.integration.vllm.lmcache_connector_v1"}'

这允许 LMCache 修改/开发连接器并快速插拔。

未来任何自定义适配器将会在这里记录,以及可能对上游连接器的弃用。