lmcache server#
lmcache server 命令启动独立的 LMCache 多进程 (MP) 服务器,该服务器暴露 ZMQ 控制平面和 HTTP 前端 (状态、健康检查、清除缓存、校验和 API)。这是 lmcache describe、lmcache ping kvcache、lmcache kvcache 和 lmcache bench server 进行交互的服务器。
备注
此命令需要完整的 lmcache 安装,并带有 CUDA 扩展。它在轻量级的 lmcache-cli 包中 不可用。
lmcache server [options]
快速开始#
lmcache server \
--host 0.0.0.0 --port 5555 \
--l1-size-gb 100 \
--eviction-policy LRU
选项#
服务器从多个配置模块组合其参数——多进程服务器、存储管理器(L1 / L2 适配器 / 逐出)、HTTP 前端以及 Prometheus / 监控可观察性层。完整的权威列表很大,并随着运行时而变化,因此请参考:
lmcache server --help
常用的标志包括:
标志 |
描述 |
|---|---|
|
服务器的绑定地址。 |
|
ZMQ 控制平面端口。 |
|
KV Cache 块大小(以 token 为单位)。 |
|
L1 (CPU/DRAM) 缓存容量(以 GB 为单位)。 |
|
L1 逐出策略(例如 |
|
开始逐出的 L1 填充比率。 |
|
每个逐出周期清除的 L1 分数。 |
|
服务器工作进程的数量。 |
|
在此基础 URL(例如 |
|
协调器应通过此服务器访问的 IP(默认为出站 IP)。 |
|
心跳之间的秒数( |
|
启用向协调器上报 L2 存储/查找事件,用于全集群使用量跟踪及基于配额的逐出。 |
|
L2 事件批量刷新之间的秒数( |
|
启用 P2P KV Cache 共享,并将此服务器的传输通道端点广告给对等方(例如 |
|
传输通道服务器绑定的地址。默认为 |
|
对等查找的截止时间,超过该时间将视为未命中(默认 |
|
对等 KV 读取的截止时间,超过该时间将视为失败(默认 |
|
P2P 读取的传输通道实现(默认 |
|
启用存储级别的追踪记录(请参见 lmcache trace)。 |
|
记录的 |
L2 适配器、可观察性和 Prometheus 导出器通过各自的标志组进行配置;有关完整的设置,请参见 lmcache server --help。