lmcache 服务器#
lmcache server 命令启动独立的 LMCache 多进程 (MP) 服务器,该服务器暴露 ZMQ 控制平面和 HTTP 前端 (状态、健康检查、清除缓存、校验和 API)。这是 lmcache describe、lmcache ping kvcache、lmcache kvcache 和 lmcache bench server 进行交互的服务器。
备注
此命令需要完整的 lmcache 安装,并带有 CUDA 扩展。它在轻量级的 lmcache-cli 包中 不可用。
lmcache server [options]
快速开始#
lmcache server \
--host 0.0.0.0 --port 5555 \
--l1-size-gb 100 \
--eviction-policy LRU
选项#
服务器从多个配置模块组合其参数——多进程服务器、存储管理器(L1 / L2 适配器 / 逐出)、HTTP 前端以及 Prometheus / 监控可观察性层。完整的权威列表很大,并随着运行时而变化,因此请参考:
lmcache server --help
常用的标志包括:
标志 |
描述 |
|---|---|
|
服务器的绑定地址。 |
|
ZMQ 控制平面端口。 |
|
KV Cache 块大小(以 token 为单位)。 |
|
L1 (CPU/DRAM) 缓存容量(以 GB 为单位)。 |
|
L1 逐出策略(例如 |
|
开始逐出的 L1 填充比率。 |
|
每个逐出周期清除的 L1 分数。 |
|
服务器工作进程的数量。 |
|
在此基础 URL(例如 |
|
协调器应通过此服务器访问的 IP(默认为出站 IP)。 |
|
心跳之间的秒数( |
|
启用存储级别的追踪记录(请参见 lmcache 跟踪)。 |
|
记录的 |
L2 适配器、可观察性和 Prometheus 导出器通过各自的标志组进行配置;有关完整的设置,请参见 lmcache server --help。