vLLM Blog

Disaggregated Serving for Hybrid SSM Models in vLLM

Apr 21, 2026·15 min read

How vLLM extends NIXL prefill/decode disaggregation to hybrid SSM-attention models with dual descriptor views, physical-logical block bridging, and Mamba conv-state transfer support.

#mamba

Disaggregated Serving for Hybrid SSM Models in vLLM