Retour à la liste

vLLM: extract_hidden_states speculative decoding crashes server on any request with penalty parameters — CVE-2026-44223

GitHub · GitHub · CVE-2026-44223

ID
CVE-2026-44223
Date
Mis à jour
Activity
Source
GitHub
Fournisseur
GitHub
Risque
medium
CVSS
6.5
EPSS
0.0004

Résumé

### Summary The `extract_hidden_states` speculative decoding proposer in vLLM returns a tensor with an incorrect shape after the first decode step, causing a `RuntimeError` that crashes the EngineCore process. The crash is triggered when any request in the batch uses sampling penalty parameters (`repetition_penalty`, `frequency_penalty`, or `presence_penalty`). A single request with a penalty parameter (e.g.,…

Produit

pip: vllm

Que faire

Mesures générales et prudentes (vérifiez les détails dans la source officielle) :

  • Évaluez l’exposition et planifiez la remédiation selon le risque et l’environnement.
  • Identifiez les versions affectées dans votre inventaire et vérifiez si vous êtes concerné.
  • Appliquez les correctifs/mises à jour du fournisseur ou les atténuations recommandées.
  • Consultez l’avis officiel pour les versions affectées et les étapes de remédiation.

Avis officiel

Avis associés