vLLM: Revisão de artefatos não é aplicada consistentemente
O pinning de revisão no vLLM não se aplica consistentemente a todos os artefatos carregados para um modelo.
O que mudou
O pinning de revisão no vLLM não se aplica consistentemente a todos os artefatos carregados para um modelo. Quando um operador fornece --revision ou --code-revision, código dinâmico, arquivos GGUF, processadores de imagem, pesos do lado de recuperação ou pesos/config de subpastas do mesmo repositório podem ainda ser carregados de uma revisão não fixada/padrão.
Quem isso afeta
Operadores que fixam implantações de modelo vLLM a uma revisão revisada do Hugging Face para revisão de segurança, proveniência, rollback ou reprodutibilidade.
O que fazer hoje
Atualize o vLLM para a versão corrigida (PR #42616) ou aplique o patch para garantir que os pins de revisão se propaguem para todos os caminhos de carregamento de artefatos.