crawl4ai: Vulnerabilidade de escrita arbitrária de arquivo no download
A funcionalidade de download do crawl4ai permitia que o nome do arquivo de destino fosse controlado pelo atacante via cabeçalho Content-Disposition ou suggested_filename, concatenado ao diretório de downloads sem restrições, possibilitando caminhos absolutos ou traversal com '.
O que mudou
A funcionalidade de download do crawl4ai permitia que o nome do arquivo de destino fosse controlado pelo atacante via cabeçalho Content-Disposition ou suggested_filename, concatenado ao diretório de downloads sem restrições, possibilitando caminhos absolutos ou traversal com '../' para escapar do diretório. Isso resulta em escrita arbitrária de arquivo com conteúdo controlado pelo atacante, podendo levar a execução remota de código.
Quem isso afeta
Usuários do SDK crawl4ai ou implantação Docker que rastreiam URLs controladas por atacantes. O sink HTTP-strategy é acessível sem autenticação na implantação Docker padrão; ambos os sinks HTTP e browser crawler são acessíveis para usuários do SDK.
O que fazer hoje
Atualize para crawl4ai versão 0.9.0 ou superior. Se a atualização não for possível, execute o crawler como um usuário não privilegiado com um diretório de downloads isolado e habilite a autenticação (CRAWL4AI_API_TOKEN) no servidor Docker.