Added vllm generation; Improved one error message #53

ytzi · 2025-05-20T05:21:54Z

Adding a vllm generation backend that should be compatible with the original generation backend using Transformers pipeline.

Important difference compared to original backend:

Supports multi-gpu;
no batch_size parameter: vllm dynamically chooses the most optimal batch size.

Added vllm generation; improved one error message

8f82c53

Dando18 force-pushed the vllm-generation branch from c0ba140 to 8f82c53 Compare June 10, 2025 11:06

Dando18 self-requested a review June 10, 2025 11:07

Dando18 approved these changes Jun 10, 2025

View reviewed changes

Dando18 merged commit dbb9539 into parallelcodefoundry:develop Jun 10, 2025
61 checks passed

Provide feedback