Apply ruff formatting fixes

toslali-ibm · markurtz · commit 17415266c46f · 2025-11-16T11:49:43.000-05:00
Signed-off-by: Mert Toslali &lt;toslali@ibm.com&gt;
diff --git a/src/guidellm/backends/response_handlers.py b/src/guidellm/backends/response_handlers.py
@@ -146,7 +146,7 @@ def compile_non_streaming(
             request_args=str(
                 request.arguments.model_dump() if request.arguments else None
             ),
-            response_id=response.get("id"), # use vLLM ID if available
+            response_id=response.get("id"),  # use vLLM ID if available
             text=text,
             input_metrics=input_metrics,
             output_metrics=output_metrics,
@@ -196,7 +196,7 @@ def compile_streaming(self, request: GenerationRequest) -> GenerationResponse:
             request_args=str(
                 request.arguments.model_dump() if request.arguments else None
             ),
-            response_id=self.streaming_response_id, # use vLLM ID if available
+            response_id=self.streaming_response_id,  # use vLLM ID if available
             text=text,
             input_metrics=input_metrics,
             output_metrics=output_metrics,
@@ -312,7 +312,7 @@ def compile_non_streaming(
             request_args=str(
                 request.arguments.model_dump() if request.arguments else None
             ),
-            response_id=response.get("id"), # use vLLM ID if available
+            response_id=response.get("id"),  # use vLLM ID if available
             text=text,
             input_metrics=input_metrics,
             output_metrics=output_metrics,
@@ -362,7 +362,7 @@ def compile_streaming(self, request: GenerationRequest) -> GenerationResponse:
             request_args=str(
                 request.arguments.model_dump() if request.arguments else None
             ),
-            response_id=self.streaming_response_id, # use vLLM ID if available
+            response_id=self.streaming_response_id,  # use vLLM ID if available
             text=text,
             input_metrics=input_metrics,
             output_metrics=output_metrics,
@@ -398,7 +398,6 @@ def __init__(self):
         self.streaming_usage: dict[str, int | dict[str, int]] | None = None
         self.streaming_response_id: str | None = None
 
-
     def compile_non_streaming(
         self, request: GenerationRequest, response: dict
     ) -> GenerationResponse:
@@ -421,7 +420,7 @@ def compile_non_streaming(
             request_args=str(
                 request.arguments.model_dump() if request.arguments else None
             ),
-            response_id=response.get("id"), # use vLLM ID if available
+            response_id=response.get("id"),  # use vLLM ID if available
             text=text,
             input_metrics=input_metrics,
             output_metrics=output_metrics,
diff --git a/src/guidellm/schemas/response.py b/src/guidellm/schemas/response.py
@@ -43,7 +43,7 @@ class GenerationResponse(StandardBaseModel):
     )
     response_id: str | None = Field(
         default=None,
-        description="Unique identifier matching the original vLLM Response ID."
+        description="Unique identifier matching the original vLLM Response ID.",
     )
     request_args: str | None = Field(
         description="Arguments passed to the backend for request processing."

Original file line number	Diff line number	Diff line change
`@@ -43,7 +43,7 @@ class GenerationResponse(StandardBaseModel):`
`43`	`43`	`)`
`44`	`44`	`response_id: str \| None = Field(`
`45`	`45`	`default=None,`
`46`		`- description="Unique identifier matching the original vLLM Response ID."`
	`46`	`+ description="Unique identifier matching the original vLLM Response ID.",`
`47`	`47`	`)`
`48`	`48`	`request_args: str \| None = Field(`
`49`	`49`	`description="Arguments passed to the backend for request processing."`