Complete compare versions' workflow (#226)

tellet-q · pre-commit-ci[bot] · web-flow · commit 8564a25eec7f · 2025-03-13T08:41:18.000+01:00
* Compare versions * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * Use GITHUB_STEP_SUMMARY * Add doc strings --------- Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com>
diff --git a/.github/workflows/manual-compare-versions-benchmark.yaml b/.github/workflows/manual-compare-versions-benchmark.yaml
@@ -1,4 +1,8 @@
 name: Manual Benchmark to compare versions
+description: |
+  This workflow is used to compare two versions of qdrant using the same dataset and engine config.
+  It is triggered manually and requires the user to provide the versions of qdrant to compare, dataset and engine config.
+  The workflow will prepare the images for the provided versions (if needed), run the benchmark for each version and compare the results.
 
 on:
   workflow_dispatch:
@@ -20,6 +24,7 @@ jobs:
   prepareImage1:
     name: Prepare image ${{ inputs.qdrant_version_1 }}
     runs-on: ubuntu-latest
+    timeout-minutes: 180
     steps:
       - uses: actions/checkout@v3
       - uses: webfactory/ssh-agent@v0.8.0
@@ -29,12 +34,13 @@ jobs:
         run: |
           # The branch, tag or SHA to checkout.
           export QDRANT_VERSION=${{ inputs.qdrant_version_1 }}
-          export BEARER_TOKEN="${{ secrets.GITHUB_TOKEN }}"
+          export BEARER_TOKEN="${{ secrets.TRIGGER_GH_TOKEN }}"
           bash -x tools/compare_versions/prepare_image.sh
 
   prepareImage2:
-    name: Prepare image ${{ inputs.qdrant_version_1 }}
+    name: Prepare image ${{ inputs.qdrant_version_2 }}
     runs-on: ubuntu-latest
+    timeout-minutes: 180
     steps:
       - uses: actions/checkout@v3
       - uses: webfactory/ssh-agent@v0.8.0
@@ -43,50 +49,126 @@ jobs:
       - name: Image for ${{ inputs.qdrant_version_2 }}
         run: |
           export QDRANT_VERSION=${{ inputs.qdrant_version_2 }}
-          export BEARER_TOKEN="${{ secrets.GITHUB_TOKEN }}"
+          export BEARER_TOKEN="${{ secrets.TRIGGER_GH_TOKEN }}"
           bash -x tools/compare_versions/prepare_image.sh
 
-#  runBenchmarkForVersion1:
-#    name: compare - ${{ inputs.qdrant_version_1 }} vs ${{ inputs.qdrant_version_2 }} - ${{ inputs.dataset }}
-#    needs:
-#      - prepareImage1
-#      - prepareImage2
-#    runs-on: ubuntu-latest
-#    steps:
-#      - uses: actions/checkout@v3
-#      - uses: webfactory/ssh-agent@v0.8.0
-#        with:
-#          ssh-private-key: ${{ secrets.SSH_PRIVATE_KEY }}
-#      - name: Bench ${{ inputs.qdrant_version_1 }}
-#        run: |
-#          export HCLOUD_TOKEN=${{ secrets.HCLOUD_TOKEN }}
-#          export POSTGRES_PASSWORD=${{ secrets.POSTGRES_PASSWORD }}
-#          export POSTGRES_HOST=${{ secrets.POSTGRES_HOST }}
-#          export QDRANT_VERSION=${{ inputs.qdrant_version_1 }}
-#          export DATASETS=${{ inputs.dataset }}
-#          export ENGINE_NAME=${{ inputs.engine_config }}
-#          export POSTGRES_TABLE=benchmark_manual
-#          bash -x tools/setup_ci.sh
-#          bash -x tools/run_ci.sh
-#
-#  runBenchmarkForVersion2:
-#    name: compare - ${{ inputs.qdrant_version_1 }} vs ${{ inputs.qdrant_version_2 }} - ${{ inputs.dataset }}
-#    needs:
-#      - runBenchmarkForVersion1
-#    runs-on: ubuntu-latest
-#    steps:
-#      - uses: actions/checkout@v3
-#      - uses: webfactory/ssh-agent@v0.8.0
-#        with:
-#          ssh-private-key: ${{ secrets.SSH_PRIVATE_KEY }}
-#      - name: Bench ${{ inputs.qdrant_version_2 }}
-#        run: |
-#          export HCLOUD_TOKEN=${{ secrets.HCLOUD_TOKEN }}
-#          export POSTGRES_PASSWORD=${{ secrets.POSTGRES_PASSWORD }}
-#          export POSTGRES_HOST=${{ secrets.POSTGRES_HOST }}
-#          export QDRANT_VERSION=${{ inputs.qdrant_version_2 }}
-#          export DATASETS=${{ inputs.dataset }}
-#          export ENGINE_NAME=${{ inputs.engine_config }}
-#          export POSTGRES_TABLE=benchmark_manual
-#          bash -x tools/setup_ci.sh
-#          bash -x tools/run_ci.sh
+  runBenchmarkForVersion1:
+    name: execute - ${{ inputs.qdrant_version_1 }} - ${{ inputs.dataset }}
+    needs:
+      - prepareImage1
+    runs-on: ubuntu-latest
+    concurrency:
+      group: continuous-benchmark
+    outputs:
+      collection_load_time: ${{ steps.bench.outputs.collection_load_time }}
+      rps: ${{ steps.bench.outputs.rps }}
+      mean_precisions: ${{ steps.bench.outputs.mean_precisions }}
+      p95_time: ${{ steps.bench.outputs.p95_time }}
+      p99_time: ${{ steps.bench.outputs.p99_time }}
+      vm_rss_memory_usage: ${{ steps.bench.outputs.vm_rss_memory_usage }}
+      rss_anon_memory_usage: ${{ steps.bench.outputs.rss_anon_memory_usage }}
+      upload_time: ${{ steps.bench.outputs.upload_time }}
+      indexing_time: ${{ steps.bench.outputs.indexing_time }}
+    steps:
+      - uses: actions/checkout@v3
+      - uses: webfactory/ssh-agent@v0.8.0
+        with:
+          ssh-private-key: ${{ secrets.SSH_PRIVATE_KEY }}
+      - name: Bench ${{ inputs.qdrant_version_1 }}
+        id: bench
+        run: |
+          export HCLOUD_TOKEN=${{ secrets.HCLOUD_TOKEN }}
+          export POSTGRES_PASSWORD=${{ secrets.POSTGRES_PASSWORD }}
+          export POSTGRES_HOST=${{ secrets.POSTGRES_HOST }}
+          export QDRANT_VERSION=${{ inputs.qdrant_version_1 }}
+          export DATASETS=${{ inputs.dataset }}
+          export ENGINE_NAME=${{ inputs.engine_config }}
+          export POSTGRES_TABLE=benchmark_manual
+          bash -x tools/setup_ci.sh
+          bash -x tools/run_ci.sh
+
+  runBenchmarkForVersion2:
+    name: execute - ${{ inputs.qdrant_version_2 }} - ${{ inputs.dataset }}
+    needs:
+      - prepareImage2
+      - runBenchmarkForVersion1
+    runs-on: ubuntu-latest
+    concurrency:
+      group: continuous-benchmark
+    outputs:
+      collection_load_time: ${{ steps.bench.outputs.collection_load_time }}
+      rps: ${{ steps.bench.outputs.rps }}
+      mean_precisions: ${{ steps.bench.outputs.mean_precisions }}
+      p95_time: ${{ steps.bench.outputs.p95_time }}
+      p99_time: ${{ steps.bench.outputs.p99_time }}
+      vm_rss_memory_usage: ${{ steps.bench.outputs.vm_rss_memory_usage }}
+      rss_anon_memory_usage: ${{ steps.bench.outputs.rss_anon_memory_usage }}
+      upload_time: ${{ steps.bench.outputs.upload_time }}
+      indexing_time: ${{ steps.bench.outputs.indexing_time }}
+    steps:
+      - uses: actions/checkout@v3
+      - uses: webfactory/ssh-agent@v0.8.0
+        with:
+          ssh-private-key: ${{ secrets.SSH_PRIVATE_KEY }}
+      - name: Bench ${{ inputs.qdrant_version_2 }}
+        id: bench
+        run: |
+          export HCLOUD_TOKEN=${{ secrets.HCLOUD_TOKEN }}
+          export POSTGRES_PASSWORD=${{ secrets.POSTGRES_PASSWORD }}
+          export POSTGRES_HOST=${{ secrets.POSTGRES_HOST }}
+          export QDRANT_VERSION=${{ inputs.qdrant_version_2 }}
+          export DATASETS=${{ inputs.dataset }}
+          export ENGINE_NAME=${{ inputs.engine_config }}
+          export POSTGRES_TABLE=benchmark_manual
+          bash -x tools/setup_ci.sh
+          bash -x tools/run_ci.sh
+
+  compareVersions:
+    name: compare - ${{ inputs.qdrant_version_1 }} vs ${{ inputs.qdrant_version_2 }}
+    needs:
+      - runBenchmarkForVersion1
+      - runBenchmarkForVersion2
+    runs-on: ubuntu-latest
+    steps:
+      - name: compare
+        run: |
+          compare() {
+            local var_name=$1
+            local value_v1=$2
+            local value_v2=$3
+
+            if (( $(echo "$value_v1 > $value_v2" | bc -l) )); then
+              local diff=$(echo "$value_v1 - $value_v2" | bc -l)
+              local percentage=$(echo "($diff / $value_v1) * 100" | bc -l)
+              echo -e "${{ inputs.qdrant_version_1 }} > ${{ inputs.qdrant_version_2 }} by $diff ($percentage% greater)"
+            elif (( $(echo "$value_v1 < $value_v2" | bc -l) )); then
+              local diff=$(echo "$value_v2 - $value_v1" | bc -l)
+              local percentage=$(echo "($diff / $value_v2) * 100" | bc -l)
+              echo -e "${{ inputs.qdrant_version_1 }} < ${{ inputs.qdrant_version_2 }} by $diff ($percentage% less)"
+            else
+              echo -e "equal"
+            fi
+          }
+
+          res_collection_load_time=$(compare "collection_load_time" "${{ needs.runBenchmarkForVersion1.outputs.collection_load_time }}" "${{ needs.runBenchmarkForVersion2.outputs.collection_load_time }}")
+          res_rps=$(compare "rps" "${{ needs.runBenchmarkForVersion1.outputs.rps }}" "${{ needs.runBenchmarkForVersion2.outputs.rps }}")
+          res_mean_precisions=$(compare "mean_precisions" "${{ needs.runBenchmarkForVersion1.outputs.mean_precisions }}" "${{ needs.runBenchmarkForVersion2.outputs.mean_precisions }}")
+          res_p95_time=$(compare "p95_time" "${{ needs.runBenchmarkForVersion1.outputs.p95_time }}" "${{ needs.runBenchmarkForVersion2.outputs.p95_time }}")
+          res_p99_time=$(compare "p99_time" "${{ needs.runBenchmarkForVersion1.outputs.p99_time }}" "${{ needs.runBenchmarkForVersion2.outputs.p99_time }}")
+          res_vm_rss_memory_usage=$(compare "vm_rss_memory_usage" "${{ needs.runBenchmarkForVersion1.outputs.vm_rss_memory_usage }}" "${{ needs.runBenchmarkForVersion2.outputs.vm_rss_memory_usage }}")
+          res_rss_anon_memory_usage=$(compare "rss_anon_memory_usage" "${{ needs.runBenchmarkForVersion1.outputs.rss_anon_memory_usage }}" "${{ needs.runBenchmarkForVersion2.outputs.rss_anon_memory_usage }}")
+          res_upload_time=$(compare "upload_time" "${{ needs.runBenchmarkForVersion1.outputs.upload_time }}" "${{ needs.runBenchmarkForVersion2.outputs.upload_time }}")
+          res_indexing_time=$(compare "indexing_time" "${{ needs.runBenchmarkForVersion1.outputs.indexing_time }}" "${{ needs.runBenchmarkForVersion2.outputs.indexing_time }}")
+
+          echo "# Comparison results" >> $GITHUB_STEP_SUMMARY
+          echo "| Name                  | ${{ inputs.qdrant_version_1 }}       | ${{ inputs.qdrant_version_2 }}       | Result     |" >> $GITHUB_STEP_SUMMARY
+          echo "| --------------------- | ------------ | ------------ | ------------ |" >> $GITHUB_STEP_SUMMARY
+          echo "| collection_load_time  | ${{ needs.runBenchmarkForVersion1.outputs.collection_load_time }} | ${{ needs.runBenchmarkForVersion2.outputs.collection_load_time }} | ${res_collection_load_time} |" >> $GITHUB_STEP_SUMMARY
+          echo "| rps                   | ${{ needs.runBenchmarkForVersion1.outputs.rps }} | ${{ needs.runBenchmarkForVersion2.outputs.rps }} | ${res_rps} |" >> $GITHUB_STEP_SUMMARY
+          echo "| mean_precisions       | ${{ needs.runBenchmarkForVersion1.outputs.mean_precisions }} | ${{ needs.runBenchmarkForVersion2.outputs.mean_precisions }} | ${res_mean_precisions} |" >> $GITHUB_STEP_SUMMARY
+          echo "| p95_time              | ${{ needs.runBenchmarkForVersion1.outputs.p95_time }} | ${{ needs.runBenchmarkForVersion2.outputs.p95_time }} | ${res_p95_time} |" >> $GITHUB_STEP_SUMMARY
+          echo "| p99_time              | ${{ needs.runBenchmarkForVersion1.outputs.p99_time }} | ${{ needs.runBenchmarkForVersion2.outputs.p99_time }} | ${res_p99_time} |" >> $GITHUB_STEP_SUMMARY
+          echo "| vm_rss_memory_usage   | ${{ needs.runBenchmarkForVersion1.outputs.vm_rss_memory_usage }} | ${{ needs.runBenchmarkForVersion2.outputs.vm_rss_memory_usage }} | ${res_vm_rss_memory_usage} |" >> $GITHUB_STEP_SUMMARY
+          echo "| rss_anon_memory_usage  | ${{ needs.runBenchmarkForVersion1.outputs.rss_anon_memory_usage }} | ${{ needs.runBenchmarkForVersion2.outputs.rss_anon_memory_usage }} | ${res_rss_anon_memory_usage} |" >> $GITHUB_STEP_SUMMARY
+          echo "| upload_time           | ${{ needs.runBenchmarkForVersion1.outputs.upload_time }} | ${{ needs.runBenchmarkForVersion2.outputs.upload_time }} | ${res_upload_time} |" >> $GITHUB_STEP_SUMMARY
+          echo "| indexing_time         | ${{ needs.runBenchmarkForVersion1.outputs.indexing_time }} | ${{ needs.runBenchmarkForVersion2.outputs.indexing_time }} | ${res_indexing_time} |" >> $GITHUB_STEP_SUMMARY
diff --git a/poetry.lock b/poetry.lock
diff --git a/tools/compare_versions/prepare_image.sh b/tools/compare_versions/prepare_image.sh
@@ -1,9 +1,15 @@
 #!/bin/bash
+# This script checks for the image in the remote repo
+# and if it is not there triggers the image build in the
+# main Qdrant repo for the specified version and waits
+# until the image is available in the remote repository.
+#
+# Usage: export QDRANT_VERSION="ghcr/dev" && ./prepare_image.sh
+
 
 QDRANT_VERSION=${QDRANT_VERSION:-"ghcr/dev"}
 
-#MAX_RETRIES=12
-MAX_RETRIES=1
+MAX_RETRIES=15
 
 EVENT_TYPE="benchmark-trigger-image-build"
 
@@ -18,18 +24,20 @@ if [[ ${QDRANT_VERSION} == docker/* ]] || [[ ${QDRANT_VERSION} == ghcr/* ]]; the
     if [[ ${QDRANT_VERSION} == docker/* ]]; then
         # pull from docker hub
         QDRANT_VERSION=${QDRANT_VERSION#docker/}
+        QDRANT_VERSION_IMG=${QDRANT_VERSION//\//-} # replace all / with -
         CONTAINER_REGISTRY='docker.io'
     elif [[ ${QDRANT_VERSION} == ghcr/* ]]; then
         # pull from github container registry
         QDRANT_VERSION=${QDRANT_VERSION#ghcr/}
+        QDRANT_VERSION_IMG=${QDRANT_VERSION//\//-} # replace all / with -
         CONTAINER_REGISTRY='ghcr.io'
     fi
 else
     echo "Error: unknown version ${QDRANT_VERSION}. Version name should start with 'docker/' or 'ghcr/'"
     exit 1
 fi
 
-IMAGE="${CONTAINER_REGISTRY}/qdrant/qdrant:${QDRANT_VERSION}"
+IMAGE="${CONTAINER_REGISTRY}/qdrant/qdrant:${QDRANT_VERSION_IMG}"
 
 if docker manifest inspect "$IMAGE" > /dev/null 2>&1; then
   echo "Image $IMAGE exists in the remote repository."
@@ -50,7 +58,7 @@ curl -L \
   -H "Authorization: Bearer ${BEARER_TOKEN}" \
   -H "X-GitHub-Api-Version: 2022-11-28" \
   https://api.github.com/repos/qdrant/qdrant/dispatches \
-  -d "{\"event_type\": \"$EVENT_TYPE\", \"client_payload\": {\"version\": \"$QDRANT_VERSION\"}}"
+  -d "{\"event_type\": \"$EVENT_TYPE\", \"client_payload\": {\"version\": \"$QDRANT_VERSION\", \"triggered\": true}}"
 
 echo "Wait for the image to appear in the remote repository..."
 counter=0
@@ -61,9 +69,8 @@ while ! docker manifest inspect "$IMAGE" > /dev/null 2>&1; do
   fi
   # sleep for 10 minutes, in seconds
   # together with the MAX_RETRIES it
-  # will wait for 120 minutes
-#  sleep 600
-  sleep 60
+  # will wait for 150 minutes
+  sleep 600
   ((counter++))
 done
 
diff --git a/tools/run_ci.sh b/tools/run_ci.sh
@@ -50,6 +50,8 @@ export VM_RSS_MEMORY_USAGE_FILE=$(ls -t results/vm-rss-memory-usage-*.txt | head
 export RSS_ANON_MEMORY_USAGE_FILE=$(ls -t results/rss-anon-memory-usage-*.txt | head -n 1)
 export ROOT_API_RESPONSE_FILE=$(ls -t results/root-api-*.json | head -n 1)
 
+export IS_CI_RUN="true"
+
 if [[ "$BENCHMARK_STRATEGY" == "parallel" ]]; then
   bash -x "${SCRIPT_PATH}/upload_parallel_results_postgres.sh"
 else
diff --git a/tools/upload_parallel_results_postgres.sh b/tools/upload_parallel_results_postgres.sh
@@ -31,6 +31,8 @@ POSTGRES_TABLE=${POSTGRES_TABLE:-"benchmark_parallel_search_upload"}
 QDRANT_VERSION=${QDRANT_VERSION:-"dev"}
 DATASETS=${DATASETS:-"laion-small-clip"}
 
+IS_CI_RUN=${IS_CI_RUN:-"false"}
+
 if [[ "$BENCHMARK_STRATEGY" != "parallel" ]]; then
   echo "BENCHMARK_STRATEGY is not parallel"
   exit 1
@@ -90,3 +92,15 @@ INSERT INTO ${POSTGRES_TABLE} (engine, branch, commit, dataset, measure_timestam
 VALUES ('qdrant-ci', '${QDRANT_VERSION}', '${QDRANT_COMMIT}', '${DATASETS}', '${MEASURE_TIMESTAMP}', ${UPLOAD_TIME}, ${INDEXING_TIME}, ${RPS}, ${MEAN_PRECISIONS}, ${P95_TIME}, ${P99_TIME}, ${SEARCH_TIME}, ${NO_UPSERT_SEARCH_TIME});
 "
 
+if [[ "$IS_CI_RUN" == "true" ]]; then
+  echo "rps=${RPS}" >> "$GITHUB_OUTPUT"
+  echo "mean_precisions=${MEAN_PRECISIONS}" >> "$GITHUB_OUTPUT"
+  echo "p95_time=${P95_TIME}" >> "$GITHUB_OUTPUT"
+  echo "p99_time=${P99_TIME}" >> "$GITHUB_OUTPUT"
+
+  echo "search_time=${SEARCH_TIME}" >> "$GITHUB_OUTPUT"
+  echo "no_upsert_search_time=${NO_UPSERT_SEARCH_TIME}" >> "$GITHUB_OUTPUT"
+
+  echo "upload_time=${UPLOAD_TIME}" >> "$GITHUB_OUTPUT"
+  echo "indexing_time=${INDEXING_TIME}" >> "$GITHUB_OUTPUT"
+fi
diff --git a/tools/upload_results_postgres.sh b/tools/upload_results_postgres.sh
@@ -33,6 +33,8 @@ POSTGRES_TABLE=${POSTGRES_TABLE:-"benchmark"}
 QDRANT_VERSION=${QDRANT_VERSION:-"dev"}
 DATASETS=${DATASETS:-"laion-small-clip"}
 
+IS_CI_RUN=${IS_CI_RUN:-"false"}
+
 if [[ "$BENCHMARK_STRATEGY" == "collection-reload" ]]; then
   if [[ -z "$TELEMETRY_API_RESPONSE_FILE" ]]; then
     echo "TELEMETRY_API_RESPONSE_FILE is not set"
@@ -89,8 +91,8 @@ else
   INDEXING_TIME=$(jq -r '.results.total_time' "$UPLOAD_RESULTS_FILE")
 fi
 
-VM_RSS_MEMORY_USAGE=$(cat "$VM_RSS_MEMORY_USAGE_FILE")
-RSS_ANON_MEMORY_USAGE=$(cat "$RSS_ANON_MEMORY_USAGE_FILE")
+VM_RSS_MEMORY_USAGE=$(cat "$VM_RSS_MEMORY_USAGE_FILE" | tr -d '[:space:]')
+RSS_ANON_MEMORY_USAGE=$(cat "$RSS_ANON_MEMORY_USAGE_FILE" | tr -d '[:space:]')
 
 QDRANT_COMMIT=$(jq -r '.commit' "$ROOT_API_RESPONSE_FILE")
 
@@ -102,3 +104,17 @@ INSERT INTO ${POSTGRES_TABLE} (engine, branch, commit, dataset, measure_timestam
 VALUES ('qdrant-ci', '${QDRANT_VERSION}', '${QDRANT_COMMIT}', '${DATASETS}', '${MEASURE_TIMESTAMP}', ${UPLOAD_TIME}, ${INDEXING_TIME}, ${RPS}, ${MEAN_PRECISIONS}, ${P95_TIME}, ${P99_TIME}, ${VM_RSS_MEMORY_USAGE}, ${RSS_ANON_MEMORY_USAGE}, ${COLLECTION_LOAD_TIME});
 "
 
+if [[ "$IS_CI_RUN" == "true" ]]; then
+  echo "collection_load_time=${COLLECTION_LOAD_TIME}" >> "$GITHUB_OUTPUT"
+
+  echo "rps=${RPS}" >> "$GITHUB_OUTPUT"
+  echo "mean_precisions=${MEAN_PRECISIONS}" >> "$GITHUB_OUTPUT"
+  echo "p95_time=${P95_TIME}" >> "$GITHUB_OUTPUT"
+  echo "p99_time=${P99_TIME}" >> "$GITHUB_OUTPUT"
+
+  echo "vm_rss_memory_usage=${VM_RSS_MEMORY_USAGE}" >> "$GITHUB_OUTPUT"
+  echo "rss_anon_memory_usage=${RSS_ANON_MEMORY_USAGE}" >> "$GITHUB_OUTPUT"
+
+  echo "upload_time=${UPLOAD_TIME}" >> "$GITHUB_OUTPUT"
+  echo "indexing_time=${INDEXING_TIME}" >> "$GITHUB_OUTPUT"
+fi