update DEPLOYMENTS table

nikochiko · nikochiko · commit fa0d297c80db · 2025-04-22T17:58:56.000+05:30
diff --git a/DEPLOYMENTS.md b/DEPLOYMENTS.md
@@ -1,24 +1,33 @@
 # Deployments Table
 
-Generated by make-deployments-table.py on 2024-02-05 15:42:27.
+Generated by make-deployments-table.py on 2025-04-22 17:58:21.
 
-| Model ID | GCP | Azure | Node Selector (GCP) | Node Selector (Azure) |
-| --- | --- | --- | --- | --- |
-| common-diffusion-new | ❌ | ✅ |  | agentpool=a100 |
-| common-diffusion-on-demand | ❌ | ✅ |  | agentpool=a100 |
-| common-diffusion-inpaint | ❌ | ✅ |  | agentpool=a100 |
-| deforum-sd-1 | ❌ | ✅ |  | agentpool=a100 |
-| deforum-sd-epicdream | ❌ | ✅ |  | agentpool=a100 |
-| common-whisper-en-short | ❌ | ✅ |  | agentpool=a100 |
-| common-whisper-te-short | ❌ | ✅ |  | agentpool=a100 |
-| retro-nemo-asr | ❌ | ✅ |  | agentpool=a100 |
-| common-audio-ldm-bark | ❌ | ✅ |  | agentpool=a100 |
-| common-seamless | ❌ | ✅ |  | agentpool=a100 |
-| common-diffusion-instruct-pix2pix | ❌ | ✅ |  | agentpool=a100 |
-| common-diffusion-upscale | ❌ | ✅ |  | agentpool=a100 |
-| common-whisper-en-te-long | ❌ | ✅ |  | agentpool=a100 |
-| common-whisper-hi-bho-long | ❌ | ✅ |  | agentpool=a100 |
-| common-whisper-hi-bho-short | ❌ | ✅ |  | agentpool=a100 |
-| common-embeddings-1 | ❌ | ✅ |  | agentpool=a100 |
-| retro-wav2lip-gan | ❌ | ✅ |  | agentpool=a100 |
-| retro-u2net-dis | ❌ | ✅ |  | agentpool=a100 |
+| Name | % of A100 | Replicas | Model IDs |
+| --- | --- | --- | --- |
+| common-diffusion-dreamshaper | 15.91% | 1 | Lykon/DreamShaper |
+| common-diffusion-stable-diffusion-2-1 | 15.91% | 1 | stabilityai/stable-diffusion-2-1 |
+| common-diffusion-dreamlike-photoreal-2 | 15.91% | 1 | dreamlike-art/dreamlike-photoreal-2.0 |
+| common-diffusion-stable-diffusion-v1-5 | 15.91% | 1 | runwayml/stable-diffusion-v1-5 |
+| deforum-sd-1 | 9.09% | 2 | Protogen_V2.2.ckpt |
+| deforum-sd-epicdream | 9.09% | 1 | epicdream.safetensors |
+| common-whisper-en-short | 9.09% | 1 | openai/whisper-large-v2 |
+| common-whisper-en-long | 18.18% | 1 | openai/whisper-large-v2 |
+| common-audio-ldm-bark | 9.09% | 1 | cvssp/audioldm |
+|  |  |  | bark |
+| common-seamless | 12.73% | 1 | facebook/seamless-m4t-v2-large |
+| common-diffusion-instruct-pix2pix | 5.45% | 1 | timbrooks/instruct-pix2pix |
+| common-diffusion-upscale | 23.64% | 1 | stabilityai/stable-diffusion-x4-upscaler |
+| common-mms | 11.36% | 1 | facebook/mms-1b-all |
+| common-embeddings-1 | 8.18% | 1 | intfloat/e5-large-v2 |
+|  |  |  | intfloat/e5-base-v2 |
+|  |  |  | intfloat/multilingual-e5-base |
+|  |  |  | intfloat/multilingual-e5-large |
+|  |  |  | thenlper/gte-large |
+|  |  |  | thenlper/gte-base |
+| retro-sadtalker | 11.36% | 3 | SadTalker_V0.0.2_512.safetensors |
+| retro-wav2lip-gan | 13.64% | 2 | wav2lip_gan.pth |
+| retro-u2net-dis | 4.09% | 1 | u2net |
+|  |  |  | isnet-general-use.pth |
+| retro-gfpgan-esrgan | 10.91% | 1 | GFPGANv1.4 |
+|  |  |  | RealESRGAN_x2plus |
+| common-llms-sealion-v2-1 | 36.36% | 1 | aisingapore/llama3-8b-cpt-sea-lionv2.1-instruct |
diff --git a/make-deployments-table.py b/make-deployments-table.py
@@ -1,56 +1,94 @@
 #!/usr/bin/env python3
+
+import json
 from datetime import datetime
 from textwrap import dedent
+from typing import Iterable
 
 import yaml
 
 
 MD_FILENAME = "DEPLOYMENTS.md"
+A100_TOTAL_MEM = 220  # Gi
+
+
+def flatten(l: Iterable) -> list:
+    ret = []
+    for el in l:
+        if isinstance(el, list):
+            ret.extend(flatten(el))
+        else:
+            ret.append(el)
+    return ret
+
 
-def stringify_nodeselector(selector: dict[str, str]):
-    # separate with markdown linebreak
-    return " * ".join([f"{k}={v}" for k, v in selector.items()])
+def get_model_usage(filename):
+    with open(filename) as f:
+        values = json.load(f)
+    return {row["model"]: row["Count"] for row in values}
 
 
 def get_deployments(filename):
     # filename: yaml filename
     with open(filename) as f:
         values = yaml.safe_load(f)
     deployments = values["deployments"]
-    return {depl["name"]: stringify_nodeselector(depl["nodeSelector"]) for depl in deployments}
+    queue_name_vars = values["autoscaling"]["queueNameVars"]
+    return [
+        {
+            "name": depl["name"],
+            "memoryLimit": depl.get("limits", {}).get("memory", None),
+            "replicas": depl.get("autoscaling", {}).get("minReplicaCount", 1),
+            "models": list(
+                filter(
+                    bool,
+                    flatten(
+                        [
+                            depl.get("env", {}).get(qnv, "").split("\n")
+                            for qnv in queue_name_vars
+                        ]
+                    ),
+                )
+            ),
+        }
+        for depl in deployments
+    ]
 
 
 def main():
-    gcp_deployments = get_deployments(filename="chart/values.yaml")
-    az_deployments = get_deployments(filename="chart/values-azure.yaml")
+    deployments = get_deployments(filename="chart/model-values.yaml")
 
     md_table = [
-        ["Model ID", "GCP", "Azure", "Node Selector (GCP)", "Node Selector (Azure)"],
+        ["Name", "% of A100", "Replicas", "Model IDs"],
     ]
 
-    deployment_info = {}
-    for model_id in gcp_deployments | az_deployments:
-        deployment_info.setdefault(
-            model_id,
-            {"GCP": "❌", "Azure": "❌", "Node Selector (GCP)": "", "Node Selector (Azure)": ""},
+    for info in deployments:
+        if memoryLimit := info["memoryLimit"]:
+            a100_fraction = int(memoryLimit.removesuffix("Gi")) / A100_TOTAL_MEM
+        else:
+            a100_fraction = None
+        md_table.append(
+            [
+                info["name"],
+                f"{a100_fraction:.2%}" if a100_fraction else "N/A",
+                str(info["replicas"]),
+                (info["models"] or ["N/A"])[0],
+            ]
         )
-        if info := az_deployments.get(model_id):
-            deployment_info[model_id]["Azure"] = "✅"
-            deployment_info[model_id]["Node Selector (Azure)"] = info
-        if info := gcp_deployments.get(model_id):
-            deployment_info[model_id]["GCP"] = "✅"
-            deployment_info[model_id]["Node Selector (GCP)"] = info
-
-    for model_id, info in deployment_info.items():
-        md_table.append([model_id, info["GCP"], info["Azure"], info["Node Selector (GCP)"], info["Node Selector (Azure)"]])
+        for model in info["models"][1:]:
+            md_table.append(["", "", "", model])
 
     with open(MD_FILENAME, "w") as f:
-        f.write(dedent(f"""\
+        f.write(
+            dedent(
+                f"""\
         # Deployments Table
 
         Generated by {__file__.rsplit("/", maxsplit=1)[-1]} on {datetime.now().strftime("%Y-%m-%d %H:%M:%S")}.
 
-        """))
+        """
+            )
+        )
 
         header = "| " + " | ".join(md_table[0]) + " |\n"
         f.write(header)