diff --git a/app/eval/cforch.py b/app/eval/cforch.py
index 62d28e0..f498170 100644
--- a/app/eval/cforch.py
+++ b/app/eval/cforch.py
@@ -18,12 +18,14 @@ from app.cforch import router as _cforch_router
 from app.style import router as _style_router
 from app.voice import router as _voice_router
 from app.plans_bench import router as _plans_router
+from app.eval.embed_bench import router as _embed_router
 
 router = APIRouter()
 router.include_router(_cforch_router, prefix="/cforch")
 router.include_router(_style_router, prefix="/style")
 router.include_router(_voice_router, prefix="/voice")
 router.include_router(_plans_router, prefix="/plans-bench")
+router.include_router(_embed_router, prefix="/embed-bench")
 
 
 def set_config_dir(path) -> None:
@@ -32,7 +34,9 @@ def set_config_dir(path) -> None:
     import app.style as _style_mod
     import app.voice as _voice_mod
     import app.plans_bench as _plans_mod
+    import app.eval.embed_bench as _embed_mod
     _cforch_mod.set_config_dir(path)
     _style_mod.set_config_dir(path)
     _voice_mod.set_config_dir(path)
     _plans_mod.set_config_dir(path)
+    _embed_mod.set_config_dir(path)
diff --git a/app/eval/embed_bench.py b/app/eval/embed_bench.py
index 0e32b5f..e62efce 100644
--- a/app/eval/embed_bench.py
+++ b/app/eval/embed_bench.py
@@ -83,3 +83,23 @@ def _cosine(a: list[float], b: list[float]) -> float:
     if mag_a == 0.0 or mag_b == 0.0:
         return 0.0
     return dot / (mag_a * mag_b)
+
+
+# ── GET /models ───────────────────────────────────────────────────────────────
+
+@router.get("/models")
+def get_models() -> dict:
+    """Return Ollama embedding models available on the configured instance."""
+    ollama = _ollama_url()
+    models: list[dict] = []
+    try:
+        resp = httpx.get(f"{ollama}/api/tags", timeout=5.0)
+        resp.raise_for_status()
+        for entry in resp.json().get("models", []):
+            models.append({
+                "name": entry.get("name", ""),
+                "size": entry.get("size", 0),
+            })
+    except Exception as exc:
+        logger.warning("Failed to list Ollama models: %s", exc)
+    return {"models": models, "ollama_url": ollama}
diff --git a/tests/test_embed_bench.py b/tests/test_embed_bench.py
index bd3b77e..180517c 100644
--- a/tests/test_embed_bench.py
+++ b/tests/test_embed_bench.py
@@ -53,3 +53,39 @@ def test_cosine_opposite():
 def test_cosine_zero_vector_returns_zero():
     from app.eval.embed_bench import _cosine
     assert _cosine([0.0, 0.0], [1.0, 0.0]) == pytest.approx(0.0)
+
+
+# ── models endpoint ────────────────────────────────────────────────────────────
+
+def test_models_returns_list_with_mock(client, tmp_path):
+    """GET /api/embed-bench/models returns list from Ollama tags endpoint."""
+    import yaml
+    cfg = {"cforch": {"ollama_url": "http://localhost:11434"}}
+    (tmp_path / "label_tool.yaml").write_text(yaml.dump(cfg))
+
+    mock_resp = MagicMock()
+    mock_resp.status_code = 200
+    mock_resp.json.return_value = {
+        "models": [
+            {"name": "nomic-embed-text", "size": 274302480},
+            {"name": "mxbai-embed-large", "size": 669000000},
+        ]
+    }
+    mock_resp.raise_for_status = MagicMock()
+
+    with patch("httpx.get", return_value=mock_resp):
+        r = client.get("/api/embed-bench/models")
+
+    assert r.status_code == 200
+    data = r.json()
+    assert isinstance(data["models"], list)
+    assert any(m["name"] == "nomic-embed-text" for m in data["models"])
+
+
+def test_models_returns_empty_on_ollama_error(client, tmp_path):
+    """GET /api/embed-bench/models returns empty list if Ollama unreachable."""
+    import httpx
+    with patch("httpx.get", side_effect=httpx.ConnectError("refused")):
+        r = client.get("/api/embed-bench/models")
+    assert r.status_code == 200
+    assert r.json()["models"] == []