Evaluation¶

Use this async workflow to start model evaluations and poll for completion.

Start async evaluation¶

POST /cr/finetune_model/evaluate_async

Queues evaluation and returns immediately with job_id.

Field	Type	Required	Description
`dataset_name`	string	yes	Dataset id.
`model_name`	string	yes	Model name to evaluate.

Returns

200 OK with evaluation job identifier.

{
  "job_id": "5b6273d2-c7e6-4a8f-a8cd-c4b2f9be17cd",
  "status": "queued"
}

curl -s -X POST "https://cr-api.icosacomputing.com/cr/finetune_model/evaluate_async" \
  -H "Content-Type: application/json" \
  -H "X-API-Key: <your_api_key>" \
  -d '{
    "dataset_name": "your_dataset_name",
    "model_name": "Generalist: Base"
  }'

import requests

resp = requests.post(
    "https://cr-api.icosacomputing.com/cr/finetune_model/evaluate_async",
    headers={"Content-Type": "application/json", "X-API-Key": "<your_api_key>"},
    json={"dataset_name": "your_dataset_name", "model_name": "Generalist: Base"},
    timeout=60,
)
print(resp.json())

const res = await fetch("https://cr-api.icosacomputing.com/cr/finetune_model/evaluate_async", {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    "X-API-Key": "<your_api_key>",
  },
  body: JSON.stringify({ dataset_name: "your_dataset_name", model_name: "Generalist: Base" }),
});

console.log(await res.json());

Poll evaluation status¶

GET /cr/finetune_model/evaluate_status?job_id=...

Poll until status reaches completed or failed.

Field	Type	Required	Description
`job_id`	query string	yes	Job id from async submit.

Returns

200 OK with job status.
Terminal states include completed (with result) and failed (with error).

{
  "status": "completed",
  "result": {
    "dataset_name": "your_dataset_name",
    "model_name": "Generalist: Base",
    "split": "test",
    "correct": 81,
    "total": 100,
    "accuracy": 0.81,
    "judge_model": "gpt-5.4-nano"
  }
}

curl -s "https://cr-api.icosacomputing.com/cr/finetune_model/evaluate_status?job_id=<job_id>" \
  -H "X-API-Key: <your_api_key>"

import requests

resp = requests.get(
    "https://cr-api.icosacomputing.com/cr/finetune_model/evaluate_status",
    headers={"X-API-Key": "<your_api_key>"},
    params={"job_id": "<job_id>"},
    timeout=30,
)
print(resp.json())

const res = await fetch(
  "https://cr-api.icosacomputing.com/cr/finetune_model/evaluate_status?job_id=<job_id>",
  { headers: { "X-API-Key": "<your_api_key>" } }
);

console.log(await res.json());