Benchmark Results - 20260310T094843

Model Selection (6-slot / 2-socket)

Slot	Socket	Role	Model	Composite Score
1	Node 1 (port 11434)	General (locked)	llama3.2:3b	0.814
2	Node 1 (port 11434)	General (locked)	gemma3:12b-it-q4_K_M	0.484
5	Node 1 (port 11434)	General (rotate)	none	N/A
3	Node 0 (port 11435)	Coding (locked)	deepseek-coder-v2:latest	0.693
4	Node 0 (port 11435)	Coding (locked)	qwen2.5-coder:7b	0.638
6	Node 0 (port 11435)	Coding (rotate)	none	N/A

Composite = quality * 0.45 + token_speed_normalized * 0.30 + latency_score * 0.25
Speed normalized against 40 tok/sec ceiling (hardware-observed max)
Coding quality (per-prompt): code_gen: has_def×0.20 + has_return×0.20 + has_docstring×0.15 + has_type_hint×0.15 + has_code_block×0.10 + has_assert×0.08 + has_test_def×0.07 + has_import×0.05 debug: has_def×0.30 + has_return×0.30 + has_code_block×0.25 + has_assert×0.15 refactor: has_def×0.25 + has_return×0.25 + has_code_block×0.20 + has_type_hint×0.15 + has_import×0.15
Category: override dict → quality delta (coding_avg - general_avg >= 0.1) → name pattern (coder/codestral/codellama/starcoder) → general