avocet/web/src/views/StatsView.vue

<template>
  <div class="stats-view">
    <h1 class="page-title">📊 Statistics</h1>

    <div v-if="loading" class="loading">Loading…</div>

    <div v-else-if="error" class="error-notice" role="alert">
      {{ error }} <button class="btn-secondary" @click="load">Retry</button>
    </div>

    <template v-else>
      <p class="total-count">
        <strong>{{ stats.total.toLocaleString() }}</strong> emails labeled total
      </p>

      <div v-if="stats.total === 0" class="empty-notice">
        No labeled emails yet — go to <strong>Label</strong> to start labeling.
      </div>

      <div v-else class="label-bars">
        <div
          v-for="row in rows"
          :key="row.name"
          class="bar-row"
        >
          <span class="bar-emoji" aria-hidden="true">{{ row.emoji }}</span>
          <span class="bar-label">{{ row.name.replace(/_/g, '\u00a0') }}</span>
          <div class="bar-track" :title="`${row.count} (${row.pct}%)`">
            <div
              class="bar-fill"
              :style="{ width: `${row.pct}%`, background: row.color }"
            />
          </div>
          <span class="bar-count">{{ row.count.toLocaleString() }}</span>
        </div>
      </div>

      <!-- Benchmark Results -->
      <template v-if="benchRows.length > 0">
        <h2 class="section-title">🏁 Benchmark Results</h2>
        <div class="bench-table-wrap">
          <table class="bench-table">
            <thead>
              <tr>
                <th class="bt-model-col">Model</th>
                <th
                  v-for="m in BENCH_METRICS"
                  :key="m.key as string"
                  class="bt-metric-col"
                >{{ m.label }}</th>
              </tr>
            </thead>
            <tbody>
              <tr v-for="row in benchRows" :key="row.name">
                <td class="bt-model-cell" :title="row.name">{{ row.name }}</td>
                <td
                  v-for="m in BENCH_METRICS"
                  :key="m.key as string"
                  class="bt-metric-cell"
                  :class="{ 'bt-best': bestByMetric[m.key as string] === row.name }"
                >
                  {{ formatMetric(row.result[m.key]) }}
                </td>
              </tr>
            </tbody>
          </table>
        </div>
        <p class="bench-hint">Highlighted cells are the best-scoring model per metric.</p>
      </template>

      <!-- LLM Benchmark Results -->
      <template v-if="llmResults.length > 0">
        <h2 class="section-title">🤖 LLM Benchmark</h2>
        <div class="bench-table-wrap">
          <table class="bench-table">
            <thead>
              <tr>
                <th class="bt-model-col">Model</th>
                <th class="bt-metric-col">overall</th>
                <th
                  v-for="col in llmTaskTypeCols"
                  :key="col"
                  class="bt-metric-col"
                >{{ col }}</th>
                <th class="bt-metric-col">tok/s</th>
              </tr>
            </thead>
            <tbody>
              <tr v-for="row in llmResults" :key="row.model_id">
                <td class="bt-model-cell" :title="row.model_id">{{ row.model_name }}</td>
                <td
                  class="bt-metric-cell"
                  :class="{ 'bt-best': llmBestByCol['overall'] === row.model_id }"
                >{{ llmPct(row.avg_quality_score) }}</td>
                <td
                  v-for="col in llmTaskTypeCols"
                  :key="col"
                  class="bt-metric-cell"
                  :class="{ 'bt-best': llmBestByCol[col] === row.model_id }"
                >{{ row.quality_by_task_type[col] != null ? llmPct(row.quality_by_task_type[col]) : '—' }}</td>
                <td class="bt-metric-cell">{{ row.avg_tokens_per_sec.toFixed(1) }}</td>
              </tr>
            </tbody>
          </table>
        </div>
        <p class="bench-hint">Run LLM Eval on the Benchmark tab to refresh. Highlighted = best per column.</p>
      </template>

      <div class="file-info">
        <span class="file-path">Score file: <code>data/email_score.jsonl</code></span>
        <span class="file-size">{{ fileSizeLabel }}</span>
      </div>

      <div class="action-bar">
        <button class="btn-secondary" @click="load">🔄 Refresh</button>
        <a class="btn-secondary" href="/api/stats/download" download="email_score.jsonl">
          ⬇️ Download
        </a>
      </div>
    </template>
  </div>
</template>

<script setup lang="ts">
import { ref, computed, onMounted } from 'vue'
import { useApiFetch } from '../composables/useApi'

interface BenchmarkModelResult {
  accuracy?: number
  macro_f1?: number
  weighted_f1?: number
  [key: string]: number | undefined
}

interface LlmModelResult {
  model_name: string
  model_id: string
  node_id: string
  avg_tokens_per_sec: number
  avg_completion_ms: number
  avg_quality_score: number
  finetune_candidates: number
  error_count: number
  quality_by_task_type: Record<string, number>
}

interface StatsResponse {
  total: number
  counts: Record<string, number>
  score_file_bytes: number
  benchmark_results?: Record<string, BenchmarkModelResult>
}

// Canonical label order + metadata
const LABEL_META: Record<string, { emoji: string; color: string }> = {
  interview_scheduled: { emoji: '🗓️', color: '#4CAF50' },
  offer_received:      { emoji: '🎉', color: '#2196F3' },
  rejected:            { emoji: '❌', color: '#F44336' },
  positive_response:   { emoji: '👍', color: '#FF9800' },
  survey_received:     { emoji: '📋', color: '#9C27B0' },
  neutral:             { emoji: '⬜', color: '#607D8B' },
  event_rescheduled:   { emoji: '🔄', color: '#FF5722' },
  digest:              { emoji: '📰', color: '#00BCD4' },
  new_lead:            { emoji: '🤝', color: '#009688' },
  hired:               { emoji: '🎊', color: '#FFC107' },
}

const CANONICAL_ORDER = Object.keys(LABEL_META)

const stats   = ref<StatsResponse>({ total: 0, counts: {}, score_file_bytes: 0 })
const loading = ref(true)
const error   = ref('')

const rows = computed(() => {
  const max = Math.max(...Object.values(stats.value.counts), 1)
  const allLabels = [
    ...CANONICAL_ORDER,
    ...Object.keys(stats.value.counts).filter(k => !CANONICAL_ORDER.includes(k)),
  ].filter(k => stats.value.counts[k] > 0)

  return allLabels.map(name => {
    const count = stats.value.counts[name] ?? 0
    const meta  = LABEL_META[name] ?? { emoji: '🏷️', color: '#607D8B' }
    return {
      name,
      count,
      emoji: meta.emoji,
      color: meta.color,
      pct: Math.round((count / max) * 100),
    }
  })
})

const fileSizeLabel = computed(() => {
  const b = stats.value.score_file_bytes
  if (b === 0) return '(file not found)'
  if (b < 1024) return `${b} B`
  if (b < 1024 * 1024) return `${(b / 1024).toFixed(1)} KB`
  return `${(b / 1024 / 1024).toFixed(2)} MB`
})

// Benchmark results helpers
const BENCH_METRICS: Array<{ key: keyof BenchmarkModelResult; label: string }> = [
  { key: 'accuracy',    label: 'Accuracy' },
  { key: 'macro_f1',   label: 'Macro F1' },
  { key: 'weighted_f1', label: 'Weighted F1' },
]

const benchRows = computed(() => {
  const br = stats.value.benchmark_results
  if (!br || Object.keys(br).length === 0) return []
  return Object.entries(br).map(([name, result]) => ({ name, result }))
})

// Find the best model name for each metric
const bestByMetric = computed((): Record<string, string> => {
  const result: Record<string, string> = {}
  for (const { key } of BENCH_METRICS) {
    let bestName = ''
    let bestVal  = -Infinity
    for (const { name, result: r } of benchRows.value) {
      const v = r[key]
      if (v != null && v > bestVal) { bestVal = v; bestName = name }
    }
    result[key as string] = bestName
  }
  return result
})

function formatMetric(v: number | undefined): string {
  if (v == null) return '—'
  // Values in 0-1 range: format as percentage
  if (v <= 1) return `${(v * 100).toFixed(1)}%`
  // Already a percentage
  return `${v.toFixed(1)}%`
}

// ── LLM Benchmark results ────────────────────────────────────────────────────
const llmResults = ref<LlmModelResult[]>([])

const llmTaskTypeCols = computed(() => {
  const types = new Set<string>()
  for (const r of llmResults.value) {
    for (const k of Object.keys(r.quality_by_task_type)) types.add(k)
  }
  return [...types].sort()
})

const llmBestByCol = computed((): Record<string, string> => {
  const best: Record<string, string> = {}
  if (llmResults.value.length === 0) return best

  let bestId = '', bestVal = -Infinity
  for (const r of llmResults.value) {
    if (r.avg_quality_score > bestVal) { bestVal = r.avg_quality_score; bestId = r.model_id }
  }
  best['overall'] = bestId

  for (const col of llmTaskTypeCols.value) {
    bestId = ''; bestVal = -Infinity
    for (const r of llmResults.value) {
      const v = r.quality_by_task_type[col]
      if (v != null && v > bestVal) { bestVal = v; bestId = r.model_id }
    }
    best[col] = bestId
  }
  return best
})

function llmPct(v: number): string {
  return `${(v * 100).toFixed(1)}%`
}

async function loadLlmResults() {
  const { data } = await useApiFetch<LlmModelResult[]>('/api/cforch/results')
  if (Array.isArray(data) && data.length > 0) {
    llmResults.value = data
  }
}

async function load() {
  loading.value = true
  error.value   = ''
  const { data, error: err } = await useApiFetch<StatsResponse>('/api/stats')
  loading.value = false
  if (err || !data) {
    error.value = 'Could not reach Avocet API.'
  } else {
    stats.value = data
  }
}

onMounted(() => {
  load()
  loadLlmResults()
})
</script>

<style scoped>
.stats-view {
  max-width: 640px;
  margin: 0 auto;
  padding: 1.5rem 1rem 4rem;
  display: flex;
  flex-direction: column;
  gap: 1.5rem;
}

.page-title {
  font-family: var(--font-display, var(--font-body, sans-serif));
  font-size: 1.4rem;
  font-weight: 700;
  color: var(--app-primary, #2A6080);
}

.total-count {
  font-size: 1rem;
  color: var(--color-text-secondary, #6b7a99);
}

.label-bars {
  display: flex;
  flex-direction: column;
  gap: 0.5rem;
}

.bar-row {
  display: grid;
  grid-template-columns: 1.5rem 11rem 1fr 3.5rem;
  align-items: center;
  gap: 0.5rem;
  font-size: 0.88rem;
}

.bar-emoji { text-align: center; }

.bar-label {
  font-family: var(--font-mono, monospace);
  font-size: 0.78rem;
  color: var(--color-text, #1a2338);
  white-space: nowrap;
  overflow: hidden;
  text-overflow: ellipsis;
}

.bar-track {
  height: 14px;
  background: var(--color-surface-raised, #e4ebf5);
  border-radius: 99px;
  overflow: hidden;
}

.bar-fill {
  height: 100%;
  border-radius: 99px;
  transition: width 0.4s ease;
}

.bar-count {
  text-align: right;
  font-variant-numeric: tabular-nums;
  color: var(--color-text-secondary, #6b7a99);
  font-size: 0.82rem;
}

.file-info {
  display: flex;
  align-items: center;
  gap: 1rem;
  font-size: 0.8rem;
  color: var(--color-text-secondary, #6b7a99);
}

.file-path code {
  font-family: var(--font-mono, monospace);
  background: var(--color-surface-raised, #e4ebf5);
  padding: 0.1rem 0.3rem;
  border-radius: 0.2rem;
}

.action-bar {
  display: flex;
  gap: 0.75rem;
  align-items: center;
}

.btn-secondary {
  padding: 0.4rem 0.9rem;
  border-radius: 0.375rem;
  border: 1px solid var(--color-border, #d0d7e8);
  background: var(--color-surface, #fff);
  color: var(--color-text, #1a2338);
  font-size: 0.85rem;
  cursor: pointer;
  text-decoration: none;
  font-family: var(--font-body, sans-serif);
  transition: background 0.15s;
}

.btn-secondary:hover {
  background: var(--color-surface-raised, #e4ebf5);
}

.loading, .error-notice, .empty-notice {
  color: var(--color-text-secondary, #6b7a99);
  font-size: 0.9rem;
  padding: 1rem;
}

/* ── Benchmark Results ──────────────────────────── */
.section-title {
  font-family: var(--font-display, var(--font-body, sans-serif));
  font-size: 1.05rem;
  font-weight: 700;
  color: var(--app-primary, #2A6080);
  margin: 0;
}

.bench-table-wrap {
  overflow-x: auto;
  border: 1px solid var(--color-border, #d0d7e8);
  border-radius: 0.5rem;
}

.bench-table {
  border-collapse: collapse;
  width: 100%;
  font-size: 0.82rem;
}

.bt-model-col {
  text-align: left;
  padding: 0.45rem 0.75rem;
  background: var(--color-surface-raised, #e4ebf5);
  border-bottom: 1px solid var(--color-border, #d0d7e8);
  font-weight: 600;
  min-width: 12rem;
}

.bt-metric-col {
  text-align: right;
  padding: 0.45rem 0.75rem;
  background: var(--color-surface-raised, #e4ebf5);
  border-bottom: 1px solid var(--color-border, #d0d7e8);
  font-weight: 600;
  white-space: nowrap;
  min-width: 6rem;
}

.bt-model-cell {
  padding: 0.4rem 0.75rem;
  border-top: 1px solid var(--color-border, #d0d7e8);
  font-family: var(--font-mono, monospace);
  font-size: 0.76rem;
  white-space: nowrap;
  overflow: hidden;
  text-overflow: ellipsis;
  max-width: 16rem;
  color: var(--color-text, #1a2338);
}

.bt-metric-cell {
  padding: 0.4rem 0.75rem;
  border-top: 1px solid var(--color-border, #d0d7e8);
  text-align: right;
  font-family: var(--font-mono, monospace);
  font-variant-numeric: tabular-nums;
  color: var(--color-text, #1a2338);
}

.bt-metric-cell.bt-best {
  color: var(--color-success, #3a7a32);
  font-weight: 700;
  background: color-mix(in srgb, var(--color-success, #3a7a32) 8%, transparent);
}

.bench-hint {
  font-size: 0.75rem;
  color: var(--color-text-secondary, #6b7a99);
  margin: 0;
}

@media (max-width: 480px) {
  .bar-row {
    grid-template-columns: 1.5rem 1fr 1fr 3rem;
  }
  .bar-label {
    display: none;
  }
}
</style>