跳到主要内容

评估(Eval)概览

评估系统由两部分组成:

  • Evaluator:组合多个 BaseMetric,负责 state 注入、批处理与汇总评估;
  • BaseMetric:定义批处理 process 与整体验证集 compute_metrics/evaluate

与 Runner 的联动:

  • Runner.setup_evaluator 中,为 train/valid/test 三个阶段的 evaluator 注入 RunnerState
  • TrainLoop.register_model_output 中,将包含 loss 的指标注册到 registry.metric.*,Evaluator 的结果也会注册用于日志/回调。