评估(Eval)概览
评估系统由两部分组成:
- Evaluator:组合多个
BaseMetric,负责 state 注入、批处理与汇总评估; - BaseMetric:定义批处理
process与整体验证集compute_metrics/evaluate。
与 Runner 的联动:
- 在
Runner.setup_evaluator中,为train/valid/test三个阶段的 evaluator 注入RunnerState; - 在
TrainLoop.register_model_output中,将包含loss的指标注册到registry.metric.*,Evaluator 的结果也会注册用于日志/回调。