How to evaluate a tranied model?

John6666 · September 5, 2025, 1:08pm

When it comes to step-by-step values, I think the standard approach is to log them during training, like below. While it’s possible to do it afterward, the code becomes significantly more complicated…

args = DPOConfig(
    output_dir="dpo-eval-demo",
    do_train=True,                     # training must run to log stepwise eval
    do_eval=True,
    evaluation_strategy="steps",
    eval_steps=100,
    logging_strategy="steps",
    logging_steps=10,
    report_to="tensorboard",           # or "wandb"
    logging_dir="tb_logs",
    generate_during_eval=False,
    reference_free=True,
)
trainer = DPOTrainer(model=policy, args=args, train_dataset=your_train, eval_dataset=eval_ds, processing_class=tok)
trainer.train()

Topic		Replies	Views
What is "eval/train_loss" in DPO ? is it eval loss or train loss? Beginners	0	38	August 12, 2024
Is it possible to get more results from training and evaluating a model, beside loss? 🤗Transformers	0	267	April 3, 2023
Trainer predict or evaluate returns zero for metrics 🤗Transformers	0	81	July 11, 2024
Identical Evaluation Metrics for SFT & DPO–Fine-Tuned LoRA Adapter on SeaLLMs-v3-7B 🤗Transformers	1	95	May 22, 2025
Trainer.evaluate() 🤗Transformers	3	6916	May 11, 2021

How to evaluate a tranied model?

Related topics