deepmodeling · njzjz-bot · May 30, 2026 · May 30, 2026 · May 30, 2026 · May 30, 2026
diff --git a/deepmd/pd/train/training.py b/deepmd/pd/train/training.py
@@ -1038,7 +1038,11 @@ def log_loss_valid(_task_key: str = "Default") -> dict:
             if JIT:
                 break
 
-        if self.change_bias_after_training and (self.rank == 0 or dist.get_rank() == 0):
+        if (
+            self.change_bias_after_training
+            and self.num_steps > self.start_step
+            and (self.rank == 0 or dist.get_rank() == 0)
+        ):
             if not self.multi_task:
                 self.model = model_change_out_bias(
                     self.model,

diff --git a/deepmd/pt/train/training.py b/deepmd/pt/train/training.py
@@ -1745,7 +1745,11 @@ def log_loss_valid(_task_key: str = "Default") -> dict:
             if JIT:
                 break
 
-        if self.change_bias_after_training and (self.rank == 0 or dist.get_rank() == 0):
+        if (
+            self.change_bias_after_training
+            and self.num_steps > self.start_step
+            and (self.rank == 0 or dist.get_rank() == 0)
+        ):
             if not self.multi_task:
                 self.model = model_change_out_bias(
                     self.model,

diff --git a/source/tests/pd/test_training.py b/source/tests/pd/test_training.py
@@ -9,8 +9,12 @@
 from pathlib import (
     Path,
 )
+from unittest.mock import (
+    patch,
+)
 
 import numpy as np
+import paddle
 
 from deepmd.pd.entrypoints.main import (
     get_trainer,
@@ -163,6 +167,33 @@ def setUp(self) -> None:
         self.config["training"]["save_freq"] = 1
         enable_prim(True)
 
+    @patch("deepmd.pd.train.training.model_change_out_bias")
+    def test_zero_step_with_change_bias_saves_initial_checkpoint(
+        self, mocked_change_out_bias
+    ) -> None:
+        def keep_model(model, *_args, **_kwargs):
+            return model
+
+        mocked_change_out_bias.side_effect = keep_model
+        config = deepcopy(self.config)
+        config["training"]["numb_steps"] = 0
+        config["training"]["change_bias_after_training"] = True
+        trainer = get_trainer(config)
+        trainer.run()
+
+        expected_model = Path(trainer.save_ckpt + "-0.pd")
+        self.assertEqual(expected_model, trainer.latest_model)
+        self.assertTrue(expected_model.exists())
+        self.assertEqual(
+            expected_model,
+            Path(Path("checkpoint").read_text().strip()),
+        )
+        checkpoint = paddle.load(str(expected_model))
+        train_infos = checkpoint["model"]["_extra_state"]["train_infos"]
+        self.assertEqual(0, train_infos["step"])
+        self.assertEqual(0.0, train_infos["lr"])
+        mocked_change_out_bias.assert_not_called()
+
     def tearDown(self) -> None:
         DPTrainTest.tearDown(self)
 

diff --git a/source/tests/pt/test_training.py b/source/tests/pt/test_training.py
@@ -263,6 +263,33 @@ def test_yaml_input(self) -> None:
         )
         self.assertTrue(Path("out.json").exists())
 
+    @patch("deepmd.pt.train.training.model_change_out_bias")
+    def test_zero_step_with_change_bias_saves_initial_checkpoint(
+        self, mocked_change_out_bias
+    ) -> None:
+        def keep_model(model, *_args, **_kwargs):
+            return model
+
+        mocked_change_out_bias.side_effect = keep_model
+        config = deepcopy(self.config)
+        config["training"]["numb_steps"] = 0
+        config["training"]["change_bias_after_training"] = True
+        trainer = get_trainer(config)
+        trainer.run()
+
+        expected_model = Path(trainer.save_ckpt + "-0.pt")
+        self.assertEqual(expected_model, trainer.latest_model)
+        self.assertTrue(expected_model.exists())
+        self.assertEqual(
+            expected_model,
+            Path(Path("checkpoint").read_text().strip()),
+        )
+        checkpoint = torch.load(expected_model, map_location="cpu", weights_only=True)
+        train_infos = checkpoint["model"]["_extra_state"]["train_infos"]
+        self.assertEqual(0, train_infos["step"])
+        self.assertEqual(0.0, train_infos["lr"])
+        mocked_change_out_bias.assert_not_called()
+
     def tearDown(self) -> None:
         DPTrainTest.tearDown(self)
         for ff in ["out.json", "input.yaml"]: