use MomentumClip in warmup for stability

2017-09-16 17:30:52 +00:00 · 2017-09-16 17:30:52 +00:00 · dcbaef3032
commit dcbaef3032
parent 7878f94f43
1 changed files with 1 additions and 1 deletions
--- a/onn.py
+++ b/onn.py
@ -1273,7 +1273,7 @@ def run(program, args=None):
        # use plain SGD in warmup to prevent (or possibly cause?) numeric issues
        temp_optim = learner.optim
        temp_loss = model.loss
-        learner.optim = Optimizer(lr=0.001)
+        learner.optim = MomentumClip(lr=0.01, mu=0)
        ritual.loss = Absolute() # less likely to blow up; more general

        # NOTE: experiment: trying const batches and batch_size