Comparative Training

In this apply, we use a network to learn this target input, given it's pre-evaluated output:

Gradient Descent

First, we train using basic gradient descent method apply weak line search conditions.

Logging

Reset training subject: 511601635981
Final threshold in iteration 0: -697.4522216796875 (> 0.0) after 0.904s (< 30.000s)

Conjugate Gradient Descent

First, we use a conjugate gradient descent method, which converges the fastest for purely linear functions.

Logging

Reset training subject: 512747274538
Final threshold in iteration 0: -697.4519287109375 (> 0.0) after 0.759s (< 30.000s)

Limited-Memory BFGS

Next, we apply the same optimization using L-BFGS, which is nearly ideal for purely second-order or quadratic functions.

Logging

Reset training subject: 513714141024
Reset training subject: 514103585729
Adding measurement 29513cfe to history. Total: 0
LBFGS Accumulation History: 1 points
Constructing line search parameters: GD
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
th(0)=5.859375E-4;dx=-1.3595581054686197
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(2.154434690031884)=5.859375E-4; dx=5061448.237611033 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(1.077217345015942)=5.859375E-4; dx=2530724.386597046 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(0.3590724483386473)=5.859375E-4; dx=843575.29163355 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(0.08976811208466183)=5.859375E-4; dx=210892.91782378632 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(0.017953622416932366)=5.859375E-4; dx=42178.20453643008 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(0.002992270402822061)=5.859375E-4; dx=7029.559135434851 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(4.2746720040315154E-4)=5.859375E-4; dx=1003.6319732666566 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(5.343340005039394E-5)=5.859375E-4; dx=125.85697174075524 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(5.9370444500437714E-6)=5.859375E-4; dx=13.698577880856378 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(5.937044450043771E-7)=5.859375E-4; dx=-0.5561828613280286 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(5.397313136403428E-8)=5.859375E-4; dx=-1.3595581054686194 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(4.4977609470028565E-9)=5.859375E-4; dx=-1.3595581054686194 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(3.4598161130791205E-10)=5.859375E-4; dx=-1.3595581054686194 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(2.4712972236279432E-11)=5.859375E-4; dx=-1.3595581054686197 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(1.6475314824186289E-12)=5.859375E-4; dx=-1.3595581054686194 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(1.029707176511643E-13)=5.859375E-4; dx=-1.3595581054686197 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
WOLFE (weak): th(6.057101038303783E-15)=5.859375E-4; dx=-1.3595581054686194 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(5.451390934473404E-14)=5.859375E-4; dx=-1.3595581054686197 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
WOLFE (weak): th(3.028550519151891E-14)=5.859375E-4; dx=-1.3595581054686194 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(4.239970726812647E-14)=5.859375E-4; dx=-1.3595581054686197 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
WOLFE (weak): th(3.6342606229822695E-14)=5.859375E-4; dx=-1.3595581054686197 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
WOLFE (weak): th(3.9371156748974584E-14)=5.859375E-4; dx=-1.3595581054686197 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(4.0885432008550525E-14)=5.859375E-4; dx=-1.3595581054686197 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
Armijo: th(4.012829437876256E-14)=5.859375E-4; dx=-1.3595581054686194 evalInputDelta=0.0
Non-optimal measurement 5.859375E-4 < 5.859375E-4. Total: 1
mu >= nu (3.9371156748974584E-14): th(0.0)=5.859375E-4
Fitness changed from 5.859375E-4 to 5.859375E-4
Static Iteration Total: 34.1450; Orientation: 1.2683; Line Search: 31.7043
Iteration 1 failed. Error: 5.859375E-4
Previous Error: 0.0 -> 5.859375E-4
Optimization terminated 1
Final threshold in iteration 1: 5.859375E-4 (> 0.0) after 34.146s (< 30.000s)

Test Modules

Training Characteristics

Input Learning

Gradient Descent

Conjugate Gradient Descent

Limited-Memory BFGS

Results

Results