doxygen/xlink_v30.0.7_2026_05_18_02.03.19/parameters_8py_source.html

# This file is part of scarlet_lite.

#

# Developed for the LSST Data Management System.

# This product includes software developed by the LSST Project

# (https://www.lsst.org).

# See the COPYRIGHT file at the top-level directory of this distribution

# for details of code ownership.

#

# This program is free software: you can redistribute it and/or modify

# it under the terms of the GNU General Public License as published by

# the Free Software Foundation, either version 3 of the License, or

# (at your option) any later version.

#

# This program is distributed in the hope that it will be useful,

# but WITHOUT ANY WARRANTY; without even the implied warranty of

# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

# GNU General Public License for more details.

#

# You should have received a copy of the GNU General Public License

# along with this program.  If not, see <https://www.gnu.org/licenses/>.


from __future__ import annotations


__all__ = [

    "parameter",

    "Parameter",

    "FistaParameter",

    "AdaproxParameter",

    "FixedParameter",

    "relative_step",

    "phi_psi",

    "DEFAULT_ADAPROX_FACTOR",

]


from copy import deepcopy

from typing import Any, Callable, Sequence, cast


import numpy as np

import numpy.typing as npt


from .bbox import Box


# The default factor used for adaprox parameter steps

DEFAULT_ADAPROX_FACTOR = 1e-2


def step_function_wrapper(step: float) -> Callable:

    """Wrapper to make a numerical step into a step function


    Parameters

    ----------

    step:

        The step to take for a given array.


    Returns

    -------

    step_function:

        The step function that takes an array and returns the

        numerical step.

    """

    return lambda x: step


class Parameter:

    """A parameter in a `Component`


    Parameters

    ----------

    x:

        The array of values that is being fit.

    helpers:

        A dictionary of helper arrays that are used by an optimizer to

        persist values like the gradient of `x`, the Hessian of `x`, etc.

    step:

        A numerical step value or function to calculate the step for a

        given `x``.

    grad:

        A function to calculate the gradient of `x`.

    prox:

        A function to take the proximal operator of `x`.

    """


    def __init__(

        self,

        x: np.ndarray,

        helpers: dict[str, np.ndarray],

        step: Callable | float,

        grad: Callable | None = None,

        prox: Callable | None = None,

    ):

        self.x = x

        self.helpers = helpers


        if isinstance(step, float):

            _step = step_function_wrapper(step)

        else:

            _step = step


        self._step = _step

        self.grad = grad

        self.prox = prox


    @property


    def step(self) -> float:

        """Calculate the step


        Return

        ------

        step:

            The numerical step if no iteration is given.

        """

        return self._step(self.x)


    @property


    def shape(self) -> tuple[int, ...]:

        """The shape of the array that is being fit."""

        return self.x.shape


    @property


    def dtype(self) -> npt.DTypeLike:

        """The numpy dtype of the array that is being fit."""

        return self.x.dtype


    def __copy__(self) -> Parameter:

        """Create a shallow copy of this parameter.


        Returns

        -------

        parameter:

            A shallow copy of this parameter.

        """

        helpers = {k: v.copy() for k, v in self.helpers.items()}

        return Parameter(self.x.copy(), helpers, 0)


    def __deepcopy__(self, memo: dict[int, Any] | None = None) -> Parameter:

        """Create a deep copy of this parameter.


        Parameters

        ----------

        memo:

            A memoization dictionary used by `copy.deepcopy`.

        Returns

        -------

        parameter:

            A deep copy of this parameter.

        """

        helpers = {k: deepcopy(v, memo) for k, v in self.helpers.items()}

        return Parameter(deepcopy(self.x, memo), helpers, 0)


    def copy(self, deep: bool = False) -> Parameter:

        """Copy this parameter, including all of the helper arrays.


        Parameters

        ----------

        deep:

            If `True`, a deep copy is made.

            If `False`, a shallow copy is made.


        Returns

        -------

        parameter:

            A copy of this parameter.

        """

        if deep:

            return self.__deepcopy__({})

        return self.__copy__()


    def update(self, it: int, input_grad: np.ndarray, *args):

        """Update the parameter in one iteration.


        This includes the gradient update, proximal update,

        and any meta parameters that are stored as class

        attributes to update the parameter.


        Parameters

        ----------

        it:

            The current iteration

        input_grad:

            The gradient from the full model, passed to the parameter.

        """

        raise NotImplementedError("Base Parameters cannot be updated")


    def resize(self, old_box: Box, new_box: Box):

        """Grow the parameter and all of the helper parameters


        Parameters

        ----------

        old_box:

            The old bounding box for the parameter.

        new_box:

            The new bounding box for the parameter.

        """

        slices = new_box.overlapped_slices(old_box)

        x = np.zeros(new_box.shape, dtype=self.dtype)

        x[slices[0]] = self.x[slices[1]]

        self.x = x


        for name, value in self.helpers.items():

            result = np.zeros(new_box.shape, dtype=self.dtype)

            result[slices[0]] = value[slices[1]]

            self.helpers[name] = result


def parameter(x: np.ndarray | Parameter) -> Parameter:

    """Convert a `np.ndarray` into a `Parameter`.


    Parameters

    ----------

    x:

        The array or parameter to convert into a `Parameter`.


    Returns

    -------

    result:

        `x`, converted into a `Parameter` if necessary.

    """

    if isinstance(x, Parameter):

        return x

    return Parameter(x, {}, 0)


class FistaParameter(Parameter):

    """A `Parameter` that updates itself using the Beck-Teboulle 2009

    FISTA proximal gradient method.


    See https://www.ceremade.dauphine.fr/~carlier/FISTA

    """


    def __init__(

        self,

        x: np.ndarray,

        step: float,

        grad: Callable | None = None,

        prox: Callable | None = None,

        t0: float = 1,

        z0: np.ndarray | None = None,

    ):

        if z0 is None:

            z0 = x.copy()


        super().__init__(

            x,

            {"z": z0},

            step,

            grad,

            prox,

        )

        self.t = t0


    def update(self, it: int, input_grad: np.ndarray, *args):

        """Update the parameter and meta-parameters using the PGM


        See `Parameter` for the full description.

        """

        if len(args) == 0:

            step = self.step

        else:

            step = self.step / np.sum(args[0] * args[0])

        _x = self.x

        _z = self.helpers["z"]


        y = _z - step * cast(Callable, self.grad)(input_grad, _x, *args)

        if self.prox is not None:

            x = self.prox(y)

        else:

            x = y

        t = 0.5 * (1 + np.sqrt(1 + 4 * self.t**2))

        omega = 1 + (self.t - 1) / t

        self.helpers["z"] = _x + omega * (x - _x)

        _x[:] = x

        self.t = t


    def __deepcopy__(self, memo: dict[int, Any] | None = None) -> FistaParameter:

        """Create a deep copy of this parameter.


        Parameters

        ----------

        memo:

            A memoization dictionary used by `copy.deepcopy`.

        Returns

        -------

        parameter:

            A deep copy of this parameter.

        """

        return FistaParameter(

            deepcopy(self.x, memo),

            self.step,

            self.grad,

            self.prox,

            self.t,

            deepcopy(self.helpers["z"], memo),

        )


    def __copy__(self) -> FistaParameter:

        """Create a shallow copy of this parameter.


        Returns

        -------

        parameter:

            A shallow copy of this parameter.

        """

        return FistaParameter(

            self.x.copy(),

            self.step,

            self.grad,

            self.prox,

            self.t,

            self.helpers["z"].copy(),

        )


# The following code block contains different update methods for

# various implementations of ADAM.

# We currently use the `amsgrad_phi_psi` update by default,

# but it can easily be interchanged by passing a different

# variant name to the `AdaproxParameter`.


# noinspection PyUnusedLocal


def _adam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p):

    # moving averages

    m[:] = (1 - b1[it]) * g + b1[it] * m

    v[:] = (1 - b2) * (g**2) + b2 * v


    # bias correction

    t = it + 1

    phi = m / (1 - b1[it] ** t)

    psi = np.sqrt(v / (1 - b2**t)) + eps

    return phi, psi


# noinspection PyUnusedLocal


def _nadam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p):

    # moving averages

    m[:] = (1 - b1[it]) * g + b1[it] * m

    v[:] = (1 - b2) * (g**2) + b2 * v


    # bias correction

    t = it + 1

    phi = (b1[it] * m[:] + (1 - b1[it]) * g) / (1 - b1[it] ** t)

    psi = np.sqrt(v / (1 - b2**t)) + eps

    return phi, psi


# noinspection PyUnusedLocal


def _amsgrad_phi_psi(it, g, m, v, vhat, b1, b2, eps, p):

    # moving averages

    m[:] = (1 - b1[it]) * g + b1[it] * m

    v[:] = (1 - b2) * (g**2) + b2 * v


    phi = m

    vhat[:] = np.maximum(vhat, v)

    # sanitize zero-gradient elements

    if eps > 0:

        vhat = np.maximum(vhat, eps)

    psi = np.sqrt(vhat)

    return phi, psi


def _padam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p):

    # moving averages

    m[:] = (1 - b1[it]) * g + b1[it] * m

    v[:] = (1 - b2) * (g**2) + b2 * v


    phi = m

    vhat[:] = np.maximum(vhat, v)

    # sanitize zero-gradient elements

    if eps > 0:

        vhat = np.maximum(vhat, eps)

    psi = vhat**p

    return phi, psi


# noinspection PyUnusedLocal


def _adamx_phi_psi(it, g, m, v, vhat, b1, b2, eps, p):

    # moving averages

    m[:] = (1 - b1[it]) * g + b1[it] * m

    v[:] = (1 - b2) * (g**2) + b2 * v


    phi = m

    factor = (1 - b1[it]) ** 2 / (1 - b1[it - 1]) ** 2

    vhat[:] = np.maximum(factor * vhat, v)

    # sanitize zero-gradient elements

    if eps > 0:

        vhat = np.maximum(vhat, eps)

    psi = np.sqrt(vhat)

    return phi, psi


# noinspection PyUnusedLocal


def _radam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p):

    rho_inf = 2 / (1 - b2) - 1


    # moving averages

    m[:] = (1 - b1[it]) * g + b1[it] * m

    v[:] = (1 - b2) * (g**2) + b2 * v


    # bias correction

    t = it + 1

    phi = m / (1 - b1[it] ** t)

    rho = rho_inf - 2 * t * b2**t / (1 - b2**t)


    if rho > 4:

        psi = np.sqrt(v / (1 - b2**t))

        r = np.sqrt((rho - 4) * (rho - 2) * rho_inf / (rho_inf - 4) / (rho_inf - 2) / rho)

        psi /= r

    else:

        psi = np.ones(g.shape, g.dtype)

    # sanitize zero-gradient elements

    if eps > 0:

        psi = np.maximum(psi, np.sqrt(eps))

    return phi, psi


# Dictionary to link ADAM variation names to their functional algorithms.


phi_psi = {

    "adam": _adam_phi_psi,

    "nadam": _nadam_phi_psi,

    "amsgrad": _amsgrad_phi_psi,

    "padam": _padam_phi_psi,

    "adamx": _adamx_phi_psi,

    "radam": _radam_phi_psi,

}


class SingleItemArray:

    """Mock an array with only a single item"""


    def __init__(self, value):

        self.value = value


    def __getitem__(self, item):

        return self.value


class AdaproxParameter(Parameter):

    """Operator updated using te Proximal ADAM algorithm


    Uses multiple variants of adaptive quasi-Newton gradient descent

        * Adam (Kingma & Ba 2015)

        * NAdam (Dozat 2016)

        * AMSGrad (Reddi, Kale & Kumar 2018)

        * PAdam (Chen & Gu 2018)

        * AdamX (Phuong & Phong 2019)

        * RAdam (Liu et al. 2019)

    See details of the algorithms in the respective papers.

    """


    def __init__(

        self,

        x: np.ndarray,

        step: Callable | float,

        grad: Callable | None = None,

        prox: Callable | None = None,

        b1: float | SingleItemArray = 0.9,

        b2: float = 0.999,

        eps: float = 1e-8,

        p: float = 0.25,

        m0: np.ndarray | None = None,

        v0: np.ndarray | None = None,

        vhat0: np.ndarray | None = None,

        scheme: str = "amsgrad",

        prox_e_rel: float = 1e-6,

    ):

        shape = x.shape

        dtype = x.dtype

        if m0 is None:

            m0 = np.zeros(shape, dtype=dtype)


        if v0 is None:

            v0 = np.zeros(shape, dtype=dtype)


        if vhat0 is None:

            vhat0 = np.ones(shape, dtype=dtype) * -np.inf


        super().__init__(

            x,

            {

                "m": m0,

                "v": v0,

                "vhat": vhat0,

            },

            step,

            grad,

            prox,

        )


        if isinstance(b1, float):

            _b1 = SingleItemArray(b1)

        else:

            _b1 = b1


        self.b1 = _b1

        self.b2 = b2

        self.eps = eps

        self.p = p


        self.scheme = scheme

        self.phi_psi = phi_psi[scheme]

        self.e_rel = prox_e_rel


    def update(self, it: int, input_grad: np.ndarray, *args):

        """Update the parameter and meta-parameters using the PGM


        See `~Parameter` for more.

        """

        _x = self.x

        # Calculate the gradient

        grad = cast(Callable, self.grad)(input_grad, _x, *args)

        # Get the update for the parameter

        phi, psi = self.phi_psi(

            it,

            grad,

            self.helpers["m"],

            self.helpers["v"],

            self.helpers["vhat"],

            self.b1,

            self.b2,

            self.eps,

            self.p,

        )

        # Calculate the step size

        step = self.step

        if it > 0:

            _x += -step * phi / psi

        else:

            # This is a scheme that Peter Melchior and I came up with to

            # dampen the known affect of ADAM, where the first iteration

            # is often much larger than desired.

            _x += -step * phi / psi / 10


        self.x = cast(Callable, self.prox)(_x)


    def __deepcopy__(self, memo: dict[int, Any] | None = None) -> AdaproxParameter:

        """Create a deep copy of this parameter.


        Parameters

        ----------

        memo:

            A memoization dictionary used by `copy.deepcopy`.

        Returns

        -------

        parameter:

            A deep copy of this parameter.

        """

        return AdaproxParameter(

            deepcopy(self.x, memo),

            self.step,

            self.grad,

            self.prox,

            self.b1,

            self.b2,

            self.eps,

            self.p,

            deepcopy(self.helpers["m"], memo),

            deepcopy(self.helpers["v"], memo),

            deepcopy(self.helpers["vhat"], memo),

            scheme=self.scheme,

            prox_e_rel=self.e_rel,

        )


    def __copy__(self) -> AdaproxParameter:

        """Create a shallow copy of this parameter.


        Returns

        -------

        parameter:

            A shallow copy of this parameter.

        """

        return AdaproxParameter(

            self.x,

            self.step,

            self.grad,

            self.prox,

            self.b1,

            self.b2,

            self.eps,

            self.p,

            self.helpers["m"],

            self.helpers["v"],

            self.helpers["vhat"],

            scheme=self.scheme,

            prox_e_rel=self.e_rel,

        )


class FixedParameter(Parameter):

    """A parameter that is not updated"""


    def __init__(self, x: np.ndarray):

        super().__init__(x, {}, 0)


    def update(self, it: int, input_grad: np.ndarray, *args):

        pass


    def __copy__(self) -> FixedParameter:

        """Create a shallow copy of this parameter.


        Returns

        -------

        parameter:

            A shallow copy of this parameter.

        """

        return FixedParameter(self.x)


    def __deepcopy__(self, memo: dict[int, Any] | None = None) -> FixedParameter:

        """Create a deep copy of this parameter.


        Parameters

        ----------

        memo:

            A memoization dictionary used by `copy.deepcopy`.


        Returns

        -------

        parameter:

            A deep copy of this parameter.

        """

        return FixedParameter(deepcopy(self.x, memo))


def relative_step(

    x: np.ndarray,

    factor: float = 0.1,

    minimum: float = 0,

    axis: int | Sequence[int] | None = None,

):

    """Step size set at `factor` times the mean of `X` in direction `axis`"""

    return np.maximum(minimum, factor * x.mean(axis=axis))


lsst.scarlet.lite.parameters.AdaproxParameter
Definition parameters.py:437

lsst.scarlet.lite.parameters.AdaproxParameter.eps
eps
Definition parameters.py:496

lsst.scarlet.lite.parameters.AdaproxParameter.b2
b2
Definition parameters.py:495

lsst.scarlet.lite.parameters.AdaproxParameter.phi_psi
phi_psi
Definition parameters.py:500

lsst.scarlet.lite.parameters.AdaproxParameter.update
update(self, int it, np.ndarray input_grad, *args)
Definition parameters.py:503

lsst.scarlet.lite.parameters.AdaproxParameter.__init__
__init__(self, np.ndarray x, Callable|float step, Callable|None grad=None, Callable|None prox=None, float|SingleItemArray b1=0.9, float b2=0.999, float eps=1e-8, float p=0.25, np.ndarray|None m0=None, np.ndarray|None v0=None, np.ndarray|None vhat0=None, str scheme="amsgrad", float prox_e_rel=1e-6)
Definition parameters.py:465

lsst.scarlet.lite.parameters.AdaproxParameter.p
p
Definition parameters.py:497

lsst.scarlet.lite.parameters.AdaproxParameter.scheme
scheme
Definition parameters.py:499

lsst.scarlet.lite.parameters.AdaproxParameter.b1
b1
Definition parameters.py:494

lsst.scarlet.lite.parameters.AdaproxParameter.__deepcopy__
AdaproxParameter __deepcopy__(self, dict[int, Any]|None memo=None)
Definition parameters.py:535

lsst.scarlet.lite.parameters.AdaproxParameter.e_rel
e_rel
Definition parameters.py:501

lsst.scarlet.lite.parameters.AdaproxParameter.__copy__
AdaproxParameter __copy__(self)
Definition parameters.py:563

lsst.scarlet.lite.parameters.FistaParameter
Definition parameters.py:223

lsst.scarlet.lite.parameters.FistaParameter.__deepcopy__
FistaParameter __deepcopy__(self, dict[int, Any]|None memo=None)
Definition parameters.py:274

lsst.scarlet.lite.parameters.FistaParameter.__init__
__init__(self, np.ndarray x, float step, Callable|None grad=None, Callable|None prox=None, float t0=1, np.ndarray|None z0=None)
Definition parameters.py:238

lsst.scarlet.lite.parameters.FistaParameter.update
update(self, int it, np.ndarray input_grad, *args)
Definition parameters.py:251

lsst.scarlet.lite.parameters.FistaParameter.__copy__
FistaParameter __copy__(self)
Definition parameters.py:295

lsst.scarlet.lite.parameters.FistaParameter.t
t
Definition parameters.py:249

lsst.scarlet.lite.parameters.FixedParameter
Definition parameters.py:588

lsst.scarlet.lite.parameters.FixedParameter.__deepcopy__
FixedParameter __deepcopy__(self, dict[int, Any]|None memo=None)
Definition parameters.py:607

lsst.scarlet.lite.parameters.FixedParameter.__init__
__init__(self, np.ndarray x)
Definition parameters.py:591

lsst.scarlet.lite.parameters.FixedParameter.update
update(self, int it, np.ndarray input_grad, *args)
Definition parameters.py:594

lsst.scarlet.lite.parameters.FixedParameter.__copy__
FixedParameter __copy__(self)
Definition parameters.py:597

lsst.scarlet.lite.parameters.Parameter
Definition parameters.py:64

lsst.scarlet.lite.parameters.Parameter.grad
grad
Definition parameters.py:100

lsst.scarlet.lite.parameters.Parameter.resize
resize(self, Box old_box, Box new_box)
Definition parameters.py:184

lsst.scarlet.lite.parameters.Parameter.__init__
__init__(self, np.ndarray x, dict[str, np.ndarray] helpers, Callable|float step, Callable|None grad=None, Callable|None prox=None)
Definition parameters.py:90

lsst.scarlet.lite.parameters.Parameter.__deepcopy__
Parameter __deepcopy__(self, dict[int, Any]|None memo=None)
Definition parameters.py:135

lsst.scarlet.lite.parameters.Parameter.x
x
Definition parameters.py:91

lsst.scarlet.lite.parameters.Parameter._step
_step
Definition parameters.py:99

lsst.scarlet.lite.parameters.Parameter.dtype
npt.DTypeLike dtype(self)
Definition parameters.py:120

lsst.scarlet.lite.parameters.Parameter.copy
Parameter copy(self, bool deep=False)
Definition parameters.py:150

lsst.scarlet.lite.parameters.Parameter.shape
tuple[int,...] shape(self)
Definition parameters.py:115

lsst.scarlet.lite.parameters.Parameter.step
float step(self)
Definition parameters.py:104

lsst.scarlet.lite.parameters.Parameter.helpers
helpers
Definition parameters.py:92

lsst.scarlet.lite.parameters.Parameter.update
update(self, int it, np.ndarray input_grad, *args)
Definition parameters.py:168

lsst.scarlet.lite.parameters.Parameter.prox
prox
Definition parameters.py:101

lsst.scarlet.lite.parameters.Parameter.__copy__
Parameter __copy__(self)
Definition parameters.py:124

lsst.scarlet.lite.parameters.SingleItemArray
Definition parameters.py:427

lsst.scarlet.lite.parameters.SingleItemArray.__init__
__init__(self, value)
Definition parameters.py:430

lsst.scarlet.lite.parameters.SingleItemArray.__getitem__
__getitem__(self, item)
Definition parameters.py:433

lsst.scarlet.lite.parameters.SingleItemArray.value
value
Definition parameters.py:431

lsst.scarlet.lite.parameters._padam_phi_psi
_padam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p)
Definition parameters.py:361

lsst.scarlet.lite.parameters._radam_phi_psi
_radam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p)
Definition parameters.py:392

lsst.scarlet.lite.parameters.step_function_wrapper
Callable step_function_wrapper(float step)
Definition parameters.py:47

lsst.scarlet.lite.parameters._amsgrad_phi_psi
_amsgrad_phi_psi(it, g, m, v, vhat, b1, b2, eps, p)
Definition parameters.py:347

lsst.scarlet.lite.parameters._nadam_phi_psi
_nadam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p)
Definition parameters.py:334

lsst.scarlet.lite.parameters._adamx_phi_psi
_adamx_phi_psi(it, g, m, v, vhat, b1, b2, eps, p)
Definition parameters.py:376

lsst.scarlet.lite.parameters.parameter
Parameter parameter(np.ndarray|Parameter x)
Definition parameters.py:205

lsst.scarlet.lite.parameters.relative_step
relative_step(np.ndarray x, float factor=0.1, float minimum=0, int|Sequence[int]|None axis=None)
Definition parameters.py:628

lsst.scarlet.lite.parameters._adam_phi_psi
_adam_phi_psi(it, g, m, v, vhat, b1, b2, eps, p)
Definition parameters.py:321