Refactoring project file structure

duchesnay commented 10 years ago

Refactoring functions.py

functions.py is too big: it hard to understand with a low modularity that will cause many merge conflicts. I propose to refactor this file in order to increase the project modularity. My proposition,

functions.py, estimators.py, algoritms.py contains abstract classes
Create one directory per module, where each directory contains its functions.py and eventually estimators.py
- loss: datata related losses RidgeRegression, RidgeLogicticRegression, etc. (Hinge ??)
- sparse: functions/estimators with l1
- tv: functions/estimators with tv
- multiblock:

=> functions.py Function(object): AtomicFunction(Function): CompositeFunction(Function): MultiblockFunction(CompositeFunction): Regularisation(object): Constraint(object): ProximalOperator(object): MultiblockProximalOperator(object): NesterovFunction(object): Continuation(object): Gradient(object): MultiblockGradient(object): Hessian(object): LipschitzContinuousGradient(object): GradientStep(object): GradientMap(object): DualFunction(object): Eigenvalues(object): AnonymousFunction(AtomicFunction):

=> loss/functions.py RidgeRegression(CompositeFunction, Gradient, LipschitzContinuousGradient, TO BE ADDED (Ridge?)LogisticRegression(CompositeFunction, Gradient, LipschitzContinuousGradient, QuadraticConstraint(AtomicFunction, Gradient, Constraint):

=>multiblock/functions.py RGCCAConstraint(QuadraticConstraint):

=> sparse/functions.py L1(AtomicFunction, Constraint, ProximalOperator): SmoothedL1(AtomicFunction, Constraint, NesterovFunction, Gradient,

=> tv/functions.py TotalVariation(AtomicFunction, NesterovFunction, Gradient, RR_L1_TV(CompositeFunction, Gradient, LipschitzContinuousGradient, SmoothedL1TV(AtomicFunction, Regularisation, NesterovFunction, RR_SmoothedL1TV(CompositeFunction, LipschitzContinuousGradient,

=> multiblock/functions.py LatentVariableCovariance(MultiblockFunction, MultiblockGradient): GeneralisedMultiblock(MultiblockFunction, MultiblockGradient,

JinpengLI commented 10 years ago

Based on @duchesnay idea, I propose file structure below. The only difference is that I put functions as a directory so that we can reuse functions directory. What do you think?

=> functions/basic.py
Function(object):
AtomicFunction(Function):
CompositeFunction(Function):
MultiblockFunction(CompositeFunction):
Regularisation(object):
Constraint(object):
ProximalOperator(object):
MultiblockProximalOperator(object):
NesterovFunction(object):
Continuation(object):
Gradient(object):
MultiblockGradient(object):
Hessian(object):
LipschitzContinuousGradient(object):
GradientStep(object):
GradientMap(object):
DualFunction(object):
Eigenvalues(object):
AnonymousFunction(AtomicFunction):

=> functions/loss.py
RidgeRegression(CompositeFunction, Gradient, LipschitzContinuousGradient,
TO BE ADDED
(Ridge?)LogisticRegression(CompositeFunction, Gradient, LipschitzContinuousGradient,
QuadraticConstraint(AtomicFunction, Gradient, Constraint):

=> functions/multiblock.py
RGCCAConstraint(QuadraticConstraint):

=> functions/sparse.py
L1(AtomicFunction, Constraint, ProximalOperator):
SmoothedL1(AtomicFunction, Constraint, NesterovFunction, Gradient,

=> functions/tv.py
TotalVariation(AtomicFunction, NesterovFunction, Gradient,
RR_L1_TV(CompositeFunction, Gradient, LipschitzContinuousGradient,
SmoothedL1TV(AtomicFunction, Regularisation, NesterovFunction,
RR_SmoothedL1TV(CompositeFunction, LipschitzContinuousGradient,

=> functions/multiblock.py
LatentVariableCovariance(MultiblockFunction, MultiblockGradient):
GeneralisedMultiblock(MultiblockFunction, MultiblockGradient,