Configuration System

This library uses Hydra for configuration management, enabling flexible, composable, and reproducible experiments through YAML files.

Configuration Structure

Every config file has these main sections:

# Core Components
model: {...}           # Neural network architecture
loss: {...}            # Loss function
optimizer: {...}       # Optimization algorithm
hyperparameters: {...} # Training parameters

# Data
train_dataset: {...}   # Training data configuration
val_dataset: {...}     # Validation data configuration

# Training
pl_trainer: {...}      # PyTorch Lightning trainer settings

# Mode and other settings
mode: train           # Operation mode
device: cuda          # Computing device

Config Builder

Use the visual Config Builder to create these files without manually writing YAML.

The `_target_` Pattern

Hydra uses _target_ to specify which class to instantiate:

# This creates: torch.optim.AdamW(lr=0.001, weight_decay=1e-4)
optimizer:
  _target_: torch.optim.AdamW
  lr: 0.001
  weight_decay: 1e-4

# This creates: segmentation_models_pytorch.Unet(...)
model:
  _target_: segmentation_models_pytorch.Unet
  encoder_name: resnet34
  classes: 1

File Organization

Organize configs by purpose:

configs/
├── model/
│   ├── unet.yaml
│   ├── deeplabv3.yaml
│   └── frame_field.yaml
├── dataset/
│   ├── cityscapes.yaml
│   ├── custom.yaml
│   └── coco.yaml
├── optimizer/
│   ├── adam.yaml
│   └── sgd.yaml
└── experiment/
    ├── quick_test.yaml
    └── production.yaml

Configuration Composition

Basic Composition

Create a base config:

configs/base.yaml
defaults:
  - model: unet
  - optimizer: adam
  - dataset: custom

hyperparameters:
  batch_size: 4
  epochs: 10

mode: train

Then create specific components:

configs/model/unet.yaml
_target_: segmentation_models_pytorch.Unet
encoder_name: resnet34
encoder_weights: imagenet
in_channels: 3
classes: 1

configs/optimizer/adam.yaml
_target_: torch.optim.AdamW
lr: 0.001
weight_decay: 1e-4

Using Composition

# Use base config with defaults
pytorch-smt --config-dir ./configs --config-name base

# Override specific components
pytorch-smt --config-dir ./configs --config-name base \
  model=deeplabv3 optimizer=sgd

# Override individual parameters
pytorch-smt --config-dir ./configs --config-name base \
  hyperparameters.batch_size=8 optimizer.lr=0.01

Advanced Features

Variable Interpolation

Reference other config values:

hyperparameters:
  batch_size: 4
  epochs: 100

pl_trainer:
  max_epochs: ${hyperparameters.epochs}  # References epochs above

callbacks:
  - _target_: pytorch_lightning.callbacks.ModelCheckpoint
    every_n_epochs: ${div:${hyperparameters.epochs},10}  # epochs/10

Environment-Specific Configs

configs/local.yaml
# For local development
hyperparameters:
  batch_size: 2
  epochs: 2

pl_trainer:
  max_epochs: 2
  fast_dev_run: true

configs/production.yaml
# For full training runs
hyperparameters:
  batch_size: 16
  epochs: 100

pl_trainer:
  max_epochs: 100
  precision: 16

Common Configuration Patterns

Multi-GPU Training

pl_trainer:
  accelerator: gpu
  devices: 2
  strategy: ddp

hyperparameters:
  batch_size: 8  # Per GPU

Mixed Precision Training

pl_trainer:
  precision: 16

# Might need to adjust learning rate
optimizer:
  lr: 0.002  # Higher LR for mixed precision

Experiment Tracking

logger:
  _target_: pytorch_lightning.loggers.TensorBoardLogger
  save_dir: ./experiments
  name: ${model.encoder_name}_${optimizer._target_}
  version: ${now:%Y-%m-%d_%H-%M-%S}

Custom Callbacks

callbacks:
  - _target_: pytorch_lightning.callbacks.ModelCheckpoint
    monitor: val_loss
    mode: min
    save_top_k: 3
    filename: 'best-{epoch:02d}-{val_loss:.2f}'

  - _target_: pytorch_lightning.callbacks.EarlyStopping
    monitor: val_loss
    patience: 10

  - _target_: pytorch_lightning.callbacks.LearningRateMonitor
    logging_interval: epoch

Mode-Specific Configurations

Training Mode

mode: train

pl_trainer:
  max_epochs: 100
  log_every_n_steps: 50

callbacks:
  - _target_: pytorch_lightning.callbacks.ModelCheckpoint
    save_top_k: 3

Prediction Mode

mode: predict
checkpoint_path: /path/to/model.ckpt

inference_image_reader:
  _target_: pytorch_segmentation_models_trainer.tools.data_handlers.raster_reader.FolderImageReaderProcessor
  folder_name: /path/to/images

inference_processor:
  _target_: pytorch_segmentation_models_trainer.tools.inference.inference_processors.SingleImageInfereceProcessor

inference_threshold: 0.5

Debugging Configurations

Print Resolved Config

# See the final resolved configuration
pytorch-smt --config-dir ./configs --config-name my_config --cfg job

Validate Config

# Just validate without running
pytorch-smt --config-dir ./configs --config-name my_config +mode=validate-config

Best Practices

Use composition: Break configs into reusable components
Name meaningfully: Use descriptive names for config files
Version control: Track config changes alongside code
Document experiments: Use descriptive names and comments
Validate early: Use config validation to catch errors

Learn More

Hydra Documentation - Official Hydra docs
Examples - Real configuration examples
API Reference - Available configuration options

Configuration Structure​

The _target_ Pattern​

File Organization​

Configuration Composition​

Basic Composition​

Using Composition​

Advanced Features​

Variable Interpolation​

Environment-Specific Configs​

Common Configuration Patterns​

Multi-GPU Training​

Mixed Precision Training​

Experiment Tracking​

Custom Callbacks​

Mode-Specific Configurations​

Training Mode​

Prediction Mode​

Debugging Configurations​

Print Resolved Config​

Validate Config​

Best Practices​

Learn More​