Conceptarium¶

Conceptarium is a no-code framework for running large-scale experiments on concept-based models. Built on top of PyC, Hydra, and PyTorch Lightning, it enables configuration-driven experimentation without writing Python code.

Design Principles¶

Configuration-Driven Experimentation¶

Conceptarium uses YAML configuration files to define all experiment parameters. No Python coding required:

Models: Select and configure any PyC model (CBM, CEM, CGM, BlackBox)
Datasets: Use built-in datasets (CUB-200, CelebA) or add custom ones
Training: Configure optimizer, scheduler, and Lightning Trainer settings
Tracking: Automatic logging to W&B for visualization and comparison

Large-Scale Sweeps¶

Run multiple experiments with single commands using Hydra’s multi-run capabilities:

# Test 3 datasets × 2 models × 5 seeds = 30 experiments
python run_experiment.py dataset=celeba,cub,mnist model=cbm,cem seed=1,2,3,4,5

Or by creating custom sweep configuration files:

# conceptarium/conf/my_sweep.yaml
defaults:
    - _commons    # Inherit standard encoder/optimizer settings
    - _self_      # This file's parameters override

hydra:
    job:
        name: experiment_name
    sweeper:
        # standard grid search
        params:
            seed: 1
            dataset: celeba, cub, mnist, ...
            model: blackbox, cbm, cem, ...

All runs are automatically organized, logged, and tracked.

Hierarchical Composition¶

Configurations inherit and override using defaults for maintainability:

# conceptarium/conf/my_sweep.yaml
defaults:
  - _commons    # Inherit standard encoder/optimizer settings
  - _self_      # This file's parameters override

# Only specify what's different
model:
    optim_kwargs:
        lr: 0.05 # Override learning rate

This keeps configurations concise and reduces duplication.

Conceptarium¶

Design Principles¶

Configuration-Driven Experimentation¶

Large-Scale Sweeps¶

Hierarchical Composition¶

Detailed Guides¶

See Also¶