Source code for torch_concepts.nn.modules.loss

"""Loss functions for concept-based models."""
from typing import List, Mapping
import torch
from torch import nn

from ...nn.modules.utils import GroupConfig
from ...annotations import Annotations, AxisAnnotation
from ...utils import instantiate_from_string
from ...nn.modules.utils import check_collection, get_concept_groups


def get_concept_task_idx(annotations: AxisAnnotation, concepts: List[str], tasks: List[str]):
    # Concept-level indices: position in concept list
    concepts_idxs = [annotations.get_index(name) for name in concepts]
    tasks_idxs = [annotations.get_index(name) for name in tasks]
    cumulative_indices = [0] + list(torch.cumsum(torch.tensor(annotations.cardinalities), dim=0).tolist())

    # Logit-level indices: position in flattened tensor (accounting for cardinality)
    concepts_endogenous = []
    for idx in concepts_idxs:
        concepts_endogenous.extend(range(cumulative_indices[idx], cumulative_indices[idx + 1]))

    tasks_endogenous = []
    for idx in tasks_idxs:
        tasks_endogenous.extend(range(cumulative_indices[idx], cumulative_indices[idx + 1]))
    
    return concepts_idxs, tasks_idxs, concepts_endogenous, tasks_endogenous


[docs]
class ConceptLoss(nn.Module):
    """
    Concept loss for concept-based models.

    Automatically routes to appropriate loss functions based on concept types
    (binary, categorical, continuous) using annotation metadata.

    Args:
        annotations (Annotations): Concept annotations with metadata including
            type information for each concept.
        fn_collection (GroupConfig): Loss function configuration per concept type.
            Keys should be 'binary', 'categorical', and/or 'continuous'.

    Example:
        >>> from torch_concepts.nn import ConceptLoss
        >>> from torch_concepts import GroupConfig, Annotations, AxisAnnotation
        >>> from torch.nn import BCEWithLogitsLoss, CrossEntropyLoss
        >>> from torch.distributions import Bernoulli, Categorical
        >>> 
        >>> # Define annotations
        >>> ann = Annotations({1: AxisAnnotation(
        ...     labels=['is_round', 'color'],
        ...     cardinalities=[1, 3],
        ...     metadata={
        ...         'is_round': {'type': 'discrete', 'distribution': Bernoulli},
        ...         'color': {'type': 'discrete', 'distribution': Categorical}
        ...     }
        ... )})
        >>> 
        >>> # Configure loss functions
        >>> loss_config = GroupConfig(
        ...     binary=BCEWithLogitsLoss(),
        ...     categorical=CrossEntropyLoss()
        ... )
        >>> loss_fn = ConceptLoss(ann[1], loss_config)
        >>> 
        >>> # Compute loss
        >>> predictions = torch.randn(2, 4)  # 1 binary + 3 categorical logits
        >>> targets = torch.cat([
        ...     torch.randint(0, 2, (2, 1)),  # binary target
        ...     torch.randint(0, 3, (2, 1))   # categorical target
        ... ], dim=1)
        >>> loss = loss_fn(predictions, targets)
    """

[docs]
    def __init__(self, annotations: Annotations, fn_collection: GroupConfig):
        super().__init__()
        annotations = annotations.get_axis_annotation(axis=1)
        self.fn_collection = check_collection(annotations, fn_collection, 'loss')
        self.groups = get_concept_groups(annotations)
        self.cardinalities = annotations.cardinalities

        # For categorical loss, precompute max cardinality for padding
        if self.fn_collection.get('categorical'):
            self.max_card = max([self.cardinalities[i] for i in self.groups['categorical_idx']])

        if self.fn_collection.get('continuous'):
            self.max_dim = max([self.cardinalities[i] for i in self.groups['continuous_idx']])


    def __repr__(self) -> str:
        types = ['binary', 'categorical', 'continuous']
        parts = []
        for t in types:
            loss = self.fn_collection.get(t)
            if loss:
                if isinstance(loss, nn.Module):
                    name = loss.__class__.__name__
                elif isinstance(loss, (tuple, list)):
                    name = loss[0].__name__
                else:
                    name = loss.__name__
                parts.append(f"{t}={name}")
        return f"{self.__class__.__name__}({', '.join(parts)})"


[docs]
    def forward(self, input: torch.Tensor, target: torch.Tensor) -> torch.Tensor:
        """Compute total loss across all concept types.
        
        Splits inputs and targets by concept type, computes individual losses,
        and sums them to get the total loss.
        
        Args:
            input (torch.Tensor): Model predictions in endogenous space (logits).
            target (torch.Tensor): Ground truth labels/values.
            
        Returns:
            torch.Tensor: Total computed loss (scalar).
        """
        total_loss = 0.0
        
        # Binary concepts
        if self.fn_collection.get('binary'):
            binary_endogenous = input[:, self.groups['binary_endogenous_idx']]
            binary_targets = target[:, self.groups['binary_idx']].float()
            total_loss += self.fn_collection['binary'](binary_endogenous, binary_targets)
        
        # Categorical concepts
        if self.fn_collection.get('categorical'):
            split_tuple = torch.split(
                input[:, self.groups['categorical_endogenous_idx']], 
                [self.cardinalities[i] for i in self.groups['categorical_idx']], 
                dim=1
            )
            padded_endogenous = [
                nn.functional.pad(
                    endogenous, 
                    (0, self.max_card - endogenous.shape[1]), 
                    value=float('-inf')
                ) for endogenous in split_tuple
            ]
            cat_endogenous = torch.cat(padded_endogenous, dim=0)
            cat_targets = target[:, self.groups['categorical_idx']].T.reshape(-1).long()
            
            total_loss += self.fn_collection['categorical'](cat_endogenous, cat_targets)
        
        # Continuous concepts
        if self.fn_collection.get('continuous'):
            raise NotImplementedError("Continuous concepts not yet implemented.")
        
        return total_loss





[docs]
class WeightedConceptLoss(nn.Module):
    """
    Weighted concept loss for concept-based models.

    Computes a weighted combination of concept and task losses.

    Args:
        annotations (Annotations): Annotations object with concept metadata.
        fn_collection (GroupConfig): Loss function configuration.
        concept_weight (float): Weight for concept loss
        task_weight (float): Weight for task loss
        task_names (List[str]): List of task concept names.

    Example:
        >>> from torch_concepts.nn.modules.loss import WeightedConceptLoss
        >>> from torch_concepts.nn.modules.utils import GroupConfig
        >>> from torch.nn import BCEWithLogitsLoss, CrossEntropyLoss
        >>> from torch_concepts.annotations import AxisAnnotation, Annotations
        >>> ann = Annotations({1: AxisAnnotation(labels=['c1', 'c2', 'task'], cardinalities=[1, 3, 1])})
        >>> fn = GroupConfig(binary=BCEWithLogitsLoss(), categorical=CrossEntropyLoss())
        >>> loss_fn = WeightedConceptLoss(ann, fn, weight=0.7, task_names=['task'])
        >>> input = torch.randn(2, 5)
        >>> target = torch.randint(0, 2, (2, 3))
        >>> loss = loss_fn(input, target)
    """

[docs]
    def __init__(
        self, 
        annotations: Annotations, 
        fn_collection: GroupConfig,
        concept_weight: float,
        task_weight: float,
        task_names: List[str]
    ):
        super().__init__()
        self.concept_weight = concept_weight
        self.task_weight = task_weight
        self.fn_collection = fn_collection
        annotations = annotations.get_axis_annotation(axis=1)
        concept_names = [name for name in annotations.labels if name not in task_names]
        task_annotations = Annotations({1:annotations.subset(task_names)})
        concept_annotations = Annotations({1:annotations.subset(concept_names)})

        self.concept_loss = ConceptLoss(concept_annotations, fn_collection)
        self.task_loss = ConceptLoss(task_annotations, fn_collection)
        self.target_c_idx, self.target_t_idx, self.input_c_idx, self.input_t_idx = get_concept_task_idx(
            annotations, concept_names, task_names
        )


    def __repr__(self) -> str:
        return f"{self.__class__.__name__}(fn_collection={self.fn_collection})"
    

[docs]
    def forward(self, input: torch.Tensor, target: torch.Tensor) -> torch.Tensor:
        """Compute weighted loss for concepts and tasks.
        
        Args:
            input (torch.Tensor): Model predictions in endogenous space (logits).
            target (torch.Tensor): Ground truth labels/values.
        
        Returns:
            torch.Tensor: Weighted combination of concept and task losses (scalar).
        """
        concept_input = input[:, self.input_c_idx]
        concept_target = target[:, self.target_c_idx]
        task_input = input[:, self.input_t_idx]
        task_target = target[:, self.target_t_idx]
        
        c_loss = self.concept_loss(concept_input, concept_target)
        t_loss = self.task_loss(task_input, task_target)
        
        return c_loss * self.concept_weight + t_loss * self.task_weight