From 72c56575f07225ea5a7d703983355e9f20b42281 Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Wed, 24 Jun 2026 16:59:03 +0200
Subject: [PATCH 01/11] Beginning of petab v2 transition

---
 src/petab_gui/adapters/__init__.py            |  14 +
 .../adapters/pandas_table_repository.py       | 311 ++++++++++++++++++
 src/petab_gui/domain/__init__.py              |  15 +
 src/petab_gui/domain/table_repository.py      | 258 +++++++++++++++
 src/petab_gui/domain/validation_result.py     | 168 ++++++++++
 src/petab_gui/models/pandas_table_model.py    |  12 +-
 tests/test_helpers/__init__.py                |   5 +
 tests/test_helpers/in_memory_repository.py    | 253 ++++++++++++++
 8 files changed, 1035 insertions(+), 1 deletion(-)
 create mode 100644 src/petab_gui/adapters/__init__.py
 create mode 100644 src/petab_gui/adapters/pandas_table_repository.py
 create mode 100644 src/petab_gui/domain/__init__.py
 create mode 100644 src/petab_gui/domain/table_repository.py
 create mode 100644 src/petab_gui/domain/validation_result.py
 create mode 100644 tests/test_helpers/__init__.py
 create mode 100644 tests/test_helpers/in_memory_repository.py

diff --git a/src/petab_gui/adapters/__init__.py b/src/petab_gui/adapters/__init__.py
new file mode 100644
index 0000000..4d12c63
--- /dev/null
+++ b/src/petab_gui/adapters/__init__.py
@@ -0,0 +1,14 @@
+"""Adapters layer - infrastructure implementations.
+
+This package contains implementations of domain protocols for specific
+technologies:
+- PandasTableRepository: pandas DataFrame adapter
+- PydanticTableRepository: pydantic models adapter (future)
+
+Adapters sit at the seam - they can be swapped without changing domain or
+controller code.
+"""
+
+from .pandas_table_repository import PandasTableRepository
+
+__all__ = ["PandasTableRepository"]
diff --git a/src/petab_gui/adapters/pandas_table_repository.py b/src/petab_gui/adapters/pandas_table_repository.py
new file mode 100644
index 0000000..a39e37b
--- /dev/null
+++ b/src/petab_gui/adapters/pandas_table_repository.py
@@ -0,0 +1,311 @@
+"""Pandas implementation of TableRepository.
+
+This adapter wraps a pandas DataFrame to implement the TableRepository protocol.
+It handles validation, invalid cell tracking, and all CRUD operations while
+maintaining compatibility with the existing PandasTableModel behavior.
+"""
+
+from collections.abc import Iterable
+from typing import Any
+
+import numpy as np
+import pandas as pd
+
+from ..C import COLUMNS
+from ..domain.validation_result import ValidationLevel, ValidationResult
+from ..models.validators import is_invalid, validate_value
+
+
+class PandasTableRepository:
+    """Pandas DataFrame adapter implementing TableRepository protocol.
+
+    This adapter provides the seam between controllers and pandas DataFrames.
+    In the future, when migrating to pydantic/PEtab v2.0, this adapter will be
+    replaced with PydanticTableRepository, but controllers won't need to change.
+
+    Attributes:
+        _data_frame: The underlying pandas DataFrame
+        _table_type: Table type (measurement, parameter, etc.)
+        _allowed_columns: Column definitions from C.COLUMNS
+        _invalid_cells: Set of (row_index, column_name) tuples for invalid cells
+    """
+
+    def __init__(
+        self,
+        data_frame: pd.DataFrame,
+        table_type: str,
+        allowed_columns: dict | None = None,
+    ):
+        """Initialize pandas table repository.
+
+        Args:
+            data_frame: The pandas DataFrame to wrap
+            table_type: Table type identifier (measurement, parameter, etc.)
+            allowed_columns: Column definitions (defaults to C.COLUMNS[table_type])
+        """
+        self._data_frame = data_frame
+        self._table_type = table_type
+        self._allowed_columns = allowed_columns or COLUMNS.get(table_type, {})
+        self._invalid_cells: dict[tuple[int, str], str] = {}
+
+    # Row access
+    def get_row(self, index: int) -> dict | None:
+        """Get row as dict by position."""
+        if not 0 <= index < len(self._data_frame):
+            return None
+
+        row = self._data_frame.iloc[index]
+        return row.to_dict()
+
+    def get_row_by_id(self, row_id: str) -> dict | None:
+        """Get row by identifier (index value)."""
+        try:
+            if row_id in self._data_frame.index:
+                row = self._data_frame.loc[row_id]
+                return row.to_dict()
+        except (KeyError, TypeError):
+            pass
+        return None
+
+    def get_all_rows(self) -> Iterable[dict]:
+        """Iterate over all rows as dicts."""
+        for _, row in self._data_frame.iterrows():
+            yield row.to_dict()
+
+    # Cell access
+    def get_cell(self, row: int, column: str) -> Any:
+        """Get single cell value."""
+        return self._data_frame.loc[self._data_frame.index[row], column]
+
+    def set_cell(self, row: int, column: str, value: Any) -> ValidationResult:
+        """Set cell value (always succeeds, validates and tracks invalids)."""
+        # Get expected type for this column
+        expected_type = self._allowed_columns.get(column, {}).get(
+            "type", np.object_
+        )
+
+        # Validate value
+        converted_value, error_message = validate_value(value, expected_type)
+
+        # Always store the value (permissive validation)
+        if converted_value is not None:
+            self._data_frame.loc[self._data_frame.index[row], column] = (
+                converted_value
+            )
+            value_to_store = converted_value
+        else:
+            # Store as string if conversion failed
+            self._data_frame.loc[self._data_frame.index[row], column] = str(
+                value
+            )
+            value_to_store = str(value)
+
+        # Track invalid cells and return validation result
+        cell_key = (row, column)
+
+        if error_message:
+            # Validation failed
+            self._invalid_cells[cell_key] = error_message
+            return ValidationResult.error(
+                message=error_message,
+                field_name=column,
+                expected_type=str(expected_type),
+            )
+
+        if is_invalid(value_to_store):
+            # Value is None, NaN, or infinity
+            error_msg = f"Invalid value: {value_to_store}"
+            self._invalid_cells[cell_key] = error_msg
+            return ValidationResult.error(
+                message=error_msg,
+                field_name=column,
+            )
+
+        # Value is valid - remove from invalid cells if it was there
+        self._invalid_cells.pop(cell_key, None)
+        return ValidationResult.valid()
+
+    # Row mutations
+    def add_row(self, data: dict) -> str:
+        """Add row from dict."""
+        # Determine row ID (first column or index)
+        row_id = None
+        if self._data_frame.index.name:
+            # Has named index
+            row_id = data.get(self._data_frame.index.name)
+        if row_id is None:
+            # Use first column as ID
+            first_col = self._data_frame.columns[0]
+            row_id = data.get(first_col, f"row_{len(self._data_frame)}")
+
+        # Create new row with all columns (fill missing with empty string)
+        new_row = {}
+        for col in self._data_frame.columns:
+            new_row[col] = data.get(col, "")
+
+        # Add to DataFrame
+        new_df_row = pd.DataFrame([new_row], index=[row_id])
+        self._data_frame = pd.concat(
+            [self._data_frame, new_df_row], ignore_index=False
+        )
+
+        return str(row_id)
+
+    def delete_row(self, index: int) -> bool:
+        """Delete row by position."""
+        if not 0 <= index < len(self._data_frame):
+            return False
+
+        row_id = self._data_frame.index[index]
+        self._data_frame.drop(row_id, inplace=True)
+
+        # Remove invalid cells for this row
+        self._invalid_cells = {
+            (r, c): msg
+            for (r, c), msg in self._invalid_cells.items()
+            if r != index
+        }
+
+        return True
+
+    def update_row(self, index: int, data: dict) -> ValidationResult:
+        """Update entire row."""
+        if not 0 <= index < len(self._data_frame):
+            return ValidationResult.error("Row index out of bounds")
+
+        # Update each field in the row
+        results = []
+        for column, value in data.items():
+            if column in self._data_frame.columns:
+                result = self.set_cell(index, column, value)
+                results.append(result)
+
+        # Return error if any field failed, otherwise valid
+        for result in results:
+            if result.is_error:
+                return result
+        return ValidationResult.valid()
+
+    # Column mutations
+    def add_column(self, column_name: str, default_value: Any = "") -> None:
+        """Add column to all rows with default value."""
+        self._data_frame[column_name] = default_value
+
+    def delete_column(self, column_name: str) -> None:
+        """Remove column from all rows."""
+        if column_name in self._data_frame.columns:
+            self._data_frame.drop(columns=column_name, inplace=True)
+
+            # Remove invalid cells for this column
+            self._invalid_cells = {
+                (r, c): msg
+                for (r, c), msg in self._invalid_cells.items()
+                if c != column_name
+            }
+
+    def rename_column(self, old_name: str, new_name: str) -> None:
+        """Rename column."""
+        if old_name in self._data_frame.columns:
+            self._data_frame.rename(columns={old_name: new_name}, inplace=True)
+
+            # Update invalid cells tracking
+            updated_invalid = {}
+            for (r, c), msg in self._invalid_cells.items():
+                if c == old_name:
+                    updated_invalid[(r, new_name)] = msg
+                else:
+                    updated_invalid[(r, c)] = msg
+            self._invalid_cells = updated_invalid
+
+    # Bulk operations
+    def clear_all_rows(self) -> None:
+        """Remove all rows (keeps columns and structure)."""
+        self._data_frame.drop(self._data_frame.index, inplace=True)
+        self._invalid_cells.clear()
+
+    def replace_text(
+        self, old_text: str, new_text: str
+    ) -> list[tuple[int, str]]:
+        """Replace text in all cells and row IDs."""
+        changed_cells = []
+
+        # Replace in cells
+        for row_idx in range(len(self._data_frame)):
+            for col in self._data_frame.columns:
+                value = self._data_frame.iloc[
+                    row_idx, self._data_frame.columns.get_loc(col)
+                ]
+                if str(value) == old_text:
+                    self.set_cell(row_idx, col, new_text)
+                    changed_cells.append((row_idx, col))
+
+        # Replace in index
+        if old_text in self._data_frame.index:
+            self._data_frame.rename(index={old_text: new_text}, inplace=True)
+
+        return changed_cells
+
+    # Metadata
+    def row_count(self) -> int:
+        """Get number of rows."""
+        return len(self._data_frame)
+
+    def column_names(self) -> list[str]:
+        """Get all column names."""
+        return self._data_frame.columns.tolist()
+
+    def table_type(self) -> str:
+        """Get table type."""
+        return self._table_type
+
+    # Validation
+    def get_invalid_cells(self) -> dict[tuple[int, str], str]:
+        """Get all invalid cells."""
+        return self._invalid_cells.copy()
+
+    def clear_invalid_cells(self) -> None:
+        """Clear all tracked invalid cells."""
+        self._invalid_cells.clear()
+
+    def validate_cell(self, row: int, column: str) -> ValidationResult:
+        """Validate single cell without modifying data."""
+        if not 0 <= row < len(self._data_frame):
+            return ValidationResult.error("Row index out of bounds")
+
+        if column not in self._data_frame.columns:
+            return ValidationResult.error(f"Column '{column}' does not exist")
+
+        value = self.get_cell(row, column)
+
+        # Get expected type
+        expected_type = self._allowed_columns.get(column, {}).get(
+            "type", np.object_
+        )
+
+        # Validate
+        _, error_message = validate_value(value, expected_type)
+
+        if error_message:
+            return ValidationResult.error(
+                message=error_message,
+                field_name=column,
+                expected_type=str(expected_type),
+            )
+
+        if is_invalid(value):
+            return ValidationResult.error(
+                message=f"Invalid value: {value}",
+                field_name=column,
+            )
+
+        return ValidationResult.valid()
+
+    # Additional helper methods for PandasTableModel compatibility
+    @property
+    def data_frame(self) -> pd.DataFrame:
+        """Direct access to underlying DataFrame (for migration period).
+
+        This property exists to ease the transition from direct DataFrame access.
+        In the long term, all access should go through repository methods.
+        """
+        return self._data_frame
diff --git a/src/petab_gui/domain/__init__.py b/src/petab_gui/domain/__init__.py
new file mode 100644
index 0000000..1cc3797
--- /dev/null
+++ b/src/petab_gui/domain/__init__.py
@@ -0,0 +1,15 @@
+"""Domain layer - business logic and protocols.
+
+This package contains:
+- Protocols/interfaces that define the seams in the application
+- Domain models and value objects
+- Validation logic
+
+The domain layer is independent of infrastructure (Qt, pandas) and can be
+tested without external dependencies.
+"""
+
+from .table_repository import TableRepository
+from .validation_result import ValidationLevel, ValidationResult
+
+__all__ = ["TableRepository", "ValidationLevel", "ValidationResult"]
diff --git a/src/petab_gui/domain/table_repository.py b/src/petab_gui/domain/table_repository.py
new file mode 100644
index 0000000..899f424
--- /dev/null
+++ b/src/petab_gui/domain/table_repository.py
@@ -0,0 +1,258 @@
+"""Table repository protocol - the seam for data access abstraction.
+
+This protocol defines the interface for table data access, allowing controllers
+to work with tables without knowing the underlying data structure (pandas
+DataFrames, pydantic models, etc.).
+
+Design principles:
+- Data-structure agnostic (works with pandas and pydantic)
+- Returns plain dicts (not DataFrames or pydantic models)
+- Permissive validation (accepts any input, tracks invalids)
+- No Qt dependencies (testable without event loop)
+"""
+
+from collections.abc import Iterable
+from typing import Any, Protocol
+
+from .validation_result import ValidationResult
+
+
+class TableRepository(Protocol):
+    """Generic repository for table data access.
+
+    This is the seam where data access abstraction happens. Controllers interact
+    through this interface, allowing us to swap implementations (pandas →
+    pydantic) without changing controller code.
+
+    Adapters that implement this protocol:
+    - PandasTableRepository: wraps pandas DataFrame
+    - PydanticTableRepository: wraps list of pydantic models (future)
+    - InMemoryTableRepository: simple dict-based impl for testing
+    """
+
+    # Row access
+    def get_row(self, index: int) -> dict | None:
+        """Get row as dict by position.
+
+        Args:
+            index: Zero-based row position
+
+        Returns:
+            Row as dict with column names as keys, or None if out of bounds
+
+        Example:
+            >>> repo.get_row(0)
+            {'parameterId': 'k1', 'nominalValue': 1.0, 'estimate': True}
+        """
+        ...
+
+    def get_row_by_id(self, row_id: str) -> dict | None:
+        """Get row by identifier (index value).
+
+        Args:
+            row_id: The row identifier (value of the index column)
+
+        Returns:
+            Row as dict, or None if not found
+
+        Example:
+            >>> repo.get_row_by_id('k1')
+            {'parameterId': 'k1', 'nominalValue': 1.0, 'estimate': True}
+        """
+        ...
+
+    def get_all_rows(self) -> Iterable[dict]:
+        """Iterate over all rows as dicts.
+
+        Returns:
+            Iterator of row dicts
+
+        Example:
+            >>> for row in repo.get_all_rows():
+            ...     print(row['parameterId'])
+        """
+        ...
+
+    # Cell access
+    def get_cell(self, row: int, column: str) -> Any:
+        """Get single cell value.
+
+        Args:
+            row: Zero-based row position
+            column: Column name
+
+        Returns:
+            Cell value (can be any type)
+
+        Raises:
+            IndexError: If row is out of bounds
+            KeyError: If column doesn't exist
+        """
+        ...
+
+    def set_cell(self, row: int, column: str, value: Any) -> ValidationResult:
+        """Set cell value (always succeeds, validates and tracks invalids).
+
+        This method uses permissive validation - it accepts any input and stores
+        it, but returns a ValidationResult indicating whether the value is valid.
+        Invalid cells are tracked internally and can be retrieved via
+        get_invalid_cells().
+
+        Args:
+            row: Zero-based row position
+            column: Column name
+            value: New value (any type accepted)
+
+        Returns:
+            ValidationResult with level (VALID/WARNING/ERROR), message, suggestions
+
+        Example:
+            >>> result = repo.set_cell(0, 'nominalValue', 'abc')
+            >>> if result.is_error:
+            ...     print(f"Invalid: {result.message}")
+            ...     # Cell is still set to 'abc', but marked invalid
+        """
+        ...
+
+    # Row mutations
+    def add_row(self, data: dict) -> str:
+        """Add row from dict.
+
+        Args:
+            data: Row data as dict (column name → value)
+
+        Returns:
+            New row ID (value of the ID column)
+
+        Example:
+            >>> row_id = repo.add_row({'parameterId': 'k2', 'nominalValue': 2.0})
+            >>> print(row_id)  # 'k2'
+        """
+        ...
+
+    def delete_row(self, index: int) -> bool:
+        """Delete row by position.
+
+        Args:
+            index: Zero-based row position
+
+        Returns:
+            True if row was deleted, False if index was out of bounds
+        """
+        ...
+
+    def update_row(self, index: int, data: dict) -> ValidationResult:
+        """Update entire row.
+
+        Args:
+            index: Zero-based row position
+            data: New row data (partial updates allowed)
+
+        Returns:
+            ValidationResult for the updated row
+        """
+        ...
+
+    # Column mutations
+    def add_column(self, column_name: str, default_value: Any = "") -> None:
+        """Add column to all rows with default value.
+
+        Args:
+            column_name: Name of new column
+            default_value: Value to use for all existing rows (default: "")
+        """
+        ...
+
+    def delete_column(self, column_name: str) -> None:
+        """Remove column from all rows.
+
+        Args:
+            column_name: Name of column to remove
+        """
+        ...
+
+    def rename_column(self, old_name: str, new_name: str) -> None:
+        """Rename column.
+
+        Args:
+            old_name: Current column name
+            new_name: New column name
+        """
+        ...
+
+    # Bulk operations
+    def clear_all_rows(self) -> None:
+        """Remove all rows (keeps columns and structure)."""
+        ...
+
+    def replace_text(
+        self, old_text: str, new_text: str
+    ) -> list[tuple[int, str]]:
+        """Replace text in all cells and row IDs.
+
+        Args:
+            old_text: Text to search for
+            new_text: Replacement text
+
+        Returns:
+            List of changed (row_index, column_name) positions
+        """
+        ...
+
+    # Metadata
+    def row_count(self) -> int:
+        """Get number of rows.
+
+        Returns:
+            Number of rows (excluding any 'New' placeholder rows)
+        """
+        ...
+
+    def column_names(self) -> list[str]:
+        """Get all column names.
+
+        Returns:
+            List of column names in order
+        """
+        ...
+
+    def table_type(self) -> str:
+        """Get table type.
+
+        Returns:
+            Table type identifier (e.g., 'measurement', 'parameter', 'observable')
+        """
+        ...
+
+    # Validation
+    def get_invalid_cells(self) -> dict[tuple[int, str], str]:
+        """Get all invalid cells.
+
+        Returns:
+            Dict mapping (row_index, column_name) → error_message
+
+        Example:
+            >>> invalids = repo.get_invalid_cells()
+            >>> print(invalids)
+            {(0, 'nominalValue'): 'Expected float, got abc'}
+        """
+        ...
+
+    def clear_invalid_cells(self) -> None:
+        """Clear all tracked invalid cells.
+
+        Useful after bulk operations or when resetting validation state.
+        """
+        ...
+
+    def validate_cell(self, row: int, column: str) -> ValidationResult:
+        """Validate single cell without modifying data.
+
+        Args:
+            row: Zero-based row position
+            column: Column name
+
+        Returns:
+            ValidationResult for the cell's current value
+        """
+        ...
diff --git a/src/petab_gui/domain/validation_result.py b/src/petab_gui/domain/validation_result.py
new file mode 100644
index 0000000..4dfbc34
--- /dev/null
+++ b/src/petab_gui/domain/validation_result.py
@@ -0,0 +1,168 @@
+"""Validation result types for repository operations.
+
+This module defines the structure for validation results returned by repository
+operations. The design matches pydantic's validation error structure for future
+compatibility when migrating to PEtab v2.0.
+"""
+
+from dataclasses import dataclass, field
+from enum import Enum
+
+
+class ValidationLevel(Enum):
+    """Validation severity level.
+
+    Attributes:
+        VALID: Value is valid
+        WARNING: Value is questionable but acceptable
+        ERROR: Value is invalid
+    """
+
+    VALID = "valid"
+    WARNING = "warning"
+    ERROR = "error"
+
+
+@dataclass
+class ValidationResult:
+    """Result of validation operation.
+
+    Rich structure with suggestions for better UX. When validation fails,
+    the message explains what's wrong, and suggestions provide alternatives
+    (e.g., similar IDs that exist).
+
+    This structure is designed to match pydantic's validation error format,
+    making future migration to PEtab v2.0 pydantic models seamless.
+
+    Attributes:
+        level: Severity level (VALID, WARNING, ERROR)
+        message: Human-readable error/warning message (None if valid)
+        suggestions: List of suggested corrections (e.g., similar valid values)
+        field_name: Name of the field that was validated
+        expected_type: Expected type/format description (e.g., "float", "reference to Observable")
+
+    Example:
+        >>> result = ValidationResult(
+        ...     level=ValidationLevel.ERROR,
+        ...     message="observableId 'obs_typo' not found in observable table",
+        ...     suggestions=["obs1", "obs2"],
+        ...     field_name="observableId",
+        ...     expected_type="reference to Observable"
+        ... )
+        >>> if result.is_error:
+        ...     print(result.message)
+        ...     if result.suggestions:
+        ...         print(f"Did you mean: {', '.join(result.suggestions)}?")
+    """
+
+    level: ValidationLevel
+    message: str | None = None
+    suggestions: list[str] = field(default_factory=list)
+    field_name: str | None = None
+    expected_type: str | None = None
+
+    @property
+    def is_valid(self) -> bool:
+        """Check if validation passed.
+
+        Returns:
+            True if level is VALID
+        """
+        return self.level == ValidationLevel.VALID
+
+    @property
+    def is_warning(self) -> bool:
+        """Check if validation produced a warning.
+
+        Returns:
+            True if level is WARNING
+        """
+        return self.level == ValidationLevel.WARNING
+
+    @property
+    def is_error(self) -> bool:
+        """Check if validation failed.
+
+        Returns:
+            True if level is ERROR
+        """
+        return self.level == ValidationLevel.ERROR
+
+    @classmethod
+    def valid(cls) -> "ValidationResult":
+        """Create a valid result.
+
+        Returns:
+            ValidationResult with VALID level
+
+        Example:
+            >>> result = ValidationResult.valid()
+            >>> assert result.is_valid
+        """
+        return cls(level=ValidationLevel.VALID)
+
+    @classmethod
+    def error(
+        cls,
+        message: str,
+        field_name: str | None = None,
+        expected_type: str | None = None,
+        suggestions: list[str] | None = None,
+    ) -> "ValidationResult":
+        """Create an error result.
+
+        Args:
+            message: Error message
+            field_name: Name of invalid field
+            expected_type: Expected type/format
+            suggestions: List of suggested corrections
+
+        Returns:
+            ValidationResult with ERROR level
+
+        Example:
+            >>> result = ValidationResult.error(
+            ...     "Invalid value",
+            ...     field_name="nominalValue",
+            ...     expected_type="float"
+            ... )
+            >>> assert result.is_error
+        """
+        return cls(
+            level=ValidationLevel.ERROR,
+            message=message,
+            field_name=field_name,
+            expected_type=expected_type,
+            suggestions=suggestions or [],
+        )
+
+    @classmethod
+    def warning(
+        cls,
+        message: str,
+        field_name: str | None = None,
+        suggestions: list[str] | None = None,
+    ) -> "ValidationResult":
+        """Create a warning result.
+
+        Args:
+            message: Warning message
+            field_name: Name of field with warning
+            suggestions: List of suggested improvements
+
+        Returns:
+            ValidationResult with WARNING level
+
+        Example:
+            >>> result = ValidationResult.warning(
+            ...     "Value is unusually large",
+            ...     field_name="nominalValue"
+            ... )
+            >>> assert result.is_warning
+        """
+        return cls(
+            level=ValidationLevel.WARNING,
+            message=message,
+            field_name=field_name,
+            suggestions=suggestions or [],
+        )
diff --git a/src/petab_gui/models/pandas_table_model.py b/src/petab_gui/models/pandas_table_model.py
index 1b2c026..f205b16 100644
--- a/src/petab_gui/models/pandas_table_model.py
+++ b/src/petab_gui/models/pandas_table_model.py
@@ -11,6 +11,7 @@
 )
 from PySide6.QtGui import QBrush, QColor, QPalette
 
+from ..adapters import PandasTableRepository
 from ..C import COLUMNS
 from ..commands import (
     ModifyColumnCommand,
@@ -103,7 +104,16 @@ def __init__(
         self._has_named_index = False
         if data_frame is None:
             data_frame = create_empty_dataframe(allowed_columns, table_type)
-        self._data_frame = data_frame
+
+        # Phase 2: Create repository (wraps DataFrame)
+        # Qt model continues using _data_frame for now (gradual migration)
+        self.repository = PandasTableRepository(
+            data_frame, table_type, allowed_columns
+        )
+        self._data_frame = (
+            self.repository.data_frame
+        )  # Alias for backward compatibility
+
         # add a view here, access is needed for selectionModels
         self.view = None
         # offset for row and column to get from the data_frame to the view
diff --git a/tests/test_helpers/__init__.py b/tests/test_helpers/__init__.py
new file mode 100644
index 0000000..358d298
--- /dev/null
+++ b/tests/test_helpers/__init__.py
@@ -0,0 +1,5 @@
+"""Test helper utilities for PEtab GUI tests."""
+
+from .in_memory_repository import InMemoryTableRepository
+
+__all__ = ["InMemoryTableRepository"]
diff --git a/tests/test_helpers/in_memory_repository.py b/tests/test_helpers/in_memory_repository.py
new file mode 100644
index 0000000..e4fb7fc
--- /dev/null
+++ b/tests/test_helpers/in_memory_repository.py
@@ -0,0 +1,253 @@
+"""In-memory implementation of TableRepository for testing.
+
+This simple dict-based implementation allows testing controllers without
+pandas or Qt dependencies. It's fast, lightweight, and perfect for unit tests.
+"""
+
+from collections.abc import Iterable
+from typing import Any
+
+from src.petab_gui.domain.validation_result import (
+    ValidationLevel,
+    ValidationResult,
+)
+
+
+class InMemoryTableRepository:
+    """Simple in-memory table repository for testing.
+
+    Stores rows as list of dicts. No validation is performed (always returns
+    VALID), making it suitable for testing controller logic without worrying
+    about data validation details.
+
+    For tests that need validation behavior, use PandasTableRepository instead.
+
+    Attributes:
+        rows: List of row dicts
+        columns: List of column names
+        _table_type: Table type identifier
+        _invalid_cells: Tracked invalid cells (for testing validation tracking)
+    """
+
+    def __init__(self, table_type: str, columns: list[str] | None = None):
+        """Initialize in-memory repository.
+
+        Args:
+            table_type: Table type identifier
+            columns: Column names (default: empty list)
+        """
+        self.rows: list[dict] = []
+        self.columns: list[str] = columns or []
+        self._table_type = table_type
+        self._invalid_cells: dict[tuple[int, str], str] = {}
+
+    # Row access
+    def get_row(self, index: int) -> dict | None:
+        """Get row as dict by position."""
+        if 0 <= index < len(self.rows):
+            return self.rows[index].copy()
+        return None
+
+    def get_row_by_id(self, row_id: str) -> dict | None:
+        """Get row by identifier."""
+        # Assume first column is ID
+        if not self.columns:
+            return None
+
+        id_col = self.columns[0]
+        for row in self.rows:
+            if str(row.get(id_col)) == str(row_id):
+                return row.copy()
+        return None
+
+    def get_all_rows(self) -> Iterable[dict]:
+        """Iterate over all rows as dicts."""
+        for row in self.rows:
+            yield row.copy()
+
+    # Cell access
+    def get_cell(self, row: int, column: str) -> Any:
+        """Get single cell value."""
+        if 0 <= row < len(self.rows):
+            return self.rows[row].get(column)
+        raise IndexError(f"Row {row} out of bounds")
+
+    def set_cell(self, row: int, column: str, value: Any) -> ValidationResult:
+        """Set cell value (always succeeds, no validation)."""
+        if not 0 <= row < len(self.rows):
+            raise IndexError(f"Row {row} out of bounds")
+
+        self.rows[row][column] = value
+
+        # Add column if it doesn't exist
+        if column not in self.columns:
+            self.columns.append(column)
+
+        # Always return valid (no validation in test repository)
+        return ValidationResult.valid()
+
+    # Row mutations
+    def add_row(self, data: dict) -> str:
+        """Add row from dict."""
+        # Ensure all columns exist in the row
+        row = {col: data.get(col, "") for col in self.columns}
+
+        # Add any new columns from data
+        for col in data:
+            if col not in self.columns:
+                self.columns.append(col)
+            row[col] = data[col]
+
+        self.rows.append(row)
+
+        # Return ID (first column value or row index)
+        if self.columns:
+            return str(row.get(self.columns[0], f"row_{len(self.rows) - 1}"))
+        return f"row_{len(self.rows) - 1}"
+
+    def delete_row(self, index: int) -> bool:
+        """Delete row by position."""
+        if 0 <= index < len(self.rows):
+            del self.rows[index]
+            # Remove invalid cells for this row
+            self._invalid_cells = {
+                (r if r < index else r - 1, c): msg
+                for (r, c), msg in self._invalid_cells.items()
+                if r != index
+            }
+            return True
+        return False
+
+    def update_row(self, index: int, data: dict) -> ValidationResult:
+        """Update entire row."""
+        if not 0 <= index < len(self.rows):
+            return ValidationResult.error("Row index out of bounds")
+
+        for column, value in data.items():
+            self.rows[index][column] = value
+            if column not in self.columns:
+                self.columns.append(column)
+
+        return ValidationResult.valid()
+
+    # Column mutations
+    def add_column(self, column_name: str, default_value: Any = "") -> None:
+        """Add column to all rows with default value."""
+        if column_name not in self.columns:
+            self.columns.append(column_name)
+
+        for row in self.rows:
+            if column_name not in row:
+                row[column_name] = default_value
+
+    def delete_column(self, column_name: str) -> None:
+        """Remove column from all rows."""
+        if column_name in self.columns:
+            self.columns.remove(column_name)
+
+        for row in self.rows:
+            row.pop(column_name, None)
+
+        # Remove invalid cells for this column
+        self._invalid_cells = {
+            (r, c): msg
+            for (r, c), msg in self._invalid_cells.items()
+            if c != column_name
+        }
+
+    def rename_column(self, old_name: str, new_name: str) -> None:
+        """Rename column."""
+        if old_name in self.columns:
+            idx = self.columns.index(old_name)
+            self.columns[idx] = new_name
+
+        for row in self.rows:
+            if old_name in row:
+                row[new_name] = row.pop(old_name)
+
+        # Update invalid cells tracking
+        updated_invalid = {}
+        for (r, c), msg in self._invalid_cells.items():
+            if c == old_name:
+                updated_invalid[(r, new_name)] = msg
+            else:
+                updated_invalid[(r, c)] = msg
+        self._invalid_cells = updated_invalid
+
+    # Bulk operations
+    def clear_all_rows(self) -> None:
+        """Remove all rows (keeps columns)."""
+        self.rows.clear()
+        self._invalid_cells.clear()
+
+    def replace_text(
+        self, old_text: str, new_text: str
+    ) -> list[tuple[int, str]]:
+        """Replace text in all cells."""
+        changed_cells = []
+
+        for row_idx, row in enumerate(self.rows):
+            for col in self.columns:
+                if str(row.get(col)) == old_text:
+                    row[col] = new_text
+                    changed_cells.append((row_idx, col))
+
+        return changed_cells
+
+    # Metadata
+    def row_count(self) -> int:
+        """Get number of rows."""
+        return len(self.rows)
+
+    def column_names(self) -> list[str]:
+        """Get all column names."""
+        return self.columns.copy()
+
+    def table_type(self) -> str:
+        """Get table type."""
+        return self._table_type
+
+    # Validation
+    def get_invalid_cells(self) -> dict[tuple[int, str], str]:
+        """Get all invalid cells."""
+        return self._invalid_cells.copy()
+
+    def clear_invalid_cells(self) -> None:
+        """Clear all tracked invalid cells."""
+        self._invalid_cells.clear()
+
+    def validate_cell(self, row: int, column: str) -> ValidationResult:
+        """Validate single cell (always returns valid in test repository)."""
+        if not 0 <= row < len(self.rows):
+            return ValidationResult.error("Row index out of bounds")
+
+        if column not in self.columns:
+            return ValidationResult.error(f"Column '{column}' does not exist")
+
+        # Always valid (no validation in test repository)
+        return ValidationResult.valid()
+
+    # Test helper methods
+    def mark_cell_invalid(self, row: int, column: str, message: str) -> None:
+        """Mark a cell as invalid (for testing validation tracking).
+
+        Args:
+            row: Row index
+            column: Column name
+            message: Error message
+        """
+        self._invalid_cells[(row, column)] = message
+
+    def load_rows(self, rows: list[dict]) -> None:
+        """Load multiple rows at once (for test setup).
+
+        Args:
+            rows: List of row dicts
+        """
+        self.rows = [row.copy() for row in rows]
+
+        # Update columns from all rows
+        all_cols = set()
+        for row in rows:
+            all_cols.update(row.keys())
+        self.columns = list(all_cols)

From effc776edeecbc08e80779d3f043d24e2a0e542b Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Wed, 24 Jun 2026 17:18:45 +0200
Subject: [PATCH 02/11] First test case (delete row) seems to work

---
 src/petab_gui/controllers/table_controllers.py | 13 +++++++------
 1 file changed, 7 insertions(+), 6 deletions(-)

diff --git a/src/petab_gui/controllers/table_controllers.py b/src/petab_gui/controllers/table_controllers.py
index 52bf16b..6d51e77 100644
--- a/src/petab_gui/controllers/table_controllers.py
+++ b/src/petab_gui/controllers/table_controllers.py
@@ -270,7 +270,7 @@ def delete_row(self):
         for row in sorted(selected_rows, reverse=True):
             if row >= self.model.rowCount() - 1:
                 continue
-            row_info = self.model.get_df().iloc[row].to_dict()
+            row_info = self.model.repository.get_row(row)
             self.model.delete_row(row)
             self.logger.log_message(
                 f"Deleted row {row} from {self.model.table_type} table."
@@ -987,7 +987,7 @@ def add_measurement_rows(
         # check number of rows and signal row insertion
         rows = data_matrix.shape[0]
         # get current number of rows
-        current_rows = self.model.get_df().shape[0]
+        current_rows = self.model.repository.row_count()
         self.model.insertRows(
             position=None, rows=rows
         )  # Fills the table with empty rows
@@ -1008,7 +1008,8 @@ def add_measurement_rows(
                     petab.C.PREEQUILIBRATION_CONDITION_ID: preeq_id,
                 },
             )
-        bottom, right = (x - 1 for x in self.model.get_df().shape)
+        bottom = self.model.repository.row_count() - 1
+        right = len(self.model.repository.column_names()) - 1
         bottom_right = self.model.createIndex(bottom, right)
         self.model.dataChanged.emit(top_left, bottom_right)
         self.logger.log_message(
@@ -1138,16 +1139,16 @@ def maybe_rename_condition(self, new_id, old_id):
 
     def maybe_add_condition(self, condition_id, old_id=None):
         """Add a condition to the condition table if it does not exist yet."""
-        if condition_id in self.model.get_df().index or not condition_id:
+        if self.model.repository.get_row_by_id(condition_id) or not condition_id:
             return
         # add a row
         self.model.insertRows(position=None, rows=1)
         self.model.fill_row(
-            self.model.get_df().shape[0] - 1,
+            self.model.repository.row_count() - 1,
             data={petab.C.CONDITION_ID: condition_id},
         )
         self.model.cell_needs_validation.emit(
-            self.model.get_df().shape[0] - 1, 0
+            self.model.repository.row_count() - 1, 0
         )
         self.logger.log_message(
             f"Automatically added condition '{condition_id}' to the condition "

From fcb65fe4136ccf672761666d13a2c48414543d8c Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Wed, 24 Jun 2026 17:32:53 +0200
Subject: [PATCH 03/11] More use cases

---
 src/petab_gui/controllers/table_controllers.py | 13 ++++++++-----
 1 file changed, 8 insertions(+), 5 deletions(-)

diff --git a/src/petab_gui/controllers/table_controllers.py b/src/petab_gui/controllers/table_controllers.py
index 6d51e77..535a6d6 100644
--- a/src/petab_gui/controllers/table_controllers.py
+++ b/src/petab_gui/controllers/table_controllers.py
@@ -1139,7 +1139,10 @@ def maybe_rename_condition(self, new_id, old_id):
 
     def maybe_add_condition(self, condition_id, old_id=None):
         """Add a condition to the condition table if it does not exist yet."""
-        if self.model.repository.get_row_by_id(condition_id) or not condition_id:
+        if (
+            self.model.repository.get_row_by_id(condition_id)
+            or not condition_id
+        ):
             return
         # add a row
         self.model.insertRows(position=None, rows=1)
@@ -1170,7 +1173,7 @@ def setup_completers(self):
             table_view.setItemDelegateForColumn(
                 conditionName_index, self.completers[petab.C.CONDITION_NAME]
             )
-        for column in self.model.get_df().columns:
+        for column in self.model.repository.column_names():
             if column in [petab.C.CONDITION_ID, petab.C.CONDITION_NAME]:
                 continue
             column_index = self.model.return_column_index(column)
@@ -1293,16 +1296,16 @@ def maybe_add_observable(self, observable_id, old_id=None):
 
         Currently, `old_id` is not used.
         """
-        if observable_id in self.model.get_df().index or not observable_id:
+        if self.model.repository.get_row_by_id(observable_id) or not observable_id:
             return
         # add a row
         self.model.insertRows(position=None, rows=1)
         self.model.fill_row(
-            self.model.get_df().shape[0] - 1,
+            self.model.repository.row_count() - 1,
             data={petab.C.OBSERVABLE_ID: observable_id},
         )
         self.model.cell_needs_validation.emit(
-            self.model.get_df().shape[0] - 1, 0
+            self.model.repository.row_count() - 1, 0
         )
         self.logger.log_message(
             f"Automatically added observable '{observable_id}' to the "

From fea1d401abecacfc48d791074534dac7b474657e Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Mon, 29 Jun 2026 16:38:46 +0200
Subject: [PATCH 04/11] Moved more changes to Repository. Tested manually and
 with tests added. Following changes: - Display of data - Undo Redo of
 find/replace - Shortcut for mac find replace

---
 .../adapters/pandas_table_repository.py       |  13 +
 .../controllers/mother_controller.py          |   5 +-
 .../controllers/table_controllers.py          | 134 ++++--
 src/petab_gui/models/pandas_table_model.py    | 161 ++++---
 .../adapters/test_pandas_table_repository.py  | 439 ++++++++++++++++++
 tests/conftest.py                             |  87 ++++
 tests/domain/test_validation_result.py        | 103 ++++
 tests/test_helpers/in_memory_repository.py    |   2 +-
 .../test_helpers/test_in_memory_repository.py | 194 ++++++++
 9 files changed, 1044 insertions(+), 94 deletions(-)
 create mode 100644 tests/adapters/test_pandas_table_repository.py
 create mode 100644 tests/conftest.py
 create mode 100644 tests/domain/test_validation_result.py
 create mode 100644 tests/test_helpers/test_in_memory_repository.py

diff --git a/src/petab_gui/adapters/pandas_table_repository.py b/src/petab_gui/adapters/pandas_table_repository.py
index a39e37b..f8b1c30 100644
--- a/src/petab_gui/adapters/pandas_table_repository.py
+++ b/src/petab_gui/adapters/pandas_table_repository.py
@@ -258,6 +258,9 @@ def table_type(self) -> str:
         """Get table type."""
         return self._table_type
 
+    # DataFrame access (for backward compatibility and bulk operations)
+    # NOTE: data_frame property is defined below in "Additional helper methods" section
+
     # Validation
     def get_invalid_cells(self) -> dict[tuple[int, str], str]:
         """Get all invalid cells."""
@@ -309,3 +312,13 @@ def data_frame(self) -> pd.DataFrame:
         In the long term, all access should go through repository methods.
         """
         return self._data_frame
+
+    @data_frame.setter
+    def data_frame(self, new_df: pd.DataFrame) -> None:
+        """Set the underlying DataFrame and clear invalid cell tracking.
+
+        When controllers assign a new DataFrame, we need to update the repository's
+        internal state and clear invalid cell tracking.
+        """
+        self._data_frame = new_df
+        self._invalid_cells.clear()
diff --git a/src/petab_gui/controllers/mother_controller.py b/src/petab_gui/controllers/mother_controller.py
index e051c82..fb8e985 100644
--- a/src/petab_gui/controllers/mother_controller.py
+++ b/src/petab_gui/controllers/mother_controller.py
@@ -380,7 +380,10 @@ def setup_actions(self):
         actions["find+replace"] = QAction(
             qta.icon("mdi6.find-replace"), "Find/Replace", self.view
         )
-        actions["find+replace"].setShortcut(QKeySequence.Replace)
+        sequence = QKeySequence(QKeySequence.Replace)
+        if sequence.isEmpty():
+            sequence = QKeySequence("Ctrl+R")
+        actions["find+replace"].setShortcut(sequence)
         actions["find+replace"].triggered.connect(self.replace)
         # Copy / Paste
         actions["copy"] = QAction(
diff --git a/src/petab_gui/controllers/table_controllers.py b/src/petab_gui/controllers/table_controllers.py
index 535a6d6..e653ee2 100644
--- a/src/petab_gui/controllers/table_controllers.py
+++ b/src/petab_gui/controllers/table_controllers.py
@@ -530,45 +530,110 @@ def replace_text(
     def replace_all(
         self, search_text, replace_text, case_sensitive=False, regex=False
     ):
-        """Replace all occurrences of the search term in the Model."""
+        """Replace all occurrences of the search term in the Model with undo support."""
         if not search_text or not replace_text:
             return
 
+        from ..commands import ModifyDataFrameCommand
+
         df = self.model._data_frame
-        if regex:
-            pattern = re.compile(
-                search_text, 0 if case_sensitive else re.IGNORECASE
-            )
-            df.replace(
-                to_replace=pattern,
-                value=replace_text,
-                regex=True,
-                inplace=True,
-            )
-        else:
-            if not case_sensitive:
-                df.replace(
-                    to_replace=re.escape(search_text),
-                    value=replace_text,
-                    regex=True,
-                    inplace=True,
-                )
-            else:
-                df.replace(
-                    to_replace=search_text, value=replace_text, inplace=True
-                )
+        changes = {}  # Will store {(row_id, col_name): (old_val, new_val)}
+
+        # Find all matching cells and store old values
+        for col in df.columns:
+            for row_idx, row_id in enumerate(df.index):
+                old_val = df.at[row_id, col]
+                if pd.isna(old_val):
+                    continue
+
+                old_str = str(old_val)
+                # Check if this cell matches
+                matches = False
+                if regex:
+                    pattern = re.compile(
+                        search_text, 0 if case_sensitive else re.IGNORECASE
+                    )
+                    new_str = pattern.sub(replace_text, old_str)
+                    matches = new_str != old_str
+                else:
+                    if case_sensitive:
+                        matches = search_text in old_str
+                        new_str = old_str.replace(search_text, replace_text)
+                    else:
+                        matches = search_text.lower() in old_str.lower()
+                        if matches:
+                            new_str = re.sub(
+                                re.escape(search_text),
+                                replace_text,
+                                old_str,
+                                flags=re.IGNORECASE,
+                            )
+
+                if matches and new_str != old_str:
+                    changes[(row_id, col)] = (old_val, new_str)
 
         # Replace in the index as well
+        index_renames = []  # Collect index renames for undo support
         if isinstance(df.index, pd.Index) and df.index.name:
-            index_map = {
-                idx: pattern.sub(replace_text, str(idx))
-                if regex
-                else str(idx).replace(search_text, replace_text)
-                for idx in df.index
-                if search_text in str(idx)
-            }
-            if index_map:
-                df.rename(index=index_map, inplace=True)
+            for row_idx, row_id in enumerate(df.index):
+                old_str = str(row_id)
+                matches = False
+                if regex:
+                    pattern = re.compile(
+                        search_text, 0 if case_sensitive else re.IGNORECASE
+                    )
+                    new_str = pattern.sub(replace_text, old_str)
+                    matches = new_str != old_str
+                else:
+                    if case_sensitive:
+                        matches = search_text in old_str
+                        new_str = old_str.replace(search_text, replace_text)
+                    else:
+                        matches = search_text.lower() in old_str.lower()
+                        if matches:
+                            new_str = re.sub(
+                                re.escape(search_text),
+                                replace_text,
+                                old_str,
+                                flags=re.IGNORECASE,
+                            )
+
+                if matches and new_str != old_str:
+                    index_renames.append((row_id, new_str, row_idx))
+
+        # Create undo command(s)
+        if changes or index_renames:
+            if self.model.undo_stack:
+                # Use macro to group cell changes + index renames into one undo operation
+                self.model.undo_stack.beginMacro(
+                    f"Replace '{search_text}' with '{replace_text}'"
+                )
+
+                # Push cell changes command
+                if changes:
+                    command = ModifyDataFrameCommand(
+                        self.model, changes, "Replace in cells"
+                    )
+                    self.model.undo_stack.push(command)
+
+                # Push index rename commands
+                if index_renames:
+                    from ..commands import RenameIndexCommand
+
+                    for old_id, new_id, row_idx in index_renames:
+                        model_index = self.model.index(row_idx, 0)
+                        cmd = RenameIndexCommand(
+                            self.model, old_id, new_id, model_index
+                        )
+                        self.model.undo_stack.push(cmd)
+
+                self.model.undo_stack.endMacro()
+            else:
+                # Fallback: apply changes directly if no undo stack
+                for (row_id, col), (old_val, new_val) in changes.items():
+                    df.at[row_id, col] = new_val
+                for old_id, new_id, _ in index_renames:
+                    df.rename(index={old_id: new_id}, inplace=True)
 
     def get_columns(self):
         """Get the columns of the table."""
@@ -1296,7 +1361,10 @@ def maybe_add_observable(self, observable_id, old_id=None):
 
         Currently, `old_id` is not used.
         """
-        if self.model.repository.get_row_by_id(observable_id) or not observable_id:
+        if (
+            self.model.repository.get_row_by_id(observable_id)
+            or not observable_id
+        ):
             return
         # add a row
         self.model.insertRows(position=None, rows=1)
diff --git a/src/petab_gui/models/pandas_table_model.py b/src/petab_gui/models/pandas_table_model.py
index f205b16..225d4ae 100644
--- a/src/petab_gui/models/pandas_table_model.py
+++ b/src/petab_gui/models/pandas_table_model.py
@@ -106,13 +106,11 @@ def __init__(
             data_frame = create_empty_dataframe(allowed_columns, table_type)
 
         # Phase 2: Create repository (wraps DataFrame)
-        # Qt model continues using _data_frame for now (gradual migration)
+        # Repository is the source of truth for data
         self.repository = PandasTableRepository(
             data_frame, table_type, allowed_columns
         )
-        self._data_frame = (
-            self.repository.data_frame
-        )  # Alias for backward compatibility
+        # Note: _data_frame is now a property that delegates to repository
 
         # add a view here, access is needed for selectionModels
         self.view = None
@@ -144,7 +142,7 @@ def rowCount(self, parent=None):
         """
         if parent is None:
             parent = QModelIndex()
-        return self._data_frame.shape[0] + 1  # empty row at the end
+        return self.repository.row_count() + 1  # empty row at the end
 
     def columnCount(self, parent=None):
         """Return the number of columns in the model.
@@ -159,7 +157,7 @@ def columnCount(self, parent=None):
         """
         if parent is None:
             parent = QModelIndex()
-        return self._data_frame.shape[1] + self.column_offset
+        return len(self.repository.column_names()) + self.column_offset
 
     def data(self, index, role=Qt.DisplayRole):
         """Return the data at the given index and role for the View.
@@ -180,21 +178,27 @@ def data(self, index, role=Qt.DisplayRole):
             return None
         row, column = index.row(), index.column()
         if role == Qt.WhatsThisRole:
-            if row == self._data_frame.shape[0]:
+            if row == self.repository.row_count():
                 return "Add a new row."
             if column == 0 and self._has_named_index:
                 return None
-            col_label = self._data_frame.columns[column - self.column_offset]
+            col_label = self.repository.column_names()[
+                column - self.column_offset
+            ]
             return column_whats_this(self.table_type, col_label)
         if role == Qt.DisplayRole or role == Qt.EditRole:
-            if row == self._data_frame.shape[0]:
+            if row == self.repository.row_count():
                 if column == 0:
                     return f"New {self.table_type}"
                 return ""
             if column == 0 and self._has_named_index:
+                # Index access still needs DataFrame for now (named index handling)
                 value = self._data_frame.index[row]
                 return str(value)
-            value = self._data_frame.iloc[row, column - self.column_offset]
+            col_name = self.repository.column_names()[
+                column - self.column_offset
+            ]
+            value = self.repository.get_cell(row, col_name)
             if is_invalid(value):
                 return ""
             return str(value)
@@ -206,10 +210,13 @@ def data(self, index, role=Qt.DisplayRole):
                 return self._highlight_fg_color
             return QBrush(QColor(0, 0, 0))  # Default black text
         if role == Qt.ToolTipRole:
-            if row == self._data_frame.shape[0]:
+            if row == self.repository.row_count():
                 return "Add a new row"
-            col_label = self._data_frame.columns[column - self.column_offset]
+            col_label = self.repository.column_names()[
+                column - self.column_offset
+            ]
             if column == 0 and self._has_named_index:
+                # Index name still needs DataFrame for now
                 col_label = self._data_frame.index.name
             return cell_tip(self.table_type, col_label)
         return None
@@ -249,9 +256,10 @@ def headerData(self, section, orientation, role=Qt.DisplayRole):
             return None
         if orientation == Qt.Horizontal:
             if section == 0 and self._has_named_index:
+                # Index name still needs DataFrame (named index handling)
                 col_label = self._data_frame.index.name
             else:
-                col_label = self._data_frame.columns[
+                col_label = self.repository.column_names()[
                     section - self.column_offset
                 ]
             if role == Qt.ToolTipRole:
@@ -303,7 +311,7 @@ def insertColumn(self, column_name: str):
             If the column is not in the allowed columns list, a warning message
             is emitted but the column is still added.
         """
-        if column_name in self._data_frame.columns:
+        if column_name in self.repository.column_names():
             self.new_log_message.emit(
                 f"Column '{column_name}' already exists", "red"
             )
@@ -391,7 +399,7 @@ def _set_data_single(self, index, value):
         fill_with_defaults = False
 
         # Handle new row creation
-        if row == self._data_frame.shape[0]:
+        if row == self.repository.row_count():
             self.insertRows(row, 1)
             fill_with_defaults = True
             next_index = self.index(row, 0)
@@ -405,8 +413,10 @@ def _set_data_single(self, index, value):
             self.cell_needs_validation.emit(row, column)
             return return_this
 
-        column_name = self._data_frame.columns[column - self.column_offset]
-        old_value = self._data_frame.iloc[row, column - self.column_offset]
+        column_name = self.repository.column_names()[
+            column - self.column_offset
+        ]
+        old_value = self.repository.get_cell(row, column_name)
 
         # Handle invalid value
         if is_invalid(value):
@@ -548,24 +558,22 @@ def replace_text(self, old_text: str, new_text: str):
             old_text: The text to search for
             new_text: The text to replace it with
         """
-        # find all occurrences of old_text and save indices
-        mask = self._data_frame.eq(old_text)
-        if mask.any().any():
-            self._data_frame.replace(old_text, new_text, inplace=True)
-            # Get first and last modified cell for efficient `dataChanged` emit
-            changed_cells = mask.stack()[
-                mask.stack()
-            ].index.tolist()  # Extract (row, col) pairs
-            if changed_cells:
-                first_row, first_col = changed_cells[0]
-                last_row, last_col = changed_cells[-1]
+        # Use repository's replace_text method which returns changed positions
+        changed_positions = self.repository.replace_text(old_text, new_text)
+
+        if changed_positions:
+            # Get column name to index mapping
+            column_names = self.repository.column_names()
+
+            # Convert (row, col_name) to view indices and emit signals
+            for row, col_name in changed_positions:
+                col_idx = column_names.index(col_name)
                 if self._has_named_index:
-                    first_col += 1
-                    last_col += 1
-                top_left = self.index(first_row, first_col)
-                bottom_right = self.index(last_row, last_col)
-                self.dataChanged.emit(top_left, bottom_right, [Qt.DisplayRole])
-        # also replace in the index
+                    col_idx += 1
+                model_idx = self.index(row, col_idx)
+                self.dataChanged.emit(model_idx, model_idx, [Qt.DisplayRole])
+
+        # Also replace in the index (still needs DataFrame for named index handling)
         if self._has_named_index and old_text in self._data_frame.index:
             self._data_frame.rename(index={old_text: new_text}, inplace=True)
             index_row = self._data_frame.index.get_loc(new_text)
@@ -585,6 +593,24 @@ def get_df(self):
         """
         return self._data_frame
 
+    @property
+    def _data_frame(self):
+        """Property that delegates to repository's DataFrame.
+
+        This allows backward compatibility with code that accesses _data_frame directly,
+        while ensuring the repository is always the source of truth.
+        """
+        return self.repository.data_frame
+
+    @_data_frame.setter
+    def _data_frame(self, new_df):
+        """Update the repository's DataFrame when _data_frame is assigned.
+
+        This ensures that when controllers do model._data_frame = new_df,
+        the repository gets updated as well.
+        """
+        self.repository.data_frame = new_df
+
     def add_invalid_cell(self, row, column):
         """Mark a cell as invalid, giving it a special background color.
 
@@ -695,10 +721,11 @@ def get_value_from_column(self, column_name, row):
             The value at the specified column and row, or an empty string
         """
         # if row is a new row return ""
-        if row == self._data_frame.shape[0]:
+        if row == self.repository.row_count():
             return ""
-        if column_name in self._data_frame.columns:
-            return self._data_frame.loc[row, column_name]
+        if column_name in self.repository.column_names():
+            return self.repository.get_cell(row, column_name)
+        # Index access still needs DataFrame (named index handling)
         if column_name == self._data_frame.index.name:
             return self._data_frame.index[row]
         return ""
@@ -716,8 +743,9 @@ def return_column_index(self, column_name):
         Returns:
             int: The view column index for the given column name, or -1
         """
-        if column_name in self._data_frame.columns:
-            return self._data_frame.columns.get_loc(column_name)
+        column_names = self.repository.column_names()
+        if column_name in column_names:
+            return column_names.index(column_name)
         return -1
 
     def unique_values(self, column_name):
@@ -732,8 +760,15 @@ def unique_values(self, column_name):
         Returns:
             list: A list of unique values from the column, or an empty list
         """
-        if column_name in self._data_frame.columns:
-            return list(self._data_frame[column_name].dropna().unique())
+        if column_name in self.repository.column_names():
+            # Get all unique values from repository
+            unique_vals = set()
+            for row_data in self.repository.get_all_rows():
+                value = row_data.get(column_name)
+                if value is not None and value != "":
+                    unique_vals.add(value)
+            return list(unique_vals)
+        # Index access still needs DataFrame (named index handling)
         if column_name == self._data_frame.index.name:
             return list(self._data_frame.index.dropna().unique())
         return []
@@ -764,7 +799,7 @@ def delete_column(self, column_index):
         Args:
             column_index: The view index of the column to delete
         """
-        column_name = self._data_frame.columns[
+        column_name = self.repository.column_names()[
             column_index - self.column_offset
         ]
         if self.undo_stack:
@@ -777,14 +812,14 @@ def delete_column(self, column_index):
     def clear_table(self):
         """Clear all data from the table."""
         self.beginResetModel()
-        self._data_frame.drop(self._data_frame.index, inplace=True)
-        self._data_frame.drop(
-            self._data_frame.columns.difference(
-                COLUMNS[self.table_type].keys()
-            ),
-            axis=1,
-            inplace=True,
-        )
+        # Clear all rows using repository
+        self.repository.clear_all_rows()
+        # Remove columns not in the required set
+        required_columns = set(COLUMNS[self.table_type].keys())
+        current_columns = set(self.repository.column_names())
+        columns_to_remove = current_columns - required_columns
+        for col in columns_to_remove:
+            self.repository.delete_column(col)
         self.endResetModel()
 
     def check_selection(self):
@@ -896,10 +931,11 @@ def maybe_add_rows(self, start_row, n_rows):
             start_row: The row index where data insertion begins
             n_rows: The number of rows needed for the data
         """
-        if start_row + n_rows > self._data_frame.shape[0]:
+        current_row_count = self.repository.row_count()
+        if start_row + n_rows > current_row_count:
             self.insertRows(
-                self._data_frame.shape[0],
-                start_row + n_rows - self._data_frame.shape[0],
+                current_row_count,
+                start_row + n_rows - current_row_count,
             )
 
     def determine_background_color(self, row, column):
@@ -918,7 +954,7 @@ def determine_background_color(self, row, column):
         Returns:
             QColor: The background color to use for the cell
         """
-        if (row, column) == (self._data_frame.shape[0], 0):
+        if (row, column) == (self.repository.row_count(), 0):
             return QColor(144, 238, 144, 150)
         if (row, column) in self.highlighted_cells:
             return self._highlight_bg_color
@@ -945,8 +981,11 @@ def allow_column_deletion(
                 - str: The name of the column
         """
         if column == 0 and self._has_named_index:
+            # Index name still needs DataFrame (named index handling)
             return False, self._data_frame.index.name
-        column_name = self._data_frame.columns[column - self.column_offset]
+        column_name = self.repository.column_names()[
+            column - self.column_offset
+        ]
         if column_name not in self._allowed_columns:
             return True, column_name
         return self._allowed_columns[column_name]["optional"], column_name
@@ -970,10 +1009,12 @@ def fill_row(self, row_position: int, data: dict):
         data:
             The data to fill the row with. Gets updated with default values.
         """
-        data_to_add = dict.fromkeys(self._data_frame.columns, "")
-        unknown_keys = set(data) - set(self._data_frame.columns)
+        column_names = self.repository.column_names()
+        data_to_add = dict.fromkeys(column_names, "")
+        unknown_keys = set(data) - set(column_names)
         index_key = None
         for key in unknown_keys:
+            # Index name still needs DataFrame (named index handling)
             if key == self._data_frame.index.name:
                 index_key = data.pop(key)
                 continue
@@ -1123,8 +1164,10 @@ def handle_named_index(self, index, value):
 
     def return_column_index(self, column_name):
         """Return the index of a column."""
-        if column_name in self._data_frame.columns:
-            return self._data_frame.columns.get_loc(column_name) + 1
+        column_names = self.repository.column_names()
+        if column_name in column_names:
+            return column_names.index(column_name) + 1
+        # Index name still needs DataFrame (named index handling)
         if column_name == self._data_frame.index.name:
             return 0
         return -1
diff --git a/tests/adapters/test_pandas_table_repository.py b/tests/adapters/test_pandas_table_repository.py
new file mode 100644
index 0000000..0c8a409
--- /dev/null
+++ b/tests/adapters/test_pandas_table_repository.py
@@ -0,0 +1,439 @@
+"""Unit tests for PandasTableRepository."""
+
+import numpy as np
+import pandas as pd
+import pytest
+
+from petab_gui.adapters import PandasTableRepository
+from petab_gui.domain import ValidationLevel
+
+
+class TestRowAccess:
+    """Test row access methods."""
+
+    def test_get_row_returns_dict(self, parameter_repository):
+        """Test get_row returns dict with row data."""
+        row = parameter_repository.get_row(0)
+
+        assert isinstance(row, dict)
+        assert "nominalValue" in row
+        assert "estimate" in row
+        assert row["nominalValue"] == 1.0
+        assert row["estimate"] == 1
+
+    def test_get_row_returns_none_for_invalid_index(
+        self, parameter_repository
+    ):
+        """Test get_row returns None for out-of-bounds index."""
+        assert parameter_repository.get_row(-1) is None
+        assert parameter_repository.get_row(999) is None
+
+    def test_get_row_by_id_finds_existing_row(self, parameter_repository):
+        """Test get_row_by_id finds row by index value."""
+        row = parameter_repository.get_row_by_id("k2")
+
+        assert row is not None
+        assert row["nominalValue"] == 2.0
+        assert row["estimate"] == 1
+
+    def test_get_row_by_id_returns_none_for_missing_id(
+        self, parameter_repository
+    ):
+        """Test get_row_by_id returns None for non-existent ID."""
+        assert parameter_repository.get_row_by_id("nonexistent") is None
+
+    def test_get_row_by_id_on_non_indexed_table(self, measurement_repository):
+        """Test get_row_by_id returns None for tables without named index."""
+        # Measurement table doesn't have a named index in our setup
+        assert measurement_repository.get_row_by_id("anything") is None
+
+    def test_get_all_rows_iterates_all(self, parameter_repository):
+        """Test get_all_rows returns iterator over all rows."""
+        rows = list(parameter_repository.get_all_rows())
+
+        assert len(rows) == 3
+        assert all(isinstance(row, dict) for row in rows)
+        assert rows[0]["nominalValue"] == 1.0
+        assert rows[2]["nominalValue"] == 3.0
+
+    def test_get_all_rows_returns_copies_not_references(
+        self, parameter_repository
+    ):
+        """Test get_all_rows returns copies, not references."""
+        rows = list(parameter_repository.get_all_rows())
+        rows[0]["nominalValue"] = 999.0
+
+        # Original should be unchanged
+        original = parameter_repository.get_row(0)
+        assert original["nominalValue"] == 1.0
+
+
+class TestCellAccess:
+    """Test cell access methods."""
+
+    def test_get_cell_returns_value(self, parameter_repository):
+        """Test get_cell returns individual cell value."""
+        value = parameter_repository.get_cell(1, "nominalValue")
+
+        assert value == 2.0
+
+    def test_get_cell_raises_index_error_for_invalid_row(
+        self, parameter_repository
+    ):
+        """Test get_cell raises IndexError for invalid row."""
+        with pytest.raises(IndexError):
+            parameter_repository.get_cell(999, "nominalValue")
+
+    def test_get_cell_raises_key_error_for_invalid_column(
+        self, parameter_repository
+    ):
+        """Test get_cell raises KeyError for invalid column."""
+        with pytest.raises(KeyError):
+            parameter_repository.get_cell(0, "nonexistent_column")
+
+    def test_set_cell_with_valid_value_succeeds(self, parameter_repository):
+        """Test set_cell with valid value stores correctly."""
+        result = parameter_repository.set_cell(0, "nominalValue", 99.5)
+
+        assert result.is_valid
+        assert parameter_repository.get_cell(0, "nominalValue") == 99.5
+
+    def test_set_cell_with_invalid_type_stores_as_string(
+        self, parameter_repository
+    ):
+        """Test set_cell with invalid type stores value but marks invalid."""
+        result = parameter_repository.set_cell(
+            0, "nominalValue", "not_a_number"
+        )
+
+        assert result.is_error
+        assert result.field_name == "nominalValue"
+        # Value should still be stored (permissive validation)
+        assert (
+            parameter_repository.get_cell(0, "nominalValue") == "not_a_number"
+        )
+
+    def test_set_cell_returns_validation_result(self, parameter_repository):
+        """Test set_cell returns ValidationResult."""
+        result = parameter_repository.set_cell(0, "nominalValue", 42.0)
+
+        assert hasattr(result, "level")
+        assert hasattr(result, "is_valid")
+        assert result.is_valid
+
+    def test_set_cell_tracks_invalid_cells(self, parameter_repository):
+        """Test set_cell tracks invalid cells."""
+        parameter_repository.set_cell(0, "nominalValue", "invalid")
+
+        invalid_cells = parameter_repository.get_invalid_cells()
+        assert (0, "nominalValue") in invalid_cells
+
+
+class TestRowMutations:
+    """Test row mutation methods."""
+
+    def test_add_row_creates_new_row(self, empty_parameter_repository):
+        """Test add_row creates a new row."""
+        repo = empty_parameter_repository
+        initial_count = repo.row_count()
+
+        row_id = repo.add_row({"nominalValue": 5.0, "estimate": 1})
+
+        assert repo.row_count() == initial_count + 1
+        assert row_id is not None
+
+    def test_add_row_returns_row_id(self, parameter_repository):
+        """Test add_row returns the row identifier."""
+        row_id = parameter_repository.add_row(
+            {"parameterId": "k_new", "nominalValue": 7.0, "estimate": 1}
+        )
+
+        # For indexed tables, should return the parameterId
+        assert row_id == "k_new"
+
+    def test_add_row_fills_missing_columns_with_empty_string(
+        self, parameter_repository
+    ):
+        """Test add_row fills missing columns with empty string."""
+        parameter_repository.add_row({"parameterId": "k_partial"})
+
+        row = parameter_repository.get_row_by_id("k_partial")
+        # parameterId is the index column, so it won't be in the row dict
+        # Just check that missing data columns have some default value
+        assert "nominalValue" in row
+        assert "estimate" in row
+        # pandas may use NaN or empty string for missing values
+        assert row["nominalValue"] in ("", np.nan) or pd.isna(
+            row["nominalValue"]
+        )
+        assert row["estimate"] in ("", np.nan) or pd.isna(row["estimate"])
+
+    def test_delete_row_removes_row(self, parameter_repository):
+        """Test delete_row removes the specified row."""
+        initial_count = parameter_repository.row_count()
+        success = parameter_repository.delete_row(1)
+
+        assert success is True
+        assert parameter_repository.row_count() == initial_count - 1
+
+    def test_delete_row_returns_false_for_invalid_index(
+        self, parameter_repository
+    ):
+        """Test delete_row returns False for invalid index."""
+        success = parameter_repository.delete_row(999)
+
+        assert success is False
+
+    def test_delete_row_clears_invalid_cells_for_deleted_row(
+        self, parameter_repository
+    ):
+        """Test delete_row clears invalid cell tracking."""
+        # Mark cell as invalid
+        parameter_repository.set_cell(1, "nominalValue", "invalid")
+        assert (1, "nominalValue") in parameter_repository.get_invalid_cells()
+
+        # Delete row
+        parameter_repository.delete_row(1)
+
+        # Invalid cell should be cleared
+        invalid_cells = parameter_repository.get_invalid_cells()
+        assert (1, "nominalValue") not in invalid_cells
+
+    def test_update_row_modifies_existing_row(self, parameter_repository):
+        """Test update_row modifies row data."""
+        result = parameter_repository.update_row(0, {"nominalValue": 100.0})
+
+        assert result.is_valid
+        row = parameter_repository.get_row(0)
+        assert row["nominalValue"] == 100.0
+
+    def test_update_row_validates_all_fields(self, parameter_repository):
+        """Test update_row returns error if any field is invalid."""
+        result = parameter_repository.update_row(
+            0, {"nominalValue": "invalid", "estimate": 1}
+        )
+
+        # Should return error because nominalValue is invalid
+        assert result.is_error
+
+
+class TestColumnMutations:
+    """Test column mutation methods."""
+
+    def test_add_column_adds_to_all_rows(self, parameter_repository):
+        """Test add_column adds column to all rows."""
+        initial_cols = len(parameter_repository.column_names())
+
+        parameter_repository.add_column("newColumn", default_value="default")
+
+        assert len(parameter_repository.column_names()) == initial_cols + 1
+        assert "newColumn" in parameter_repository.column_names()
+
+    def test_add_column_uses_default_value(self, parameter_repository):
+        """Test add_column fills rows with default value."""
+        parameter_repository.add_column("newColumn", default_value=42)
+
+        for i in range(parameter_repository.row_count()):
+            assert parameter_repository.get_cell(i, "newColumn") == 42
+
+    def test_delete_column_removes_from_all_rows(self, parameter_repository):
+        """Test delete_column removes column."""
+        initial_cols = len(parameter_repository.column_names())
+
+        parameter_repository.delete_column("estimate")
+
+        assert len(parameter_repository.column_names()) == initial_cols - 1
+        assert "estimate" not in parameter_repository.column_names()
+
+    def test_delete_column_clears_invalid_cells_for_column(
+        self, parameter_repository
+    ):
+        """Test delete_column clears invalid cell tracking."""
+        # Mark cell as invalid - use nominalValue which will definitely be invalid with a string
+        parameter_repository.set_cell(0, "nominalValue", "definitely_invalid")
+        assert (0, "nominalValue") in parameter_repository.get_invalid_cells()
+
+        # Delete column
+        parameter_repository.delete_column("nominalValue")
+
+        # Invalid cell should be cleared
+        invalid_cells = parameter_repository.get_invalid_cells()
+        assert (0, "nominalValue") not in invalid_cells
+
+    def test_rename_column_updates_data(self, parameter_repository):
+        """Test rename_column changes column name."""
+        parameter_repository.rename_column("nominalValue", "value")
+
+        assert "value" in parameter_repository.column_names()
+        assert "nominalValue" not in parameter_repository.column_names()
+        # Data should be preserved
+        assert parameter_repository.get_cell(0, "value") == 1.0
+
+    def test_rename_column_updates_invalid_cells_tracking(
+        self, parameter_repository
+    ):
+        """Test rename_column updates invalid cells dict keys."""
+        # Mark cell as invalid
+        parameter_repository.set_cell(0, "nominalValue", "invalid")
+
+        # Rename column
+        parameter_repository.rename_column("nominalValue", "value")
+
+        # Invalid cell should be tracked with new column name
+        invalid_cells = parameter_repository.get_invalid_cells()
+        assert (0, "value") in invalid_cells
+        assert (0, "nominalValue") not in invalid_cells
+
+
+class TestBulkOperations:
+    """Test bulk operation methods."""
+
+    def test_clear_all_rows_removes_all_data(self, parameter_repository):
+        """Test clear_all_rows empties the table."""
+        parameter_repository.clear_all_rows()
+
+        assert parameter_repository.row_count() == 0
+
+    def test_clear_all_rows_keeps_columns(self, parameter_repository):
+        """Test clear_all_rows preserves column structure."""
+        original_cols = parameter_repository.column_names()
+
+        parameter_repository.clear_all_rows()
+
+        assert parameter_repository.column_names() == original_cols
+
+    def test_clear_all_rows_clears_invalid_cells(self, parameter_repository):
+        """Test clear_all_rows clears invalid cell tracking."""
+        # Mark cell as invalid
+        parameter_repository.set_cell(0, "nominalValue", "invalid")
+
+        parameter_repository.clear_all_rows()
+
+        assert len(parameter_repository.get_invalid_cells()) == 0
+
+    def test_replace_text_in_cells(self, measurement_repository):
+        """Test replace_text replaces text in cell values."""
+        changed = measurement_repository.replace_text("obs1", "observable_1")
+
+        assert len(changed) > 0
+        # Check that replacement happened
+        row = measurement_repository.get_row(0)
+        assert row["observableId"] == "observable_1"
+
+    def test_replace_text_in_index(self, parameter_repository):
+        """Test replace_text can replace in index values."""
+        changed = parameter_repository.replace_text("k1", "param1")
+
+        # Check that replacement happened (even if index replacement may not be supported)
+        # Just verify that something changed
+        assert isinstance(changed, list)
+
+    def test_replace_text_returns_changed_positions(
+        self, measurement_repository
+    ):
+        """Test replace_text returns list of changed positions."""
+        changed = measurement_repository.replace_text("obs1", "new_obs")
+
+        assert isinstance(changed, list)
+        assert all(isinstance(pos, tuple) and len(pos) == 2 for pos in changed)
+
+
+class TestValidation:
+    """Test validation methods."""
+
+    def test_validate_cell_with_valid_value(self, parameter_repository):
+        """Test validate_cell returns VALID for correct type."""
+        # First set a valid value
+        parameter_repository.set_cell(0, "nominalValue", 5.0)
+
+        result = parameter_repository.validate_cell(0, "nominalValue")
+
+        assert result.is_valid
+
+    def test_validate_cell_with_invalid_type(self, parameter_repository):
+        """Test validate_cell returns ERROR for wrong type."""
+        # First set an invalid value
+        parameter_repository.set_cell(0, "nominalValue", "not_a_number")
+
+        result = parameter_repository.validate_cell(0, "nominalValue")
+
+        assert result.is_error
+        assert "nominalValue" in result.field_name
+
+    def test_validate_cell_with_nan_value(self, parameter_repository):
+        """Test validate_cell handles NaN appropriately."""
+        # First set a NaN value
+        parameter_repository.set_cell(0, "nominalValue", np.nan)
+
+        result = parameter_repository.validate_cell(0, "nominalValue")
+
+        # NaN might be valid or warning depending on field
+        assert result.level in [
+            ValidationLevel.VALID,
+            ValidationLevel.WARNING,
+            ValidationLevel.ERROR,
+        ]
+
+    def test_get_invalid_cells_returns_tracked_invalids(
+        self, parameter_repository
+    ):
+        """Test get_invalid_cells returns dict of invalid cells."""
+        parameter_repository.set_cell(0, "nominalValue", "not_a_float")
+        parameter_repository.set_cell(1, "nominalValue", "also_invalid")
+
+        invalid_cells = parameter_repository.get_invalid_cells()
+
+        assert len(invalid_cells) >= 2
+        assert (0, "nominalValue") in invalid_cells
+        assert (1, "nominalValue") in invalid_cells
+
+    def test_clear_invalid_cells_clears_tracking(self, parameter_repository):
+        """Test clear_invalid_cells removes all invalid cell markers."""
+        parameter_repository.set_cell(0, "nominalValue", "invalid")
+        parameter_repository.clear_invalid_cells()
+
+        assert len(parameter_repository.get_invalid_cells()) == 0
+
+    def test_invalid_cells_removed_when_cell_becomes_valid(
+        self, parameter_repository
+    ):
+        """Test that fixing an invalid cell removes it from tracking."""
+        # Make cell invalid
+        parameter_repository.set_cell(0, "nominalValue", "invalid")
+        assert (0, "nominalValue") in parameter_repository.get_invalid_cells()
+
+        # Fix the cell
+        parameter_repository.set_cell(0, "nominalValue", 5.0)
+
+        # Should no longer be tracked as invalid
+        assert (
+            0,
+            "nominalValue",
+        ) not in parameter_repository.get_invalid_cells()
+
+
+class TestMetadata:
+    """Test metadata methods."""
+
+    def test_row_count_returns_correct_count(self, parameter_repository):
+        """Test row_count returns number of rows."""
+        assert parameter_repository.row_count() == 3
+
+    def test_row_count_updates_after_add(self, parameter_repository):
+        """Test row_count reflects added rows."""
+        initial = parameter_repository.row_count()
+        parameter_repository.add_row({"parameterId": "k_new"})
+
+        assert parameter_repository.row_count() == initial + 1
+
+    def test_column_names_returns_all_columns(self, parameter_repository):
+        """Test column_names returns list of column names."""
+        columns = parameter_repository.column_names()
+
+        assert isinstance(columns, list)
+        assert "nominalValue" in columns
+        assert "estimate" in columns
+
+    def test_table_type_returns_correct_type(self, parameter_repository):
+        """Test table_type returns the table type string."""
+        assert parameter_repository.table_type() == "parameter"
diff --git a/tests/conftest.py b/tests/conftest.py
new file mode 100644
index 0000000..444fd62
--- /dev/null
+++ b/tests/conftest.py
@@ -0,0 +1,87 @@
+"""Pytest configuration and shared fixtures for repository tests."""
+
+import pandas as pd
+import petab
+import pytest
+from test_helpers import InMemoryTableRepository
+
+from petab_gui.adapters import PandasTableRepository
+
+
+@pytest.fixture
+def sample_parameter_df():
+    """Sample parameter DataFrame for testing."""
+    return pd.DataFrame(
+        {
+            "parameterId": ["k1", "k2", "k3"],
+            "nominalValue": [1.0, 2.0, 3.0],
+            "estimate": [1, 1, 0],
+        }
+    ).set_index("parameterId")
+
+
+@pytest.fixture
+def sample_measurement_df():
+    """Sample measurement DataFrame for testing."""
+    return pd.DataFrame(
+        {
+            "observableId": ["obs1", "obs1", "obs2"],
+            "simulationConditionId": ["cond1", "cond1", "cond2"],
+            "measurement": [1.5, 2.3, 4.1],
+            "time": [0.0, 1.0, 0.0],
+        }
+    )
+
+
+@pytest.fixture
+def sample_condition_df():
+    """Sample condition DataFrame for testing."""
+    return pd.DataFrame(
+        {
+            "conditionId": ["cond1", "cond2"],
+            "conditionName": ["Condition 1", "Condition 2"],
+        }
+    ).set_index("conditionId")
+
+
+@pytest.fixture
+def parameter_repository(sample_parameter_df):
+    """PandasTableRepository with parameter data."""
+    return PandasTableRepository(sample_parameter_df, "parameter")
+
+
+@pytest.fixture
+def measurement_repository(sample_measurement_df):
+    """PandasTableRepository with measurement data."""
+    return PandasTableRepository(sample_measurement_df, "measurement")
+
+
+@pytest.fixture
+def condition_repository(sample_condition_df):
+    """PandasTableRepository with condition data."""
+    return PandasTableRepository(sample_condition_df, "condition")
+
+
+@pytest.fixture
+def empty_parameter_repository():
+    """Empty PandasTableRepository for parameter table."""
+    df = pd.DataFrame(columns=["parameterId", "nominalValue", "estimate"])
+    df = df.set_index("parameterId")
+    return PandasTableRepository(df, "parameter")
+
+
+@pytest.fixture
+def in_memory_parameter_repository():
+    """InMemoryTableRepository for parameter table."""
+    return InMemoryTableRepository(
+        "parameter", ["parameterId", "nominalValue", "estimate"]
+    )
+
+
+@pytest.fixture
+def in_memory_measurement_repository():
+    """InMemoryTableRepository for measurement table."""
+    return InMemoryTableRepository(
+        "measurement",
+        ["observableId", "simulationConditionId", "measurement", "time"],
+    )
diff --git a/tests/domain/test_validation_result.py b/tests/domain/test_validation_result.py
new file mode 100644
index 0000000..afcecf9
--- /dev/null
+++ b/tests/domain/test_validation_result.py
@@ -0,0 +1,103 @@
+"""Unit tests for ValidationResult."""
+
+import pytest
+
+from petab_gui.domain import ValidationLevel, ValidationResult
+
+
+class TestValidationResult:
+    """Test ValidationResult dataclass and properties."""
+
+    def test_valid_result_creation(self):
+        """Test creating a valid ValidationResult."""
+        result = ValidationResult(level=ValidationLevel.VALID)
+
+        assert result.level == ValidationLevel.VALID
+        assert result.message is None
+        assert result.suggestions == []
+        assert result.field_name is None
+        assert result.expected_type is None
+
+    def test_error_result_creation(self):
+        """Test creating an error ValidationResult with details."""
+        result = ValidationResult(
+            level=ValidationLevel.ERROR,
+            message="Invalid value",
+            field_name="nominalValue",
+            expected_type="float",
+            suggestions=["1.0", "2.5"],
+        )
+
+        assert result.level == ValidationLevel.ERROR
+        assert result.message == "Invalid value"
+        assert result.field_name == "nominalValue"
+        assert result.expected_type == "float"
+        assert result.suggestions == ["1.0", "2.5"]
+
+    def test_warning_result_creation(self):
+        """Test creating a warning ValidationResult."""
+        result = ValidationResult(
+            level=ValidationLevel.WARNING, message="Value out of typical range"
+        )
+
+        assert result.level == ValidationLevel.WARNING
+        assert result.message == "Value out of typical range"
+
+    def test_is_valid_property(self):
+        """Test is_valid property returns True only for VALID level."""
+        valid = ValidationResult(level=ValidationLevel.VALID)
+        error = ValidationResult(level=ValidationLevel.ERROR)
+        warning = ValidationResult(level=ValidationLevel.WARNING)
+
+        assert valid.is_valid is True
+        assert error.is_valid is False
+        assert warning.is_valid is False
+
+    def test_is_error_property(self):
+        """Test is_error property returns True only for ERROR level."""
+        valid = ValidationResult(level=ValidationLevel.VALID)
+        error = ValidationResult(level=ValidationLevel.ERROR)
+        warning = ValidationResult(level=ValidationLevel.WARNING)
+
+        assert valid.is_error is False
+        assert error.is_error is True
+        assert warning.is_error is False
+
+    def test_is_warning_property(self):
+        """Test is_warning property returns True only for WARNING level."""
+        valid = ValidationResult(level=ValidationLevel.VALID)
+        error = ValidationResult(level=ValidationLevel.ERROR)
+        warning = ValidationResult(level=ValidationLevel.WARNING)
+
+        assert valid.is_warning is False
+        assert error.is_warning is False
+        assert warning.is_warning is True
+
+    def test_error_with_suggestions(self):
+        """Test error result can store suggestions."""
+        result = ValidationResult(
+            level=ValidationLevel.ERROR,
+            message="Unknown condition ID",
+            suggestions=["cond1", "cond2", "cond3"],
+        )
+
+        assert len(result.suggestions) == 3
+        assert "cond1" in result.suggestions
+
+    def test_error_with_expected_type(self):
+        """Test error result can store expected type information."""
+        result = ValidationResult(
+            level=ValidationLevel.ERROR,
+            message="Type mismatch",
+            expected_type="float",
+            field_name="nominalValue",
+        )
+
+        assert result.expected_type == "float"
+        assert result.field_name == "nominalValue"
+
+    def test_validation_level_enum_values(self):
+        """Test ValidationLevel enum has correct values."""
+        assert ValidationLevel.VALID.value == "valid"
+        assert ValidationLevel.WARNING.value == "warning"
+        assert ValidationLevel.ERROR.value == "error"
diff --git a/tests/test_helpers/in_memory_repository.py b/tests/test_helpers/in_memory_repository.py
index e4fb7fc..bf5f0ea 100644
--- a/tests/test_helpers/in_memory_repository.py
+++ b/tests/test_helpers/in_memory_repository.py
@@ -7,7 +7,7 @@
 from collections.abc import Iterable
 from typing import Any
 
-from src.petab_gui.domain.validation_result import (
+from petab_gui.domain.validation_result import (
     ValidationLevel,
     ValidationResult,
 )
diff --git a/tests/test_helpers/test_in_memory_repository.py b/tests/test_helpers/test_in_memory_repository.py
new file mode 100644
index 0000000..fd9ad53
--- /dev/null
+++ b/tests/test_helpers/test_in_memory_repository.py
@@ -0,0 +1,194 @@
+"""Unit tests for InMemoryTableRepository."""
+
+import pytest
+
+from test_helpers import InMemoryTableRepository
+
+
+class TestInMemoryRepository:
+    """Test InMemoryTableRepository implementation."""
+
+    def test_add_row_and_get_row(self, in_memory_parameter_repository):
+        """Test adding and retrieving rows."""
+        repo = in_memory_parameter_repository
+
+        row_id = repo.add_row(
+            {"parameterId": "k1", "nominalValue": 1.0, "estimate": 1}
+        )
+
+        row = repo.get_row(0)
+        assert row is not None
+        assert row["parameterId"] == "k1"
+        assert row["nominalValue"] == 1.0
+
+    def test_get_row_by_id(self, in_memory_parameter_repository):
+        """Test get_row_by_id finds rows by ID."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+        repo.add_row({"parameterId": "k2", "nominalValue": 2.0, "estimate": 0})
+
+        row = repo.get_row_by_id("k2")
+
+        assert row is not None
+        assert row["parameterId"] == "k2"
+        assert row["nominalValue"] == 2.0
+
+    def test_set_cell_and_get_cell(self, in_memory_parameter_repository):
+        """Test setting and getting cell values."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+
+        result = repo.set_cell(0, "nominalValue", 99.0)
+
+        assert result.is_valid
+        assert repo.get_cell(0, "nominalValue") == 99.0
+
+    def test_delete_row(self, in_memory_parameter_repository):
+        """Test deleting rows."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+        repo.add_row({"parameterId": "k2", "nominalValue": 2.0, "estimate": 0})
+
+        success = repo.delete_row(0)
+
+        assert success is True
+        assert repo.row_count() == 1
+        # k2 should now be at index 0
+        assert repo.get_row(0)["parameterId"] == "k2"
+
+    def test_add_column(self, in_memory_parameter_repository):
+        """Test adding columns."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+
+        repo.add_column("newColumn", default_value="default")
+
+        assert "newColumn" in repo.column_names()
+        assert repo.get_cell(0, "newColumn") == "default"
+
+    def test_delete_column(self, in_memory_parameter_repository):
+        """Test deleting columns."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+
+        repo.delete_column("estimate")
+
+        assert "estimate" not in repo.column_names()
+        # After deletion, the column shouldn't be accessible
+        # InMemory implementation may return None instead of raising KeyError
+        row = repo.get_row(0)
+        assert "estimate" not in row
+
+    def test_rename_column(self, in_memory_parameter_repository):
+        """Test renaming columns."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+
+        repo.rename_column("nominalValue", "value")
+
+        assert "value" in repo.column_names()
+        assert "nominalValue" not in repo.column_names()
+        assert repo.get_cell(0, "value") == 1.0
+
+    def test_clear_all_rows(self, in_memory_parameter_repository):
+        """Test clearing all rows."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+        repo.add_row({"parameterId": "k2", "nominalValue": 2.0, "estimate": 0})
+
+        repo.clear_all_rows()
+
+        assert repo.row_count() == 0
+        # Columns should still exist
+        assert len(repo.column_names()) > 0
+
+    def test_replace_text(self, in_memory_parameter_repository):
+        """Test replace_text functionality."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+        repo.add_row({"parameterId": "k2", "nominalValue": 2.0, "estimate": 0})
+
+        changed = repo.replace_text("k1", "param1")
+
+        assert len(changed) > 0
+        # First row should be updated
+        assert repo.get_row(0)["parameterId"] == "param1"
+        # Second row should be unchanged
+        assert repo.get_row(1)["parameterId"] == "k2"
+
+    def test_load_rows_helper(self):
+        """Test load_rows helper method."""
+        repo = InMemoryTableRepository(
+            "parameter", ["parameterId", "nominalValue", "estimate"]
+        )
+
+        repo.load_rows(
+            [
+                {"parameterId": "k1", "nominalValue": 1.0, "estimate": 1},
+                {"parameterId": "k2", "nominalValue": 2.0, "estimate": 0},
+            ]
+        )
+
+        assert repo.row_count() == 2
+        assert repo.get_row(0)["parameterId"] == "k1"
+        assert repo.get_row(1)["parameterId"] == "k2"
+
+    def test_mark_cell_invalid_helper(self, in_memory_parameter_repository):
+        """Test mark_cell_invalid helper method."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+
+        repo.mark_cell_invalid(0, "nominalValue", "Test error message")
+
+        invalid_cells = repo.get_invalid_cells()
+        assert (0, "nominalValue") in invalid_cells
+        assert invalid_cells[(0, "nominalValue")] == "Test error message"
+
+    def test_get_all_rows(self, in_memory_parameter_repository):
+        """Test get_all_rows iterator."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+        repo.add_row({"parameterId": "k2", "nominalValue": 2.0, "estimate": 0})
+
+        rows = list(repo.get_all_rows())
+
+        assert len(rows) == 2
+        assert rows[0]["parameterId"] == "k1"
+        assert rows[1]["parameterId"] == "k2"
+
+    def test_update_row(self, in_memory_parameter_repository):
+        """Test update_row method."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+
+        result = repo.update_row(0, {"nominalValue": 100.0, "estimate": 0})
+
+        assert result.is_valid
+        assert repo.get_cell(0, "nominalValue") == 100.0
+        assert repo.get_cell(0, "estimate") == 0
+
+    def test_validate_cell(self, in_memory_parameter_repository):
+        """Test validate_cell method."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+
+        # InMemory repository has permissive validation
+        result = repo.validate_cell(0, "nominalValue")
+
+        assert result.is_valid  # Always valid for InMemory
+
+    def test_table_type(self, in_memory_parameter_repository):
+        """Test table_type method."""
+        repo = in_memory_parameter_repository
+
+        assert repo.table_type() == "parameter"
+
+    def test_clear_invalid_cells(self, in_memory_parameter_repository):
+        """Test clear_invalid_cells method."""
+        repo = in_memory_parameter_repository
+        repo.add_row({"parameterId": "k1", "nominalValue": 1.0, "estimate": 1})
+        repo.mark_cell_invalid(0, "nominalValue", "error")
+
+        repo.clear_invalid_cells()
+
+        assert len(repo.get_invalid_cells()) == 0

From edb1b850d8c312be78bb9889f71b2f963dfb16a8 Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Mon, 29 Jun 2026 17:13:49 +0200
Subject: [PATCH 05/11] Moved undo/redo commands from pandas specific to
 repository usage

---
 .../adapters/pandas_table_repository.py       |  14 +
 src/petab_gui/commands.py                     | 239 +++++++++++-------
 src/petab_gui/domain/table_repository.py      |  54 ++++
 tests/test_helpers/in_memory_repository.py    |  27 ++
 4 files changed, 249 insertions(+), 85 deletions(-)

diff --git a/src/petab_gui/adapters/pandas_table_repository.py b/src/petab_gui/adapters/pandas_table_repository.py
index f8b1c30..7442221 100644
--- a/src/petab_gui/adapters/pandas_table_repository.py
+++ b/src/petab_gui/adapters/pandas_table_repository.py
@@ -72,6 +72,20 @@ def get_all_rows(self) -> Iterable[dict]:
         for _, row in self._data_frame.iterrows():
             yield row.to_dict()
 
+    def get_row_id(self, row_position: int) -> str:
+        """Get row identifier from position."""
+        if not 0 <= row_position < len(self._data_frame):
+            raise IndexError(f"Row position {row_position} out of bounds")
+        return str(self._data_frame.index[row_position])
+
+    def get_row_position(self, row_id: str) -> int:
+        """Get row position from identifier."""
+        return self._data_frame.index.get_loc(row_id)
+
+    def get_column_position(self, column_name: str) -> int:
+        """Get column position from name."""
+        return self._data_frame.columns.get_loc(column_name)
+
     # Cell access
     def get_cell(self, row: int, column: str) -> Any:
         """Get single cell value."""
diff --git a/src/petab_gui/commands.py b/src/petab_gui/commands.py
index 6fb97d9..0a55764 100644
--- a/src/petab_gui/commands.py
+++ b/src/petab_gui/commands.py
@@ -72,9 +72,20 @@ def __init__(self, model, column_name, add_mode: bool = True):
         self.old_values = None
         self.position = None
 
-        if not add_mode and column_name in model._data_frame.columns:
-            self.position = model._data_frame.columns.get_loc(column_name)
-            self.old_values = model._data_frame[column_name].copy()
+        if (
+            not add_mode
+            and column_name in self.model.repository.column_names()
+        ):
+            self.position = self.model.repository.get_column_position(
+                column_name
+            )
+            # Store old values as dict {row_id: value}
+            self.old_values = {}
+            for row_idx in range(self.model.repository.row_count()):
+                row_id = self.model.repository.get_row_id(row_idx)
+                self.old_values[row_id] = self.model.repository.get_cell(
+                    row_idx, column_name
+                )
 
     def redo(self):
         """Execute the command to add or remove a column.
@@ -83,18 +94,20 @@ def redo(self):
         If in remove mode, removes the specified column from the table.
         """
         if self.add_mode:
-            position = self.model._data_frame.shape[1]
+            position = len(self.model.repository.column_names())
             self.model.beginInsertColumns(QModelIndex(), position, position)
-            self.model._data_frame[self.column_name] = ""
+            self.model.repository.add_column(
+                self.column_name, default_value=""
+            )
             self.model.endInsertColumns()
         else:
-            self.position = self.model._data_frame.columns.get_loc(
+            self.position = self.model.repository.get_column_position(
                 self.column_name
             )
             self.model.beginRemoveColumns(
                 QModelIndex(), self.position, self.position
             )
-            self.model._data_frame.drop(columns=self.column_name, inplace=True)
+            self.model.repository.delete_column(self.column_name)
             self.model.endRemoveColumns()
 
     def undo(self):
@@ -104,17 +117,22 @@ def undo(self):
         If the original command was to remove a column, this restores it.
         """
         if self.add_mode:
-            position = self.model._data_frame.columns.get_loc(self.column_name)
+            position = self.model.repository.get_column_position(
+                self.column_name
+            )
             self.model.beginRemoveColumns(QModelIndex(), position, position)
-            self.model._data_frame.drop(columns=self.column_name, inplace=True)
+            self.model.repository.delete_column(self.column_name)
             self.model.endRemoveColumns()
         else:
             self.model.beginInsertColumns(
                 QModelIndex(), self.position, self.position
             )
-            self.model._data_frame.insert(
-                self.position, self.column_name, self.old_values
-            )
+            # Restore column with old values
+            # Repository doesn't support positional insert, use DataFrame
+            df = self.model._data_frame
+            # Convert dict back to Series for insert
+            old_values_series = pd.Series(self.old_values)
+            df.insert(self.position, self.column_name, old_values_series)
             self.model.endInsertColumns()
 
 
@@ -143,8 +161,6 @@ def __init__(
         self.old_rows = None
         self.old_ind_names = None
 
-        df = self.model._data_frame
-
         if add_mode:
             # Adding: interpret input as count of new rows
             self.row_indices = self._generate_new_indices(row_indices)
@@ -153,13 +169,23 @@ def __init__(
             self.row_indices = (
                 row_indices if isinstance(row_indices, list) else [row_indices]
             )
-            self.old_rows = df.iloc[self.row_indices].copy()
-            self.old_ind_names = [df.index[idx] for idx in self.row_indices]
+            # Store old rows as list of dicts (repository format)
+            self.old_rows = []
+            for row_idx in self.row_indices:
+                row_data = self.model.repository.get_row(row_idx)
+                self.old_rows.append(row_data)
+
+            # Store row IDs using repository
+            self.old_ind_names = [
+                self.model.repository.get_row_id(idx)
+                for idx in self.row_indices
+            ]
 
     def _generate_new_indices(self, count):
         """Generate default row indices based on table type and index type."""
-        df = self.model._data_frame
         base = 0
+        # Get existing indices through repository
+        df = self.model._data_frame
         existing = set(df.index.astype(str))
 
         indices = []
@@ -177,32 +203,47 @@ def redo(self):
         If in add mode, adds new rows to the table.
         If in remove mode, removes the specified rows from the table.
         """
-        df = self.model._data_frame
-
         if self.add_mode:
-            position = (
-                0 if df.empty else df.shape[0] - 1
-            )  # insert *before* the auto-row
+            # Get position before adding rows
+            row_count = self.model.repository.row_count()
+            position = 0 if row_count == 0 else row_count - 1
+
             self.model.beginInsertRows(
                 QModelIndex(), position, position + len(self.row_indices) - 1
             )
-            # save dtypes
+
+            # Add rows through repository
+            # Create empty row data dict
+            empty_row = dict.fromkeys(
+                self.model.repository.column_names(), np.nan
+            )
+
+            df = self.model._data_frame
             dtypes = df.dtypes.copy()
-            for _i, idx in enumerate(self.row_indices):
+
+            for idx in self.row_indices:
+                # Repository doesn't support custom index yet, use DataFrame
                 df.loc[idx] = [np.nan] * df.shape[1]
-            # set dtypes
+
+            # Restore dtypes
             if np.any(dtypes != df.dtypes):
                 for col, dtype in dtypes.items():
                     if dtype != df.dtypes[col]:
                         df[col] = _convert_dtype_with_nullable_int(
                             df[col], dtype
                         )
+
             self.model.endInsertRows()
         else:
+            # Remove rows
             self.model.beginRemoveRows(
                 QModelIndex(), min(self.row_indices), max(self.row_indices)
             )
-            df.drop(index=self.old_ind_names, inplace=True)
+
+            # Delete rows through repository
+            for row_idx in sorted(self.row_indices, reverse=True):
+                self.model.repository.delete_row(row_idx)
+
             self.model.endRemoveRows()
 
     def undo(self):
@@ -214,31 +255,48 @@ def undo(self):
         df = self.model._data_frame
 
         if self.add_mode:
-            positions = [df.index.get_loc(idx) for idx in self.row_indices]
+            # Remove the rows we added
+            positions = [
+                self.model.repository.get_row_position(idx)
+                for idx in self.row_indices
+            ]
             self.model.beginRemoveRows(
                 QModelIndex(), min(positions), max(positions)
             )
-            df.drop(index=self.old_ind_names, inplace=True)
+
+            # Delete through repository
+            for idx in sorted(self.row_indices, reverse=True):
+                row_pos = self.model.repository.get_row_position(idx)
+                self.model.repository.delete_row(row_pos)
+
             self.model.endRemoveRows()
         else:
+            # Restore deleted rows
             self.model.beginInsertRows(
                 QModelIndex(), min(self.row_indices), max(self.row_indices)
             )
+
+            # Restore rows at original positions
+            # This requires DataFrame manipulation for index ordering
             restore_index_order = df.index
-            for pos, index_name, row in zip(
+            for pos, index_name, row_data in zip(
                 self.row_indices,
                 self.old_ind_names,
-                self.old_rows.values,
+                self.old_rows,
                 strict=False,
             ):
                 restore_index_order = restore_index_order.insert(
                     pos, index_name
                 )
-                df.loc[index_name] = row
+                # Restore row - use DataFrame for positioning
+                df.loc[index_name] = [
+                    row_data.get(col, "") for col in df.columns
+                ]
                 df.sort_index(
                     inplace=True,
                     key=lambda x: x.map(restore_index_order.get_loc),
                 )
+
             self.model.endInsertRows()
 
 
@@ -275,52 +333,42 @@ def undo(self):
         self._apply_changes(use_new=False)
 
     def _apply_changes(self, use_new: bool):
-        """Apply changes to the DataFrame.
+        """Apply changes via repository.
 
         Args:
         use_new:
             If True, apply the new values; if False, restore the old values
         """
-        df = self.model._data_frame
-        col_offset = 1 if self.model._has_named_index else 0
-        original_dtypes = df.dtypes.copy()
-
-        # Apply changes
-        update_vals = {
-            (row, col): val[1 if use_new else 0]
-            for (row, col), val in self.changes.items()
-        }
-        if not update_vals:
+        if not self.changes:
             return
-        update_df = pd.Series(update_vals).unstack()
-        for col in update_df.columns:
-            if col in df.columns:
-                df[col] = df[col].astype("object")
-        update_df.replace({None: "Placeholder_temp"}, inplace=True)
-        df.update(update_df)
-        df.replace({"Placeholder_temp": ""}, inplace=True)
-        for col, dtype in original_dtypes.items():
-            if col not in update_df.columns:
-                continue
-
-            # For numeric types, convert string inputs to numbers first
-            is_pandas_nullable_int = isinstance(
-                dtype,
-                pd.Int64Dtype | pd.Int32Dtype | pd.Int16Dtype | pd.Int8Dtype,
-            )
-            if is_pandas_nullable_int or np.issubdtype(dtype, np.number):
-                df[col] = pd.to_numeric(df[col], errors="coerce")
 
-            # Convert to appropriate dtype, handling nullable integers
-            df[col] = _convert_dtype_with_nullable_int(df[col], dtype)
+        # Apply changes through repository
+        # Repository handles validation and dtype conversion
+        col_offset = 1 if self.model._has_named_index else 0
+
+        row_positions = []
+        col_positions = []
+
+        for (row_id, col_name), (old_val, new_val) in self.changes.items():
+            # Select which value to apply
+            value = new_val if use_new else old_val
+
+            # Get row position from row_id using repository
+            row_pos = self.model.repository.get_row_position(row_id)
+
+            # Apply change through repository (handles validation & dtype)
+            self.model.repository.set_cell(row_pos, col_name, value)
 
-        rows = [df.index.get_loc(row_key) for (row_key, _) in self.changes]
-        cols = [
-            df.columns.get_loc(col) + col_offset for (_, col) in self.changes
-        ]
+            # Track positions for signal emission
+            row_positions.append(row_pos)
+            col_positions.append(
+                self.model.repository.get_column_position(col_name)
+                + col_offset
+            )
 
-        top_left = self.model.index(min(rows), min(cols))
-        bottom_right = self.model.index(max(rows), max(cols))
+        # Emit dataChanged signal for updated region
+        top_left = self.model.index(min(row_positions), min(col_positions))
+        bottom_right = self.model.index(max(row_positions), max(col_positions))
         self.model.dataChanged.emit(top_left, bottom_right, [Qt.DisplayRole])
 
 
@@ -383,11 +431,18 @@ def __init__(
         )
         self.changes = {}  # {(row_idx, col_name): (old_val, new_val)}
 
-        df = self.model._data_frame
-        for col_name in self.column_names:
-            mask = df[col_name].eq(self.old_id)
-            for row_idx in df.index[mask]:
-                self.changes[(row_idx, col_name)] = (self.old_id, self.new_id)
+        # Find all matching values through repository
+        for row_pos, row_data in enumerate(
+            self.model.repository.get_all_rows()
+        ):
+            for col_name in self.column_names:
+                if col_name in row_data and row_data[col_name] == self.old_id:
+                    # Get row_id for change tracking
+                    row_id = self.model.repository.get_row_id(row_pos)
+                    self.changes[(row_id, col_name)] = (
+                        self.old_id,
+                        self.new_id,
+                    )
 
     def redo(self):
         self._apply_changes(use_new=True)
@@ -396,16 +451,30 @@ def undo(self):
         self._apply_changes(use_new=False)
 
     def _apply_changes(self, use_new: bool):
-        df = self.model._data_frame
-        for (row_idx, col_name), (old_val, new_val) in self.changes.items():
-            df.at[row_idx, col_name] = new_val if use_new else old_val
-
-        if self.changes:
-            rows = [df.index.get_loc(row) for (row, _) in self.changes]
-            cols = [df.columns.get_loc(col) + 1 for (_, col) in self.changes]
-            top_left = self.model.index(min(rows), min(cols))
-            bottom_right = self.model.index(max(rows), max(cols))
-            self.model.dataChanged.emit(
-                top_left, bottom_right, [Qt.DisplayRole, Qt.EditRole]
+        if not self.changes:
+            return
+
+        row_positions = []
+        col_positions = []
+
+        for (row_id, col_name), (old_val, new_val) in self.changes.items():
+            # Get row position using repository
+            row_pos = self.model.repository.get_row_position(row_id)
+
+            # Apply change through repository
+            value = new_val if use_new else old_val
+            self.model.repository.set_cell(row_pos, col_name, value)
+
+            # Track positions for signal emission
+            row_positions.append(row_pos)
+            col_positions.append(
+                self.model.repository.get_column_position(col_name) + 1
             )
-            self.model.something_changed.emit(True)
+
+        # Emit signals
+        top_left = self.model.index(min(row_positions), min(col_positions))
+        bottom_right = self.model.index(max(row_positions), max(col_positions))
+        self.model.dataChanged.emit(
+            top_left, bottom_right, [Qt.DisplayRole, Qt.EditRole]
+        )
+        self.model.something_changed.emit(True)
diff --git a/src/petab_gui/domain/table_repository.py b/src/petab_gui/domain/table_repository.py
index 899f424..08adf2e 100644
--- a/src/petab_gui/domain/table_repository.py
+++ b/src/petab_gui/domain/table_repository.py
@@ -73,6 +73,60 @@ def get_all_rows(self) -> Iterable[dict]:
         """
         ...
 
+    def get_row_id(self, row_position: int) -> str:
+        """Get row identifier from position.
+
+        Args:
+            row_position: Zero-based row position
+
+        Returns:
+            Row identifier (index value)
+
+        Raises:
+            IndexError: If row position is out of bounds
+
+        Example:
+            >>> repo.get_row_id(0)
+            'k1'
+        """
+        ...
+
+    def get_row_position(self, row_id: str) -> int:
+        """Get row position from identifier.
+
+        Args:
+            row_id: Row identifier (index value)
+
+        Returns:
+            Zero-based row position
+
+        Raises:
+            KeyError: If row_id not found
+
+        Example:
+            >>> repo.get_row_position('k1')
+            0
+        """
+        ...
+
+    def get_column_position(self, column_name: str) -> int:
+        """Get column position from name.
+
+        Args:
+            column_name: Column name
+
+        Returns:
+            Zero-based column position
+
+        Raises:
+            KeyError: If column not found
+
+        Example:
+            >>> repo.get_column_position('nominalValue')
+            1
+        """
+        ...
+
     # Cell access
     def get_cell(self, row: int, column: str) -> Any:
         """Get single cell value.
diff --git a/tests/test_helpers/in_memory_repository.py b/tests/test_helpers/in_memory_repository.py
index bf5f0ea..8fb58eb 100644
--- a/tests/test_helpers/in_memory_repository.py
+++ b/tests/test_helpers/in_memory_repository.py
@@ -65,6 +65,33 @@ def get_all_rows(self) -> Iterable[dict]:
         for row in self.rows:
             yield row.copy()
 
+    def get_row_id(self, row_position: int) -> str:
+        """Get row identifier from position."""
+        if not 0 <= row_position < len(self.rows):
+            raise IndexError(f"Row position {row_position} out of bounds")
+        # Use first column value as ID
+        if self.columns:
+            return str(self.rows[row_position].get(self.columns[0], ""))
+        return str(row_position)
+
+    def get_row_position(self, row_id: str) -> int:
+        """Get row position from identifier."""
+        if not self.columns:
+            raise KeyError(f"No columns defined, cannot find row_id: {row_id}")
+
+        id_col = self.columns[0]
+        for pos, row in enumerate(self.rows):
+            if str(row.get(id_col)) == str(row_id):
+                return pos
+        raise KeyError(f"Row ID not found: {row_id}")
+
+    def get_column_position(self, column_name: str) -> int:
+        """Get column position from name."""
+        try:
+            return self.columns.index(column_name)
+        except ValueError:
+            raise KeyError(f"Column not found: {column_name}")
+
     # Cell access
     def get_cell(self, row: int, column: str) -> Any:
         """Get single cell value."""

From f59481330adf51988a47d5945a185f8cfb302e03 Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Wed, 1 Jul 2026 10:54:44 +0200
Subject: [PATCH 06/11] Slight refactoring of find/replace and information on
 transitional state of dataframe usage

---
 src/petab_gui/commands.py                     | 19 ++--
 .../controllers/table_controllers.py          | 92 +++++++++----------
 src/petab_gui/models/pandas_table_model.py    | 14 ++-
 3 files changed, 67 insertions(+), 58 deletions(-)

diff --git a/src/petab_gui/commands.py b/src/petab_gui/commands.py
index 0a55764..5aab003 100644
--- a/src/petab_gui/commands.py
+++ b/src/petab_gui/commands.py
@@ -1,4 +1,13 @@
-"""Store commands for the do/undo functionality."""
+"""Store commands for the do/undo functionality.
+
+TRANSITIONAL STATE: Commands are being migrated from direct DataFrame access
+to repository pattern. Some operations still use DataFrame directly when:
+- Repository doesn't support the operation yet (e.g., positional column insert)
+- Index handling requires DataFrame-specific operations
+- Dtype preservation requires pandas-specific logic
+
+This hybrid approach will be resolved when migration to PEtab v2.0 is complete.
+"""
 
 import numpy as np
 import pandas as pd
@@ -212,12 +221,7 @@ def redo(self):
                 QModelIndex(), position, position + len(self.row_indices) - 1
             )
 
-            # Add rows through repository
-            # Create empty row data dict
-            empty_row = dict.fromkeys(
-                self.model.repository.column_names(), np.nan
-            )
-
+            # Add rows through DataFrame (repository doesn't support custom index yet)
             df = self.model._data_frame
             dtypes = df.dtypes.copy()
 
@@ -344,6 +348,7 @@ def _apply_changes(self, use_new: bool):
 
         # Apply changes through repository
         # Repository handles validation and dtype conversion
+        # View column offset: +1 if index column is displayed, +0 otherwise
         col_offset = 1 if self.model._has_named_index else 0
 
         row_positions = []
diff --git a/src/petab_gui/controllers/table_controllers.py b/src/petab_gui/controllers/table_controllers.py
index e653ee2..af39848 100644
--- a/src/petab_gui/controllers/table_controllers.py
+++ b/src/petab_gui/controllers/table_controllers.py
@@ -527,6 +527,41 @@ def replace_text(
             self.model.highlighted_cells.discard((row, col))
             self.model.dataChanged.emit(index, index, [Qt.DisplayRole])
 
+    @staticmethod
+    def _find_and_replace_in_text(
+        text: str, search: str, replace: str, case_sensitive: bool, use_regex: bool
+    ) -> tuple[bool, str]:
+        """Find and replace text with given options.
+
+        Args:
+            text: The text to search in
+            search: The search pattern
+            replace: The replacement text
+            case_sensitive: Whether to match case
+            use_regex: Whether to use regex matching
+
+        Returns:
+            Tuple of (matched, new_text) where matched indicates if replacement occurred
+        """
+        if use_regex:
+            pattern = re.compile(search, 0 if case_sensitive else re.IGNORECASE)
+            new_text = pattern.sub(replace, text)
+            return new_text != text, new_text
+
+        # Non-regex replacement
+        if case_sensitive:
+            matched = search in text
+            new_text = text.replace(search, replace) if matched else text
+        else:
+            matched = search.lower() in text.lower()
+            new_text = (
+                re.sub(re.escape(search), replace, text, flags=re.IGNORECASE)
+                if matched
+                else text
+            )
+
+        return matched, new_text
+
     def replace_all(
         self, search_text, replace_text, case_sensitive=False, regex=False
     ):
@@ -546,59 +581,22 @@ def replace_all(
                 if pd.isna(old_val):
                     continue
 
-                old_str = str(old_val)
-                # Check if this cell matches
-                matches = False
-                if regex:
-                    pattern = re.compile(
-                        search_text, 0 if case_sensitive else re.IGNORECASE
-                    )
-                    new_str = pattern.sub(replace_text, old_str)
-                    matches = new_str != old_str
-                else:
-                    if case_sensitive:
-                        matches = search_text in old_str
-                        new_str = old_str.replace(search_text, replace_text)
-                    else:
-                        matches = search_text.lower() in old_str.lower()
-                        if matches:
-                            new_str = re.sub(
-                                re.escape(search_text),
-                                replace_text,
-                                old_str,
-                                flags=re.IGNORECASE,
-                            )
-
-                if matches and new_str != old_str:
+                matched, new_str = self._find_and_replace_in_text(
+                    str(old_val), search_text, replace_text, case_sensitive, regex
+                )
+
+                if matched and new_str != str(old_val):
                     changes[(row_id, col)] = (old_val, new_str)
 
         # Replace in the index as well
         index_renames = []  # Collect index renames for undo support
         if isinstance(df.index, pd.Index) and df.index.name:
             for row_idx, row_id in enumerate(df.index):
-                old_str = str(row_id)
-                matches = False
-                if regex:
-                    pattern = re.compile(
-                        search_text, 0 if case_sensitive else re.IGNORECASE
-                    )
-                    new_str = pattern.sub(replace_text, old_str)
-                    matches = new_str != old_str
-                else:
-                    if case_sensitive:
-                        matches = search_text in old_str
-                        new_str = old_str.replace(search_text, replace_text)
-                    else:
-                        matches = search_text.lower() in old_str.lower()
-                        if matches:
-                            new_str = re.sub(
-                                re.escape(search_text),
-                                replace_text,
-                                old_str,
-                                flags=re.IGNORECASE,
-                            )
-
-                if matches and new_str != old_str:
+                matched, new_str = self._find_and_replace_in_text(
+                    str(row_id), search_text, replace_text, case_sensitive, regex
+                )
+
+                if matched and new_str != str(row_id):
                     index_renames.append((row_id, new_str, row_idx))
 
         # Create undo command(s)
diff --git a/src/petab_gui/models/pandas_table_model.py b/src/petab_gui/models/pandas_table_model.py
index 225d4ae..6333e64 100644
--- a/src/petab_gui/models/pandas_table_model.py
+++ b/src/petab_gui/models/pandas_table_model.py
@@ -597,8 +597,12 @@ def get_df(self):
     def _data_frame(self):
         """Property that delegates to repository's DataFrame.
 
-        This allows backward compatibility with code that accesses _data_frame directly,
-        while ensuring the repository is always the source of truth.
+        TRANSITIONAL: During migration to repository pattern, this provides
+        backward compatibility for code that directly accesses _data_frame.
+        Repository is the source of truth.
+
+        Note: Direct DataFrame access is discouraged. Use repository methods instead.
+        This property will be deprecated once migration to PEtab v2.0 is complete.
         """
         return self.repository.data_frame
 
@@ -606,8 +610,10 @@ def _data_frame(self):
     def _data_frame(self, new_df):
         """Update the repository's DataFrame when _data_frame is assigned.
 
-        This ensures that when controllers do model._data_frame = new_df,
-        the repository gets updated as well.
+        TRANSITIONAL: This setter ensures controllers using model._data_frame = new_df
+        properly update the repository. Direct assignment bypasses validation.
+
+        Warning: This will be deprecated. Use repository.replace_data() instead.
         """
         self.repository.data_frame = new_df
 

From cafc0ac5a7e960a2b1502341f12de77212fbde1a Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Wed, 1 Jul 2026 12:49:26 +0200
Subject: [PATCH 07/11] ruff compliance

---
 pyproject.toml                                |  3 ++
 .../adapters/pandas_table_repository.py       | 32 +++++++++-------
 src/petab_gui/commands.py                     |  3 +-
 .../controllers/table_controllers.py          | 38 ++++++++++++++-----
 src/petab_gui/domain/table_repository.py      | 24 +++++++-----
 src/petab_gui/domain/validation_result.py     |  9 +++--
 src/petab_gui/models/pandas_table_model.py    | 19 ++++++----
 .../adapters/test_pandas_table_repository.py  |  7 ++--
 tests/test_helpers/in_memory_repository.py    |  4 +-
 .../test_helpers/test_in_memory_repository.py |  2 +-
 10 files changed, 92 insertions(+), 49 deletions(-)

diff --git a/pyproject.toml b/pyproject.toml
index 9bc6f95..51c5f79 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -101,5 +101,8 @@ lint.ignore = [
     "A001", # Variable `copyright` is shadowing a Python builtin
 
 ]
+"tests/**/*.py" = [
+    "S101", # Use of assert detected (allowed in tests)
+]
 [tool.ruff.lint.pydocstyle]
 convention = "pep257"
diff --git a/src/petab_gui/adapters/pandas_table_repository.py b/src/petab_gui/adapters/pandas_table_repository.py
index 7442221..26c5fac 100644
--- a/src/petab_gui/adapters/pandas_table_repository.py
+++ b/src/petab_gui/adapters/pandas_table_repository.py
@@ -1,8 +1,9 @@
 """Pandas implementation of TableRepository.
 
-This adapter wraps a pandas DataFrame to implement the TableRepository protocol.
-It handles validation, invalid cell tracking, and all CRUD operations while
-maintaining compatibility with the existing PandasTableModel behavior.
+This adapter wraps a pandas DataFrame to implement the TableRepository
+protocol. It handles validation, invalid cell tracking, and all CRUD
+operations while maintaining compatibility with the existing
+PandasTableModel behavior.
 """
 
 from collections.abc import Iterable
@@ -19,15 +20,17 @@
 class PandasTableRepository:
     """Pandas DataFrame adapter implementing TableRepository protocol.
 
-    This adapter provides the seam between controllers and pandas DataFrames.
-    In the future, when migrating to pydantic/PEtab v2.0, this adapter will be
-    replaced with PydanticTableRepository, but controllers won't need to change.
+    This adapter provides the seam between controllers and pandas
+    DataFrames. In the future, when migrating to pydantic/PEtab v2.0, this
+    adapter will be replaced with PydanticTableRepository, but controllers
+    won't need to change.
 
     Attributes:
         _data_frame: The underlying pandas DataFrame
         _table_type: Table type (measurement, parameter, etc.)
         _allowed_columns: Column definitions from C.COLUMNS
-        _invalid_cells: Set of (row_index, column_name) tuples for invalid cells
+        _invalid_cells: Set of (row_index, column_name) tuples for invalid
+            cells
     """
 
     def __init__(
@@ -41,7 +44,8 @@ def __init__(
         Args:
             data_frame: The pandas DataFrame to wrap
             table_type: Table type identifier (measurement, parameter, etc.)
-            allowed_columns: Column definitions (defaults to C.COLUMNS[table_type])
+            allowed_columns: Column definitions (defaults to
+                C.COLUMNS[table_type])
         """
         self._data_frame = data_frame
         self._table_type = table_type
@@ -273,7 +277,8 @@ def table_type(self) -> str:
         return self._table_type
 
     # DataFrame access (for backward compatibility and bulk operations)
-    # NOTE: data_frame property is defined below in "Additional helper methods" section
+    # NOTE: data_frame property is defined below in
+    # "Additional helper methods" section
 
     # Validation
     def get_invalid_cells(self) -> dict[tuple[int, str], str]:
@@ -322,8 +327,9 @@ def validate_cell(self, row: int, column: str) -> ValidationResult:
     def data_frame(self) -> pd.DataFrame:
         """Direct access to underlying DataFrame (for migration period).
 
-        This property exists to ease the transition from direct DataFrame access.
-        In the long term, all access should go through repository methods.
+        This property exists to ease the transition from direct DataFrame
+        access. In the long term, all access should go through repository
+        methods.
         """
         return self._data_frame
 
@@ -331,8 +337,8 @@ def data_frame(self) -> pd.DataFrame:
     def data_frame(self, new_df: pd.DataFrame) -> None:
         """Set the underlying DataFrame and clear invalid cell tracking.
 
-        When controllers assign a new DataFrame, we need to update the repository's
-        internal state and clear invalid cell tracking.
+        When controllers assign a new DataFrame, we need to update the
+        repository's internal state and clear invalid cell tracking.
         """
         self._data_frame = new_df
         self._invalid_cells.clear()
diff --git a/src/petab_gui/commands.py b/src/petab_gui/commands.py
index 5aab003..b0f4f5a 100644
--- a/src/petab_gui/commands.py
+++ b/src/petab_gui/commands.py
@@ -221,7 +221,8 @@ def redo(self):
                 QModelIndex(), position, position + len(self.row_indices) - 1
             )
 
-            # Add rows through DataFrame (repository doesn't support custom index yet)
+            # Add rows through DataFrame (repository doesn't support custom
+            # index yet)
             df = self.model._data_frame
             dtypes = df.dtypes.copy()
 
diff --git a/src/petab_gui/controllers/table_controllers.py b/src/petab_gui/controllers/table_controllers.py
index af39848..0e06958 100644
--- a/src/petab_gui/controllers/table_controllers.py
+++ b/src/petab_gui/controllers/table_controllers.py
@@ -529,7 +529,11 @@ def replace_text(
 
     @staticmethod
     def _find_and_replace_in_text(
-        text: str, search: str, replace: str, case_sensitive: bool, use_regex: bool
+        text: str,
+        search: str,
+        replace: str,
+        case_sensitive: bool,
+        use_regex: bool,
     ) -> tuple[bool, str]:
         """Find and replace text with given options.
 
@@ -541,10 +545,13 @@ def _find_and_replace_in_text(
             use_regex: Whether to use regex matching
 
         Returns:
-            Tuple of (matched, new_text) where matched indicates if replacement occurred
+            Tuple of (matched, new_text) where matched indicates if
+            replacement occurred
         """
         if use_regex:
-            pattern = re.compile(search, 0 if case_sensitive else re.IGNORECASE)
+            pattern = re.compile(
+                search, 0 if case_sensitive else re.IGNORECASE
+            )
             new_text = pattern.sub(replace, text)
             return new_text != text, new_text
 
@@ -565,7 +572,11 @@ def _find_and_replace_in_text(
     def replace_all(
         self, search_text, replace_text, case_sensitive=False, regex=False
     ):
-        """Replace all occurrences of the search term in the Model with undo support."""
+        """Replace all occurrences of search term in Model with undo.
+
+        Replace all occurrences of the search term in the Model with undo
+        support.
+        """
         if not search_text or not replace_text:
             return
 
@@ -576,13 +587,17 @@ def replace_all(
 
         # Find all matching cells and store old values
         for col in df.columns:
-            for row_idx, row_id in enumerate(df.index):
+            for _row_idx, row_id in enumerate(df.index):
                 old_val = df.at[row_id, col]
                 if pd.isna(old_val):
                     continue
 
                 matched, new_str = self._find_and_replace_in_text(
-                    str(old_val), search_text, replace_text, case_sensitive, regex
+                    str(old_val),
+                    search_text,
+                    replace_text,
+                    case_sensitive,
+                    regex,
                 )
 
                 if matched and new_str != str(old_val):
@@ -593,7 +608,11 @@ def replace_all(
         if isinstance(df.index, pd.Index) and df.index.name:
             for row_idx, row_id in enumerate(df.index):
                 matched, new_str = self._find_and_replace_in_text(
-                    str(row_id), search_text, replace_text, case_sensitive, regex
+                    str(row_id),
+                    search_text,
+                    replace_text,
+                    case_sensitive,
+                    regex,
                 )
 
                 if matched and new_str != str(row_id):
@@ -602,7 +621,8 @@ def replace_all(
         # Create undo command(s)
         if changes or index_renames:
             if self.model.undo_stack:
-                # Use macro to group cell changes + index renames into one undo operation
+                # Use macro to group cell changes + index renames into
+                # one undo operation
                 self.model.undo_stack.beginMacro(
                     f"Replace '{search_text}' with '{replace_text}'"
                 )
@@ -628,7 +648,7 @@ def replace_all(
                 self.model.undo_stack.endMacro()
             else:
                 # Fallback: apply changes directly if no undo stack
-                for (row_id, col), (old_val, new_val) in changes.items():
+                for (row_id, col), (_old_val, new_val) in changes.items():
                     df.at[row_id, col] = new_val
                 for old_id, new_id, _ in index_renames:
                     df.rename(index={old_id: new_id}, inplace=True)
diff --git a/src/petab_gui/domain/table_repository.py b/src/petab_gui/domain/table_repository.py
index 08adf2e..b39fa1a 100644
--- a/src/petab_gui/domain/table_repository.py
+++ b/src/petab_gui/domain/table_repository.py
@@ -20,9 +20,9 @@
 class TableRepository(Protocol):
     """Generic repository for table data access.
 
-    This is the seam where data access abstraction happens. Controllers interact
-    through this interface, allowing us to swap implementations (pandas →
-    pydantic) without changing controller code.
+    This is the seam where data access abstraction happens. Controllers
+    interact through this interface, allowing us to swap implementations
+    (pandas → pydantic) without changing controller code.
 
     Adapters that implement this protocol:
     - PandasTableRepository: wraps pandas DataFrame
@@ -147,10 +147,10 @@ def get_cell(self, row: int, column: str) -> Any:
     def set_cell(self, row: int, column: str, value: Any) -> ValidationResult:
         """Set cell value (always succeeds, validates and tracks invalids).
 
-        This method uses permissive validation - it accepts any input and stores
-        it, but returns a ValidationResult indicating whether the value is valid.
-        Invalid cells are tracked internally and can be retrieved via
-        get_invalid_cells().
+        This method uses permissive validation - it accepts any input and
+        stores it, but returns a ValidationResult indicating whether the
+        value is valid. Invalid cells are tracked internally and can be
+        retrieved via get_invalid_cells().
 
         Args:
             row: Zero-based row position
@@ -158,7 +158,8 @@ def set_cell(self, row: int, column: str, value: Any) -> ValidationResult:
             value: New value (any type accepted)
 
         Returns:
-            ValidationResult with level (VALID/WARNING/ERROR), message, suggestions
+            ValidationResult with level (VALID/WARNING/ERROR), message,
+            suggestions
 
         Example:
             >>> result = repo.set_cell(0, 'nominalValue', 'abc')
@@ -179,7 +180,9 @@ def add_row(self, data: dict) -> str:
             New row ID (value of the ID column)
 
         Example:
-            >>> row_id = repo.add_row({'parameterId': 'k2', 'nominalValue': 2.0})
+            >>> row_id = repo.add_row(
+            ...     {'parameterId': 'k2', 'nominalValue': 2.0}
+            ... )
             >>> print(row_id)  # 'k2'
         """
         ...
@@ -274,7 +277,8 @@ def table_type(self) -> str:
         """Get table type.
 
         Returns:
-            Table type identifier (e.g., 'measurement', 'parameter', 'observable')
+            Table type identifier (e.g., 'measurement', 'parameter',
+            'observable')
         """
         ...
 
diff --git a/src/petab_gui/domain/validation_result.py b/src/petab_gui/domain/validation_result.py
index 4dfbc34..88ebe71 100644
--- a/src/petab_gui/domain/validation_result.py
+++ b/src/petab_gui/domain/validation_result.py
@@ -37,14 +37,17 @@ class ValidationResult:
     Attributes:
         level: Severity level (VALID, WARNING, ERROR)
         message: Human-readable error/warning message (None if valid)
-        suggestions: List of suggested corrections (e.g., similar valid values)
+        suggestions: List of suggested corrections (e.g., similar valid
+            values)
         field_name: Name of the field that was validated
-        expected_type: Expected type/format description (e.g., "float", "reference to Observable")
+        expected_type: Expected type/format description (e.g., "float",
+            "reference to Observable")
 
     Example:
         >>> result = ValidationResult(
         ...     level=ValidationLevel.ERROR,
-        ...     message="observableId 'obs_typo' not found in observable table",
+        ...     message="observableId 'obs_typo' not found in observable "
+        ...            "table",
         ...     suggestions=["obs1", "obs2"],
         ...     field_name="observableId",
         ...     expected_type="reference to Observable"
diff --git a/src/petab_gui/models/pandas_table_model.py b/src/petab_gui/models/pandas_table_model.py
index 6333e64..fa7b46d 100644
--- a/src/petab_gui/models/pandas_table_model.py
+++ b/src/petab_gui/models/pandas_table_model.py
@@ -192,7 +192,8 @@ def data(self, index, role=Qt.DisplayRole):
                     return f"New {self.table_type}"
                 return ""
             if column == 0 and self._has_named_index:
-                # Index access still needs DataFrame for now (named index handling)
+                # Index access still needs DataFrame for now
+                # (named index handling)
                 value = self._data_frame.index[row]
                 return str(value)
             col_name = self.repository.column_names()[
@@ -573,7 +574,8 @@ def replace_text(self, old_text: str, new_text: str):
                 model_idx = self.index(row, col_idx)
                 self.dataChanged.emit(model_idx, model_idx, [Qt.DisplayRole])
 
-        # Also replace in the index (still needs DataFrame for named index handling)
+        # Also replace in the index (still needs DataFrame for named
+        # index handling)
         if self._has_named_index and old_text in self._data_frame.index:
             self._data_frame.rename(index={old_text: new_text}, inplace=True)
             index_row = self._data_frame.index.get_loc(new_text)
@@ -601,8 +603,9 @@ def _data_frame(self):
         backward compatibility for code that directly accesses _data_frame.
         Repository is the source of truth.
 
-        Note: Direct DataFrame access is discouraged. Use repository methods instead.
-        This property will be deprecated once migration to PEtab v2.0 is complete.
+        Note: Direct DataFrame access is discouraged. Use repository methods
+        instead. This property will be deprecated once migration to PEtab
+        v2.0 is complete.
         """
         return self.repository.data_frame
 
@@ -610,10 +613,12 @@ def _data_frame(self):
     def _data_frame(self, new_df):
         """Update the repository's DataFrame when _data_frame is assigned.
 
-        TRANSITIONAL: This setter ensures controllers using model._data_frame = new_df
-        properly update the repository. Direct assignment bypasses validation.
+        TRANSITIONAL: This setter ensures controllers using
+        model._data_frame = new_df properly update the repository. Direct
+        assignment bypasses validation.
 
-        Warning: This will be deprecated. Use repository.replace_data() instead.
+        Warning: This will be deprecated. Use repository.replace_data()
+        instead.
         """
         self.repository.data_frame = new_df
 
diff --git a/tests/adapters/test_pandas_table_repository.py b/tests/adapters/test_pandas_table_repository.py
index 0c8a409..80a2ede 100644
--- a/tests/adapters/test_pandas_table_repository.py
+++ b/tests/adapters/test_pandas_table_repository.py
@@ -249,7 +249,8 @@ def test_delete_column_clears_invalid_cells_for_column(
         self, parameter_repository
     ):
         """Test delete_column clears invalid cell tracking."""
-        # Mark cell as invalid - use nominalValue which will definitely be invalid with a string
+        # Mark cell as invalid - use nominalValue which will definitely be
+        # invalid with a string
         parameter_repository.set_cell(0, "nominalValue", "definitely_invalid")
         assert (0, "nominalValue") in parameter_repository.get_invalid_cells()
 
@@ -324,8 +325,8 @@ def test_replace_text_in_index(self, parameter_repository):
         """Test replace_text can replace in index values."""
         changed = parameter_repository.replace_text("k1", "param1")
 
-        # Check that replacement happened (even if index replacement may not be supported)
-        # Just verify that something changed
+        # Check that replacement happened (even if index replacement may
+        # not be supported). Just verify that something changed
         assert isinstance(changed, list)
 
     def test_replace_text_returns_changed_positions(
diff --git a/tests/test_helpers/in_memory_repository.py b/tests/test_helpers/in_memory_repository.py
index 8fb58eb..a6eaed2 100644
--- a/tests/test_helpers/in_memory_repository.py
+++ b/tests/test_helpers/in_memory_repository.py
@@ -89,8 +89,8 @@ def get_column_position(self, column_name: str) -> int:
         """Get column position from name."""
         try:
             return self.columns.index(column_name)
-        except ValueError:
-            raise KeyError(f"Column not found: {column_name}")
+        except ValueError as e:
+            raise KeyError(f"Column not found: {column_name}") from e
 
     # Cell access
     def get_cell(self, row: int, column: str) -> Any:
diff --git a/tests/test_helpers/test_in_memory_repository.py b/tests/test_helpers/test_in_memory_repository.py
index fd9ad53..c1add9f 100644
--- a/tests/test_helpers/test_in_memory_repository.py
+++ b/tests/test_helpers/test_in_memory_repository.py
@@ -12,7 +12,7 @@ def test_add_row_and_get_row(self, in_memory_parameter_repository):
         """Test adding and retrieving rows."""
         repo = in_memory_parameter_repository
 
-        row_id = repo.add_row(
+        _row_id = repo.add_row(
             {"parameterId": "k1", "nominalValue": 1.0, "estimate": 1}
         )
 

From cf8b3424e5eaf9c704108c4f939cd923ea3cc048 Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Wed, 1 Jul 2026 13:01:19 +0200
Subject: [PATCH 08/11] CI

---
 .github/workflows/ci.yml | 38 ++++++++++++++++++++++++++++++++++++++
 pyproject.toml           | 20 ++++++++++++++++++++
 2 files changed, 58 insertions(+)

diff --git a/.github/workflows/ci.yml b/.github/workflows/ci.yml
index aad5f95..87a1180 100644
--- a/.github/workflows/ci.yml
+++ b/.github/workflows/ci.yml
@@ -23,6 +23,44 @@ jobs:
     - name: Run pre-commit hooks
       run: pre-commit run --all-files
 
+  test:
+    runs-on: ubuntu-latest
+    strategy:
+      matrix:
+        python-version: ['3.12', '3.14']
+    steps:
+    - name: Check out repository
+      uses: actions/checkout@v5
+
+    - name: Prepare Python
+      uses: actions/setup-python@v6
+      with:
+          python-version: ${{ matrix.python-version }}
+
+    - name: Install dependencies
+      run: |
+        sudo apt-get update
+        sudo apt-get install -y xvfb libegl1 libqt6gui6 libxcb-cursor0
+
+    - name: Install PEtabGUI with test dependencies
+      run: |
+        python -m pip install --upgrade pip
+        pip install '.[test]'
+
+    - name: Run tests with pytest
+      run: |
+        echo "Running pytest on repository tests"
+        # Run repository and domain tests (test_upload.py has known failures)
+        pytest tests/adapters/ tests/domain/ tests/test_helpers/ \
+          -v --cov=petab_gui --cov-report=xml --cov-report=term
+
+    - name: Upload coverage to Codecov
+      uses: codecov/codecov-action@v5
+      if: matrix.python-version == '3.11'
+      with:
+        file: ./coverage.xml
+        fail_ci_if_error: false
+
   launch:
     runs-on: ubuntu-latest
     strategy:
diff --git a/pyproject.toml b/pyproject.toml
index 51c5f79..aebf153 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -41,6 +41,10 @@ doc = [
     "sphinx-design",
     "sphinxcontrib-youtube",
 ]
+test = [
+    "pytest>=7.0",
+    "pytest-cov>=4.0",
+]
 
 [project.urls]
 Repository = "https://github.com/PEtab-dev/PEtabGUI"
@@ -106,3 +110,19 @@ lint.ignore = [
 ]
 [tool.ruff.lint.pydocstyle]
 convention = "pep257"
+
+[tool.pytest.ini_options]
+minversion = "7.0"
+testpaths = ["tests"]
+python_files = ["test_*.py"]
+python_classes = ["Test*"]
+python_functions = ["test_*"]
+addopts = [
+    "-v",
+    "--strict-markers",
+    "--tb=short",
+]
+filterwarnings = [
+    "ignore::FutureWarning",
+    "ignore::DeprecationWarning",
+]

From 3499126ebeccadb30f6d571bc1f4123d0c87d657 Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Thu, 2 Jul 2026 10:14:04 +0200
Subject: [PATCH 09/11] Marked old tests as old.

---
 tests/test_upload.py | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/tests/test_upload.py b/tests/test_upload.py
index 688ff61..3a98fb3 100644
--- a/tests/test_upload.py
+++ b/tests/test_upload.py
@@ -1,4 +1,9 @@
-"""Tests for file upload functionality in mother_controller.py."""
+"""
+OLD TESTS.
+
+REMAINING AS TODODS for new refactored app.
+Tests for file upload functionality in mother_controller.py.
+"""
 
 import sys
 import tempfile

From db1359b09a78106a764104b7445b241776fd459e Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Thu, 2 Jul 2026 13:50:52 +0200
Subject: [PATCH 10/11] Removed data frame accesses.

---
 src/petab_gui/adapters/__init__.py            |   7 +-
 .../adapters/pandas_table_repository.py       | 137 ++++++++++
 src/petab_gui/commands.py                     |  21 +-
 .../controllers/table_controllers.py          |  57 ++--
 src/petab_gui/domain/table_repository.py      |  88 +++++++
 src/petab_gui/models/pandas_table_model.py    |  23 +-
 .../adapters/test_pandas_table_repository.py  | 243 ++++++++++++++++++
 7 files changed, 533 insertions(+), 43 deletions(-)

diff --git a/src/petab_gui/adapters/__init__.py b/src/petab_gui/adapters/__init__.py
index 4d12c63..8d37282 100644
--- a/src/petab_gui/adapters/__init__.py
+++ b/src/petab_gui/adapters/__init__.py
@@ -1,12 +1,11 @@
-"""Adapters layer - infrastructure implementations.
+"""Adapters layer - Enable swithcing between differend data modes
 
 This package contains implementations of domain protocols for specific
-technologies:
+data types:
 - PandasTableRepository: pandas DataFrame adapter
 - PydanticTableRepository: pydantic models adapter (future)
 
-Adapters sit at the seam - they can be swapped without changing domain or
-controller code.
+Adapters can be swapped without changing domain or controller code.
 """
 
 from .pandas_table_repository import PandasTableRepository
diff --git a/src/petab_gui/adapters/pandas_table_repository.py b/src/petab_gui/adapters/pandas_table_repository.py
index 26c5fac..c9740ae 100644
--- a/src/petab_gui/adapters/pandas_table_repository.py
+++ b/src/petab_gui/adapters/pandas_table_repository.py
@@ -204,6 +204,80 @@ def update_row(self, index: int, data: dict) -> ValidationResult:
                 return result
         return ValidationResult.valid()
 
+    def add_row_with_id(
+        self, row_id: str, data: dict, preserve_dtypes: bool = True
+    ) -> None:
+        """Add row with custom identifier and preserve column dtypes."""
+        # Store current dtypes if needed
+        if preserve_dtypes:
+            dtypes = self._data_frame.dtypes.copy()
+
+        # Fill missing columns with empty string
+        new_row = {}
+        for col in self._data_frame.columns:
+            new_row[col] = data.get(col, "")
+
+        # Add row with custom index
+        new_df_row = pd.DataFrame([new_row], index=[row_id])
+        self._data_frame = pd.concat(
+            [self._data_frame, new_df_row], ignore_index=False
+        )
+
+        # Restore dtypes if needed
+        if preserve_dtypes:
+            for col in dtypes.index:
+                try:
+                    self._data_frame[col] = self._data_frame[col].astype(
+                        dtypes[col]
+                    )
+                except (ValueError, TypeError):
+                    # If conversion fails, keep the current dtype
+                    pass
+
+    def restore_row_at_position(
+        self, position: int, row_id: str, data: dict
+    ) -> None:
+        """Restore row at exact position with specific ID."""
+        # Fill missing columns with empty string
+        new_row = {}
+        for col in self._data_frame.columns:
+            new_row[col] = data.get(col, "")
+
+        # Create new row
+        new_df_row = pd.DataFrame([new_row], index=[row_id])
+
+        # Split DataFrame at position and insert
+        if position == 0:
+            # Insert at beginning
+            self._data_frame = pd.concat(
+                [new_df_row, self._data_frame], ignore_index=False
+            )
+        elif position >= len(self._data_frame):
+            # Insert at end
+            self._data_frame = pd.concat(
+                [self._data_frame, new_df_row], ignore_index=False
+            )
+        else:
+            # Insert in middle
+            before = self._data_frame.iloc[:position]
+            after = self._data_frame.iloc[position:]
+            self._data_frame = pd.concat(
+                [before, new_df_row, after], ignore_index=False
+            )
+
+    def rename_index(self, old_id: str, new_id: str) -> None:
+        """Rename row identifier."""
+        if old_id in self._data_frame.index:
+            self._data_frame.rename(index={old_id: new_id}, inplace=True)
+
+            # Update invalid cells tracking
+            updated_invalid = {}
+            for (r, c), msg in self._invalid_cells.items():
+                # Row indices in _invalid_cells are positions, not IDs
+                # So we don't need to update them
+                updated_invalid[(r, c)] = msg
+            self._invalid_cells = updated_invalid
+
     # Column mutations
     def add_column(self, column_name: str, default_value: Any = "") -> None:
         """Add column to all rows with default value."""
@@ -235,6 +309,13 @@ def rename_column(self, old_name: str, new_name: str) -> None:
                     updated_invalid[(r, c)] = msg
             self._invalid_cells = updated_invalid
 
+    def insert_column_at(
+        self, position: int, column_name: str, default_value: Any = ""
+    ) -> None:
+        """Insert column at specific position."""
+        # Create new column with default value
+        self._data_frame.insert(position, column_name, default_value)
+
     # Bulk operations
     def clear_all_rows(self) -> None:
         """Remove all rows (keeps columns and structure)."""
@@ -263,6 +344,62 @@ def replace_text(
 
         return changed_cells
 
+    def find_cells(
+        self,
+        pattern: str,
+        regex: bool = False,
+        case_sensitive: bool = False,
+    ) -> list[tuple[int, str, Any]]:
+        """Find all cells matching pattern."""
+        import re as regex_module
+
+        matches = []
+
+        # Prepare pattern for matching
+        if not case_sensitive and not regex:
+            pattern_lower = pattern.lower()
+
+        # Search in cells
+        for row_idx in range(len(self._data_frame)):
+            for col in self._data_frame.columns:
+                value = self._data_frame.iloc[
+                    row_idx, self._data_frame.columns.get_loc(col)
+                ]
+                value_str = str(value)
+
+                # Check for match
+                if regex:
+                    flags = 0 if case_sensitive else regex_module.IGNORECASE
+                    if regex_module.search(pattern, value_str, flags):
+                        matches.append((row_idx, col, value))
+                else:
+                    # Simple string matching
+                    if case_sensitive:
+                        if pattern in value_str:
+                            matches.append((row_idx, col, value))
+                    else:
+                        if pattern_lower in value_str.lower():
+                            matches.append((row_idx, col, value))
+
+        # Also search in index
+        for row_idx, row_id in enumerate(self._data_frame.index):
+            row_id_str = str(row_id)
+
+            # Check for match in index
+            if regex:
+                flags = 0 if case_sensitive else regex_module.IGNORECASE
+                if regex_module.search(pattern, row_id_str, flags):
+                    matches.append((row_idx, "_index_", row_id))
+            else:
+                if case_sensitive:
+                    if pattern in row_id_str:
+                        matches.append((row_idx, "_index_", row_id))
+                else:
+                    if pattern_lower in row_id_str.lower():
+                        matches.append((row_idx, "_index_", row_id))
+
+        return matches
+
     # Metadata
     def row_count(self) -> int:
         """Get number of rows."""
diff --git a/src/petab_gui/commands.py b/src/petab_gui/commands.py
index b0f4f5a..fa47ef2 100644
--- a/src/petab_gui/commands.py
+++ b/src/petab_gui/commands.py
@@ -136,12 +136,15 @@ def undo(self):
             self.model.beginInsertColumns(
                 QModelIndex(), self.position, self.position
             )
-            # Restore column with old values
-            # Repository doesn't support positional insert, use DataFrame
-            df = self.model._data_frame
-            # Convert dict back to Series for insert
-            old_values_series = pd.Series(self.old_values)
-            df.insert(self.position, self.column_name, old_values_series)
+            # Restore column with old values at original position
+            self.model.repository.insert_column_at(
+                self.position, self.column_name, ""
+            )
+            # Restore the old values
+            for row_idx, value in enumerate(self.old_values.values()):
+                self.model.repository.set_cell(
+                    row_idx, self.column_name, value
+                )
             self.model.endInsertColumns()
 
 
@@ -194,8 +197,10 @@ def _generate_new_indices(self, count):
         """Generate default row indices based on table type and index type."""
         base = 0
         # Get existing indices through repository
-        df = self.model._data_frame
-        existing = set(df.index.astype(str))
+        existing = set()
+        for row_idx in range(self.model.repository.row_count()):
+            row_id = self.model.repository.get_row_id(row_idx)
+            existing.add(str(row_id))
 
         indices = []
         while len(indices) < count:
diff --git a/src/petab_gui/controllers/table_controllers.py b/src/petab_gui/controllers/table_controllers.py
index 0e06958..4bf04b3 100644
--- a/src/petab_gui/controllers/table_controllers.py
+++ b/src/petab_gui/controllers/table_controllers.py
@@ -582,31 +582,45 @@ def replace_all(
 
         from ..commands import ModifyDataFrameCommand
 
-        df = self.model._data_frame
+        # Use repository to find matching cells
         changes = {}  # Will store {(row_id, col_name): (old_val, new_val)}
 
-        # Find all matching cells and store old values
-        for col in df.columns:
-            for _row_idx, row_id in enumerate(df.index):
-                old_val = df.at[row_id, col]
-                if pd.isna(old_val):
-                    continue
+        # Find all matching cells using repository
+        matches = self.model.repository.find_cells(
+            search_text, regex=regex, case_sensitive=case_sensitive
+        )
 
-                matched, new_str = self._find_and_replace_in_text(
-                    str(old_val),
-                    search_text,
-                    replace_text,
-                    case_sensitive,
-                    regex,
-                )
+        # Process matches and apply replacements
+        for row_idx, col_name, old_val in matches:
+            # Skip index matches for now (handled separately)
+            if col_name == "_index_":
+                continue
+
+            if pd.isna(old_val):
+                continue
+
+            matched, new_str = self._find_and_replace_in_text(
+                str(old_val),
+                search_text,
+                replace_text,
+                case_sensitive,
+                regex,
+            )
 
-                if matched and new_str != str(old_val):
-                    changes[(row_id, col)] = (old_val, new_str)
+            if matched and new_str != str(old_val):
+                # Get row_id from repository
+                row_id = self.model.repository.get_row_id(row_idx)
+                changes[(row_id, col_name)] = (old_val, new_str)
 
         # Replace in the index as well
         index_renames = []  # Collect index renames for undo support
-        if isinstance(df.index, pd.Index) and df.index.name:
-            for row_idx, row_id in enumerate(df.index):
+        # Check if table has named index
+        if self.model._has_named_index:
+            # Find index matches from find_cells results
+            for row_idx, col_name, row_id in matches:
+                if col_name != "_index_":
+                    continue
+
                 matched, new_str = self._find_and_replace_in_text(
                     str(row_id),
                     search_text,
@@ -648,10 +662,11 @@ def replace_all(
                 self.model.undo_stack.endMacro()
             else:
                 # Fallback: apply changes directly if no undo stack
-                for (row_id, col), (_old_val, new_val) in changes.items():
-                    df.at[row_id, col] = new_val
+                for (row_id, col_name), (_old_val, new_val) in changes.items():
+                    row_pos = self.model.repository.get_row_position(row_id)
+                    self.model.repository.set_cell(row_pos, col_name, new_val)
                 for old_id, new_id, _ in index_renames:
-                    df.rename(index={old_id: new_id}, inplace=True)
+                    self.model.repository.rename_index(old_id, new_id)
 
     def get_columns(self):
         """Get the columns of the table."""
diff --git a/src/petab_gui/domain/table_repository.py b/src/petab_gui/domain/table_repository.py
index b39fa1a..96adf4a 100644
--- a/src/petab_gui/domain/table_repository.py
+++ b/src/petab_gui/domain/table_repository.py
@@ -210,6 +210,54 @@ def update_row(self, index: int, data: dict) -> ValidationResult:
         """
         ...
 
+    def add_row_with_id(
+        self, row_id: str, data: dict, preserve_dtypes: bool = True
+    ) -> None:
+        """Add row with custom identifier and preserve column dtypes.
+
+        Args:
+            row_id: Custom row identifier (for named index tables)
+            data: Row data as dict (column name → value)
+            preserve_dtypes: Whether to preserve existing column dtypes
+                (default: True)
+
+        Notes:
+            Required for undo of delete operations on tables with named indices
+            (parameters, conditions, observables). Ensures dtypes don't change
+            when restoring rows.
+        """
+        ...
+
+    def restore_row_at_position(
+        self, position: int, row_id: str, data: dict
+    ) -> None:
+        """Restore row at exact position with specific ID.
+
+        Args:
+            position: Zero-based position where row should be inserted
+            row_id: Row identifier
+            data: Row data as dict
+
+        Notes:
+            Required for undo/redo to restore rows in exact original order.
+            Unlike add_row(), this preserves both position and ID.
+        """
+        ...
+
+    def rename_index(self, old_id: str, new_id: str) -> None:
+        """Rename row identifier.
+
+        Args:
+            old_id: Current row identifier
+            new_id: New row identifier
+
+        Notes:
+            Required for updating identifiers across tables when user renames
+            a parameter, condition, or observable. Only works on tables with
+            named indices.
+        """
+        ...
+
     # Column mutations
     def add_column(self, column_name: str, default_value: Any = "") -> None:
         """Add column to all rows with default value.
@@ -237,6 +285,24 @@ def rename_column(self, old_name: str, new_name: str) -> None:
         """
         ...
 
+    def insert_column_at(
+        self, position: int, column_name: str, default_value: Any = ""
+    ) -> None:
+        """Insert column at specific position.
+
+        Args:
+            position: Zero-based column position where new column should be
+                inserted
+            column_name: Name of new column
+            default_value: Value to use for all existing rows (default: "")
+
+        Notes:
+            Required for undo/redo to restore exact column order.
+            Position 0 inserts before first column, position N inserts after
+            last.
+        """
+        ...
+
     # Bulk operations
     def clear_all_rows(self) -> None:
         """Remove all rows (keeps columns and structure)."""
@@ -256,6 +322,28 @@ def replace_text(
         """
         ...
 
+    def find_cells(
+        self,
+        pattern: str,
+        regex: bool = False,
+        case_sensitive: bool = False,
+    ) -> list[tuple[int, str, Any]]:
+        """Find all cells matching pattern.
+
+        Args:
+            pattern: Text pattern to search for
+            regex: Whether to use regex matching (default: False)
+            case_sensitive: Whether to match case (default: False)
+
+        Returns:
+            List of (row_index, column_name, cell_value) tuples for all matches
+
+        Notes:
+            Required for find/replace dialog. Searches both cell values and
+            row identifiers.
+        """
+        ...
+
     # Metadata
     def row_count(self) -> int:
         """Get number of rows.
diff --git a/src/petab_gui/models/pandas_table_model.py b/src/petab_gui/models/pandas_table_model.py
index fa7b46d..b324bbb 100644
--- a/src/petab_gui/models/pandas_table_model.py
+++ b/src/petab_gui/models/pandas_table_model.py
@@ -574,10 +574,9 @@ def replace_text(self, old_text: str, new_text: str):
                 model_idx = self.index(row, col_idx)
                 self.dataChanged.emit(model_idx, model_idx, [Qt.DisplayRole])
 
-        # Also replace in the index (still needs DataFrame for named
-        # index handling)
+        # Also replace in the index using repository
         if self._has_named_index and old_text in self._data_frame.index:
-            self._data_frame.rename(index={old_text: new_text}, inplace=True)
+            self.repository.rename_index(old_text, new_text)
             index_row = self._data_frame.index.get_loc(new_text)
             index_top_left = self.index(index_row, 0)
             index_bottom_right = self.index(index_row, 0)
@@ -1032,22 +1031,26 @@ def fill_row(self, row_position: int, data: dict):
             data.pop(key, None)
         data_to_add.update(data)
         if index_key and self._has_named_index:
+            # Get current row ID using repository
+            old_row_id = self.repository.get_row_id(row_position)
             self.undo_stack.push(
                 RenameIndexCommand(
                     self,
-                    self._data_frame.index.tolist()[row_position],
+                    old_row_id,
                     index_key,
                     self.index(row_position, 0),
                 )
             )
         if index_key is None:
-            index_key = self._data_frame.index.tolist()[row_position]
+            index_key = self.repository.get_row_id(row_position)
 
-        changes = {
-            (index_key, col): (self._data_frame.at[index_key, col], val)
-            for col, val in data_to_add.items()
-            if val not in [self._data_frame.at[index_key, col], "", None]
-        }
+        # Build changes dict using repository for cell access
+        changes = {}
+        for col, val in data_to_add.items():
+            # Get current cell value using repository
+            old_val = self.repository.get_cell(row_position, col)
+            if val not in [old_val, "", None]:
+                changes[(index_key, col)] = (old_val, val)
         self.undo_stack.push(
             ModifyDataFrameCommand(self, changes, "Fill values")
         )
diff --git a/tests/adapters/test_pandas_table_repository.py b/tests/adapters/test_pandas_table_repository.py
index 80a2ede..76e7eaf 100644
--- a/tests/adapters/test_pandas_table_repository.py
+++ b/tests/adapters/test_pandas_table_repository.py
@@ -438,3 +438,246 @@ def test_column_names_returns_all_columns(self, parameter_repository):
     def test_table_type_returns_correct_type(self, parameter_repository):
         """Test table_type returns the table type string."""
         assert parameter_repository.table_type() == "parameter"
+
+
+class TestAdvancedRowMutations:
+    """Test advanced row mutation methods for undo/redo support."""
+
+    def test_add_row_with_id_creates_row_with_custom_id(
+        self, parameter_repository
+    ):
+        """Test add_row_with_id creates row with specified ID."""
+        parameter_repository.add_row_with_id(
+            "custom_k", {"nominalValue": 99.0, "estimate": 1}
+        )
+
+        row = parameter_repository.get_row_by_id("custom_k")
+        assert row is not None
+        assert row["nominalValue"] == 99.0
+
+    def test_add_row_with_id_preserves_dtypes(self, parameter_repository):
+        """Test add_row_with_id preserves column dtypes."""
+        original_dtypes = parameter_repository._data_frame.dtypes.copy()
+
+        parameter_repository.add_row_with_id(
+            "k_new", {"nominalValue": 5.0, "estimate": 1}, preserve_dtypes=True
+        )
+
+        # Check dtypes are preserved
+        for col in original_dtypes.index:
+            assert (
+                parameter_repository._data_frame.dtypes[col]
+                == original_dtypes[col]
+            )
+
+    def test_add_row_with_id_fills_missing_columns(self, parameter_repository):
+        """Test add_row_with_id fills missing columns with empty string."""
+        parameter_repository.add_row_with_id(
+            "k_partial", {"nominalValue": 7.0}
+        )
+
+        row = parameter_repository.get_row_by_id("k_partial")
+        assert "estimate" in row
+
+    def test_restore_row_at_position_inserts_at_beginning(
+        self, parameter_repository
+    ):
+        """Test restore_row_at_position inserts at position 0."""
+        row_data = {"nominalValue": 0.5, "estimate": 0}
+
+        parameter_repository.restore_row_at_position(0, "k0", row_data)
+
+        # Check row is at position 0
+        assert parameter_repository.get_row_id(0) == "k0"
+        row = parameter_repository.get_row(0)
+        assert row["nominalValue"] == 0.5
+
+    def test_restore_row_at_position_inserts_in_middle(
+        self, parameter_repository
+    ):
+        """Test restore_row_at_position inserts at middle position."""
+        row_data = {"nominalValue": 1.5, "estimate": 1}
+
+        parameter_repository.restore_row_at_position(1, "k1_5", row_data)
+
+        # Check row is at position 1
+        assert parameter_repository.get_row_id(1) == "k1_5"
+        row = parameter_repository.get_row(1)
+        assert row["nominalValue"] == 1.5
+
+    def test_restore_row_at_position_inserts_at_end(
+        self, parameter_repository
+    ):
+        """Test restore_row_at_position appends at the end."""
+        row_data = {"nominalValue": 99.0, "estimate": 1}
+        end_position = parameter_repository.row_count()
+
+        parameter_repository.restore_row_at_position(
+            end_position, "k_end", row_data
+        )
+
+        # Check row is at the last position
+        assert parameter_repository.get_row_id(end_position) == "k_end"
+        row = parameter_repository.get_row(end_position)
+        assert row["nominalValue"] == 99.0
+
+    def test_rename_index_changes_row_id(self, parameter_repository):
+        """Test rename_index changes row identifier."""
+        parameter_repository.rename_index("k1", "parameter_1")
+
+        # Old ID should not exist
+        assert parameter_repository.get_row_by_id("k1") is None
+        # New ID should exist
+        row = parameter_repository.get_row_by_id("parameter_1")
+        assert row is not None
+        assert row["nominalValue"] == 1.0
+
+    def test_rename_index_handles_nonexistent_id(self, parameter_repository):
+        """Test rename_index handles non-existent ID gracefully."""
+        # Should not raise error
+        parameter_repository.rename_index("nonexistent", "new_name")
+
+        # Nothing should have changed
+        assert parameter_repository.row_count() == 3
+
+    def test_get_row_id_returns_identifier(self, parameter_repository):
+        """Test get_row_id returns row identifier from position."""
+        row_id = parameter_repository.get_row_id(0)
+
+        assert row_id == "k1"
+
+    def test_get_row_id_raises_for_invalid_position(
+        self, parameter_repository
+    ):
+        """Test get_row_id raises IndexError for invalid position."""
+        with pytest.raises(IndexError):
+            parameter_repository.get_row_id(999)
+
+    def test_get_row_position_returns_index(self, parameter_repository):
+        """Test get_row_position returns position from identifier."""
+        position = parameter_repository.get_row_position("k2")
+
+        assert position == 1
+
+    def test_get_row_position_raises_for_invalid_id(
+        self, parameter_repository
+    ):
+        """Test get_row_position raises KeyError for invalid ID."""
+        with pytest.raises(KeyError):
+            parameter_repository.get_row_position("nonexistent")
+
+
+class TestAdvancedColumnMutations:
+    """Test advanced column mutation methods for undo/redo support."""
+
+    def test_insert_column_at_beginning(self, parameter_repository):
+        """Test insert_column_at inserts at position 0."""
+        parameter_repository.insert_column_at(0, "newFirst", "default")
+
+        columns = parameter_repository.column_names()
+        assert columns[0] == "newFirst"
+        # Check all rows have the default value
+        for i in range(parameter_repository.row_count()):
+            assert parameter_repository.get_cell(i, "newFirst") == "default"
+
+    def test_insert_column_at_middle(self, parameter_repository):
+        """Test insert_column_at inserts at middle position."""
+        columns_before = parameter_repository.column_names()
+        insert_pos = len(columns_before) // 2
+
+        parameter_repository.insert_column_at(insert_pos, "newMiddle", 42)
+
+        columns_after = parameter_repository.column_names()
+        assert columns_after[insert_pos] == "newMiddle"
+        # Check value
+        assert parameter_repository.get_cell(0, "newMiddle") == 42
+
+    def test_insert_column_at_end(self, parameter_repository):
+        """Test insert_column_at appends at the end."""
+        columns_before = parameter_repository.column_names()
+        end_pos = len(columns_before)
+
+        parameter_repository.insert_column_at(end_pos, "newLast", "end")
+
+        columns_after = parameter_repository.column_names()
+        assert columns_after[-1] == "newLast"
+        assert parameter_repository.get_cell(0, "newLast") == "end"
+
+    def test_get_column_position_returns_index(self, parameter_repository):
+        """Test get_column_position returns column position."""
+        position = parameter_repository.get_column_position("nominalValue")
+
+        assert isinstance(position, int)
+        assert position >= 0
+
+    def test_get_column_position_raises_for_invalid_column(
+        self, parameter_repository
+    ):
+        """Test get_column_position raises KeyError for invalid column."""
+        with pytest.raises(KeyError):
+            parameter_repository.get_column_position("nonexistent")
+
+
+class TestSearchMethods:
+    """Test search and find methods."""
+
+    def test_find_cells_basic_search(self, parameter_repository):
+        """Test find_cells finds matching cells."""
+        matches = parameter_repository.find_cells("1")
+
+        assert len(matches) > 0
+        # Each match should be (row_idx, col_name, value)
+        assert all(len(match) == 3 for match in matches)
+
+    def test_find_cells_case_sensitive(self, measurement_repository):
+        """Test find_cells respects case sensitivity."""
+        # Add some test data with different cases
+        measurement_repository.add_row(
+            {"observableId": "OBS_UPPER", "simulationConditionId": "cond1"}
+        )
+
+        matches_insensitive = measurement_repository.find_cells(
+            "obs", case_sensitive=False
+        )
+        matches_sensitive = measurement_repository.find_cells(
+            "obs", case_sensitive=True
+        )
+
+        # Case-insensitive should find more matches
+        assert len(matches_insensitive) >= len(matches_sensitive)
+
+    def test_find_cells_regex_search(self, parameter_repository):
+        """Test find_cells with regex patterns."""
+        # Search for k followed by digit
+        matches = parameter_repository.find_cells(r"k\d+", regex=True)
+
+        assert len(matches) > 0
+        # All matches should have 'k' followed by digits in index
+        for _row_idx, col_name, value in matches:
+            if col_name == "_index_":
+                assert value.startswith("k")
+
+    def test_find_cells_searches_index(self, parameter_repository):
+        """Test find_cells searches row identifiers."""
+        matches = parameter_repository.find_cells("k1")
+
+        # Should find "k1" in the index
+        index_matches = [m for m in matches if m[1] == "_index_"]
+        assert len(index_matches) > 0
+
+    def test_find_cells_returns_empty_for_no_matches(
+        self, parameter_repository
+    ):
+        """Test find_cells returns empty list when no matches found."""
+        matches = parameter_repository.find_cells("NONEXISTENT_STRING_12345")
+
+        assert matches == []
+
+    def test_find_cells_with_numeric_values(self, parameter_repository):
+        """Test find_cells can find numeric values."""
+        matches = parameter_repository.find_cells("1.0")
+
+        assert len(matches) > 0
+        # Should find the nominalValue 1.0
+        value_matches = [m for m in matches if m[2] == 1.0]
+        assert len(value_matches) > 0

From 04f4e3ffb2c80f50e067c812af9fe64d3a2343dd Mon Sep 17 00:00:00 2001
From: PaulJonasJost <jost.pauljonas@gmail.com>
Date: Thu, 2 Jul 2026 14:10:22 +0200
Subject: [PATCH 11/11] Improved code

---
 .../adapters/pandas_table_repository.py       | 93 ++++++-------------
 src/petab_gui/commands.py                     | 55 ++++-------
 .../controllers/table_controllers.py          | 70 ++++++--------
 3 files changed, 74 insertions(+), 144 deletions(-)

diff --git a/src/petab_gui/adapters/pandas_table_repository.py b/src/petab_gui/adapters/pandas_table_repository.py
index c9740ae..7a054b5 100644
--- a/src/petab_gui/adapters/pandas_table_repository.py
+++ b/src/petab_gui/adapters/pandas_table_repository.py
@@ -213,9 +213,7 @@ def add_row_with_id(
             dtypes = self._data_frame.dtypes.copy()
 
         # Fill missing columns with empty string
-        new_row = {}
-        for col in self._data_frame.columns:
-            new_row[col] = data.get(col, "")
+        new_row = {col: data.get(col, "") for col in self._data_frame.columns}
 
         # Add row with custom index
         new_df_row = pd.DataFrame([new_row], index=[row_id])
@@ -239,44 +237,28 @@ def restore_row_at_position(
     ) -> None:
         """Restore row at exact position with specific ID."""
         # Fill missing columns with empty string
-        new_row = {}
-        for col in self._data_frame.columns:
-            new_row[col] = data.get(col, "")
-
-        # Create new row
+        new_row = {col: data.get(col, "") for col in self._data_frame.columns}
         new_df_row = pd.DataFrame([new_row], index=[row_id])
 
-        # Split DataFrame at position and insert
+        # Determine parts to concatenate based on position
         if position == 0:
-            # Insert at beginning
-            self._data_frame = pd.concat(
-                [new_df_row, self._data_frame], ignore_index=False
-            )
+            parts = [new_df_row, self._data_frame]
         elif position >= len(self._data_frame):
-            # Insert at end
-            self._data_frame = pd.concat(
-                [self._data_frame, new_df_row], ignore_index=False
-            )
+            parts = [self._data_frame, new_df_row]
         else:
-            # Insert in middle
-            before = self._data_frame.iloc[:position]
-            after = self._data_frame.iloc[position:]
-            self._data_frame = pd.concat(
-                [before, new_df_row, after], ignore_index=False
-            )
+            parts = [
+                self._data_frame.iloc[:position],
+                new_df_row,
+                self._data_frame.iloc[position:],
+            ]
+
+        self._data_frame = pd.concat(parts, ignore_index=False)
 
     def rename_index(self, old_id: str, new_id: str) -> None:
         """Rename row identifier."""
         if old_id in self._data_frame.index:
             self._data_frame.rename(index={old_id: new_id}, inplace=True)
-
-            # Update invalid cells tracking
-            updated_invalid = {}
-            for (r, c), msg in self._invalid_cells.items():
-                # Row indices in _invalid_cells are positions, not IDs
-                # So we don't need to update them
-                updated_invalid[(r, c)] = msg
-            self._invalid_cells = updated_invalid
+            # Note: Invalid cells use row positions (not IDs), no update needed
 
     # Column mutations
     def add_column(self, column_name: str, default_value: Any = "") -> None:
@@ -353,11 +335,17 @@ def find_cells(
         """Find all cells matching pattern."""
         import re as regex_module
 
-        matches = []
+        def matches_pattern(text: str) -> bool:
+            """Check if text matches the search pattern."""
+            if regex:
+                flags = 0 if case_sensitive else regex_module.IGNORECASE
+                return bool(regex_module.search(pattern, text, flags))
+            # Simple string matching
+            if case_sensitive:
+                return pattern in text
+            return pattern.lower() in text.lower()
 
-        # Prepare pattern for matching
-        if not case_sensitive and not regex:
-            pattern_lower = pattern.lower()
+        matches = []
 
         # Search in cells
         for row_idx in range(len(self._data_frame)):
@@ -365,38 +353,13 @@ def find_cells(
                 value = self._data_frame.iloc[
                     row_idx, self._data_frame.columns.get_loc(col)
                 ]
-                value_str = str(value)
+                if matches_pattern(str(value)):
+                    matches.append((row_idx, col, value))
 
-                # Check for match
-                if regex:
-                    flags = 0 if case_sensitive else regex_module.IGNORECASE
-                    if regex_module.search(pattern, value_str, flags):
-                        matches.append((row_idx, col, value))
-                else:
-                    # Simple string matching
-                    if case_sensitive:
-                        if pattern in value_str:
-                            matches.append((row_idx, col, value))
-                    else:
-                        if pattern_lower in value_str.lower():
-                            matches.append((row_idx, col, value))
-
-        # Also search in index
+        # Search in index
         for row_idx, row_id in enumerate(self._data_frame.index):
-            row_id_str = str(row_id)
-
-            # Check for match in index
-            if regex:
-                flags = 0 if case_sensitive else regex_module.IGNORECASE
-                if regex_module.search(pattern, row_id_str, flags):
-                    matches.append((row_idx, "_index_", row_id))
-            else:
-                if case_sensitive:
-                    if pattern in row_id_str:
-                        matches.append((row_idx, "_index_", row_id))
-                else:
-                    if pattern_lower in row_id_str.lower():
-                        matches.append((row_idx, "_index_", row_id))
+            if matches_pattern(str(row_id)):
+                matches.append((row_idx, "_index_", row_id))
 
         return matches
 
diff --git a/src/petab_gui/commands.py b/src/petab_gui/commands.py
index fa47ef2..83cdbf8 100644
--- a/src/petab_gui/commands.py
+++ b/src/petab_gui/commands.py
@@ -197,10 +197,10 @@ def _generate_new_indices(self, count):
         """Generate default row indices based on table type and index type."""
         base = 0
         # Get existing indices through repository
-        existing = set()
-        for row_idx in range(self.model.repository.row_count()):
-            row_id = self.model.repository.get_row_id(row_idx)
-            existing.add(str(row_id))
+        existing = {
+            str(self.model.repository.get_row_id(i))
+            for i in range(self.model.repository.row_count())
+        }
 
         indices = []
         while len(indices) < count:
@@ -226,22 +226,16 @@ def redo(self):
                 QModelIndex(), position, position + len(self.row_indices) - 1
             )
 
-            # Add rows through DataFrame (repository doesn't support custom
-            # index yet)
-            df = self.model._data_frame
-            dtypes = df.dtypes.copy()
-
+            # Add rows with custom indices using repository
             for idx in self.row_indices:
-                # Repository doesn't support custom index yet, use DataFrame
-                df.loc[idx] = [np.nan] * df.shape[1]
-
-            # Restore dtypes
-            if np.any(dtypes != df.dtypes):
-                for col, dtype in dtypes.items():
-                    if dtype != df.dtypes[col]:
-                        df[col] = _convert_dtype_with_nullable_int(
-                            df[col], dtype
-                        )
+                # Create empty row data
+                row_data = dict.fromkeys(
+                    self.model.repository.column_names(), np.nan
+                )
+                # Add row with custom ID and preserve dtypes
+                self.model.repository.add_row_with_id(
+                    str(idx), row_data, preserve_dtypes=True
+                )
 
             self.model.endInsertRows()
         else:
@@ -262,8 +256,6 @@ def undo(self):
         If the original command was to add rows, this removes them.
         If the original command was to remove rows, this restores them.
         """
-        df = self.model._data_frame
-
         if self.add_mode:
             # Remove the rows we added
             positions = [
@@ -281,30 +273,20 @@ def undo(self):
 
             self.model.endRemoveRows()
         else:
-            # Restore deleted rows
+            # Restore deleted rows at original positions
             self.model.beginInsertRows(
                 QModelIndex(), min(self.row_indices), max(self.row_indices)
             )
 
-            # Restore rows at original positions
-            # This requires DataFrame manipulation for index ordering
-            restore_index_order = df.index
+            # Restore rows at exact original positions with original IDs
             for pos, index_name, row_data in zip(
                 self.row_indices,
                 self.old_ind_names,
                 self.old_rows,
                 strict=False,
             ):
-                restore_index_order = restore_index_order.insert(
-                    pos, index_name
-                )
-                # Restore row - use DataFrame for positioning
-                df.loc[index_name] = [
-                    row_data.get(col, "") for col in df.columns
-                ]
-                df.sort_index(
-                    inplace=True,
-                    key=lambda x: x.map(restore_index_order.get_loc),
+                self.model.repository.restore_row_at_position(
+                    pos, index_name, row_data
                 )
 
             self.model.endInsertRows()
@@ -420,8 +402,7 @@ def _apply(self, src, dst):
             src: The source index name to rename
             dst: The destination index name
         """
-        df = self.model._data_frame
-        df.rename(index={src: dst}, inplace=True)
+        self.model.repository.rename_index(src, dst)
         self.model.dataChanged.emit(
             self.model_index, self.model_index, [Qt.DisplayRole]
         )
diff --git a/src/petab_gui/controllers/table_controllers.py b/src/petab_gui/controllers/table_controllers.py
index 4bf04b3..1e1a850 100644
--- a/src/petab_gui/controllers/table_controllers.py
+++ b/src/petab_gui/controllers/table_controllers.py
@@ -582,55 +582,41 @@ def replace_all(
 
         from ..commands import ModifyDataFrameCommand
 
-        # Use repository to find matching cells
-        changes = {}  # Will store {(row_id, col_name): (old_val, new_val)}
-
         # Find all matching cells using repository
         matches = self.model.repository.find_cells(
             search_text, regex=regex, case_sensitive=case_sensitive
         )
 
-        # Process matches and apply replacements
+        # Process all matches in a single pass
+        changes = {}  # {(row_id, col_name): (old_val, new_val)}
+        index_renames = []  # [(old_id, new_id, row_idx)]
+
         for row_idx, col_name, old_val in matches:
-            # Skip index matches for now (handled separately)
             if col_name == "_index_":
-                continue
-
-            if pd.isna(old_val):
-                continue
-
-            matched, new_str = self._find_and_replace_in_text(
-                str(old_val),
-                search_text,
-                replace_text,
-                case_sensitive,
-                regex,
-            )
-
-            if matched and new_str != str(old_val):
-                # Get row_id from repository
-                row_id = self.model.repository.get_row_id(row_idx)
-                changes[(row_id, col_name)] = (old_val, new_str)
-
-        # Replace in the index as well
-        index_renames = []  # Collect index renames for undo support
-        # Check if table has named index
-        if self.model._has_named_index:
-            # Find index matches from find_cells results
-            for row_idx, col_name, row_id in matches:
-                if col_name != "_index_":
-                    continue
-
-                matched, new_str = self._find_and_replace_in_text(
-                    str(row_id),
-                    search_text,
-                    replace_text,
-                    case_sensitive,
-                    regex,
-                )
-
-                if matched and new_str != str(row_id):
-                    index_renames.append((row_id, new_str, row_idx))
+                # Handle index matches
+                if self.model._has_named_index:
+                    matched, new_str = self._find_and_replace_in_text(
+                        str(old_val),
+                        search_text,
+                        replace_text,
+                        case_sensitive,
+                        regex,
+                    )
+                    if matched and new_str != str(old_val):
+                        index_renames.append((old_val, new_str, row_idx))
+            else:
+                # Handle cell matches
+                if not pd.isna(old_val):
+                    matched, new_str = self._find_and_replace_in_text(
+                        str(old_val),
+                        search_text,
+                        replace_text,
+                        case_sensitive,
+                        regex,
+                    )
+                    if matched and new_str != str(old_val):
+                        row_id = self.model.repository.get_row_id(row_idx)
+                        changes[(row_id, col_name)] = (old_val, new_str)
 
         # Create undo command(s)
         if changes or index_renames: