Dignity Core – Privacy-Preserving Sequence Modeling for Transactional Behavior

Dignity is a privacy-preserving deep learning framework for modeling transactional behavior patterns. It provides modular components for signal processing, data pipelines, and neural architectures with built-in privacy safeguards including differential privacy and secure data handling.

Overview

Dignity Core implements privacy-first sequence modeling:

Privacy-Preserving: Built-in hashing, anonymization, quantization, and differential privacy via PrivacyManager
Signal Processing: 32 quant finance features — RSI, MACD, Bollinger Bands, ATR, stochastic, ADX, OBV, VWAP, volatility, momentum, regime detection, and more
Modular Architecture: Clean separation between data pipeline, model components, and training infrastructure
Deployable: ONNX export with verification and benchmarking for production inference
Multi-Task: Configurable for risk scoring, forecasting, policy learning, or hierarchical cascade
Lightweight: ~8,000 lines of focused, production-ready Python

Key Features

Privacy-First: SHA-256 hashing, address anonymization, k-anonymity quantization, Laplace differential privacy
32 Signal Features: Full OHLCV-derived feature set for quant finance (RSI, MACD, Bollinger %B, ATR, stochastic, ADX, OBV, VWAP, realized volatility, DC state machine, and more)
Modular Design: Core utilities, data pipeline, and model components are cleanly separated
Hybrid Backbone: CNN1D + StackedLSTM + AdditiveAttention with composable task heads
4 Task Types: Risk scoring, forecasting, policy learning (RL), and hierarchical cascade (Regime → Risk → Alpha → Policy)
ONNX Export: Conversion with verification and inference benchmarking
Synthetic Data: Built-in generators for testing and prototyping
Training Infrastructure: AMP support, gradient clipping, cosine scheduling, checkpointing, CLI interface
324 Tests: Comprehensive test suite across core utilities, data pipeline, models, training, export, and backtest
YAML Configuration: Declarative configs for different tasks and environments

Quick Start

Installation

# Clone repository
git clone https://github.com/crichalchemist/Dignity.git
cd Dignity

# Create conda environment (recommended)
conda create -n dignity python=3.11
conda activate dignity

# Install dependencies
pip install -r requirements.txt

# Or install package (provides dignity-train, dignity-export, dignity-backtest)
pip install -e .

Basic Usage

Generate Synthetic Data

from data.source.synthetic import SyntheticGenerator

# Generate synthetic transaction sequences
gen = SyntheticGenerator(seed=42)
dataset = gen.generate_dataset(
    num_normal=800,
    num_anomalous=200,
    seq_len=100
)

print(f"Generated {len(dataset)} rows")

Privacy Operations

from core.privacy import PrivacyManager
import numpy as np

# Hash transaction identifiers
hashed = PrivacyManager.hash_identifier("0x1234abcd5678ef90", salt="secure_salt")

# Anonymize addresses
addresses = ["0xabc123", "0xdef456", "0xghi789"]
anonymized = PrivacyManager.anonymize_addresses(addresses, salt="secure_salt")

# Quantize amounts (k-anonymity via binning)
amounts = np.array([123.456, 789.012, 456.789])
quantized = PrivacyManager.quantize_amounts(amounts, bins=10)

# Add differential privacy noise
noisy = PrivacyManager.add_noise(amounts, epsilon=1.0, sensitivity=1.0)

# Full sanitization pipeline
result = PrivacyManager.sanitize_dataset(amounts, addresses, epsilon=0.1)

Train a Model

# Train risk model
dignity-train --config config/train_risk.yaml

# Train forecasting model
dignity-train --config config/train_forecast.yaml

# Train cascade model (Regime → Risk → Alpha → Policy)
dignity-train --config config/train_quant_paper.yaml

# Train on Colab with optimized settings
dignity-train --config config/colab.yaml

Export to ONNX

# Export trained model to ONNX
python -m export.to_onnx \
    --checkpoint checkpoints/dignity_risk_best.pt \
    --output dignity_risk.onnx \
    --benchmark

Architecture

Data Pipeline Flow

Data Sources
├── Synthetic Generator (testing/prototyping)
├── Cryptocurrency APIs (CryptoSource, MetaApiSource)
└── Custom Sources (via data/source/ extensibility)
                    ↓
Privacy Operations (core/privacy.py)
├── Hash transaction IDs (SHA-256)
├── Anonymize addresses
├── Quantize amounts (k-anonymity)
└── Add differential privacy noise (Laplace)
                    ↓
Signal Processing (core/signals.py)
├── 32 OHLCV-derived features
├── Technical indicators: RSI, MACD, Bollinger, ATR, Stochastic, ADX
├── Volume signals: OBV, VWAP, order flow imbalance
├── Volatility: realized vol, vol ratio
├── Momentum: ROC, price momentum
├── DC state machine: directional change, overshoot, bars since event
└── Regime detection (volatility clustering)
                    ↓
Data Pipeline (data/pipeline.py)
├── Signal computation (SignalProcessor.process_sequence)
├── Feature scaling (RobustScaler)
├── Sequence windowing
└── PyTorch DataLoader
                    ↓
Model Architecture (models/)
├── Backbone: CNN1D → StackedLSTM → AdditiveAttention
├── Task Heads: Risk | Forecast | Policy | Cascade
└── ~500K+ parameters (default config)
                    ↓
Training (train/engine.py + train/cli.py)
├── Mixed precision (AMP)
├── Gradient clipping
├── Cosine LR scheduling
├── Checkpointing
└── Guided Learning (cascade)
                    ↓
Export & Deploy (export/to_onnx.py)
├── ONNX conversion (with cascade wrapper)
├── Model verification
└── Inference benchmarking

Neural Network Design

The core model implements a modular hybrid architecture:

Backbone (models/backbone/hybrid.py):

CNN1D: 2-layer 1D convolution for local pattern extraction
StackedLSTM: Unidirectional LSTM for temporal dependencies
AdditiveAttention: Attention mechanism for feature weighting

Task Heads (models/head/):

RiskHead: Dual sigmoid outputs — VaR estimate and position limit
ForecastHead: Multi-step time series forecasting (configurable features and horizon)
PolicyHead: RL actor-critic — action logits and value estimate
RegimeHead: Market regime classification (calm, trending, volatile, crisis)
AlphaHead: Risk-adjusted return prediction (tanh-bounded score)

Main Model (models/dignity.py):

Composable: Dignity(task='risk') assembles backbone + appropriate head
Cascade mode: Dignity(task='cascade') chains Regime → Risk → Alpha → Policy heads
4 tasks: risk, forecast, policy, cascade
cascade_loss() implements Guided Learning — auxiliary supervision at every head

Privacy Operations

The PrivacyManager class in core/privacy.py provides:

Hashing: hash_identifier() — SHA-256 with configurable salt
Anonymization: anonymize_addresses() — batch hash addresses
Quantization: quantize_amounts() — k-anonymity via binning
Differential Privacy: add_noise() — Laplace noise with configurable epsilon
Rare Event Suppression: suppress_rare_events() — k-threshold filtering
Full Pipeline: sanitize_dataset() — chains quantization, noise, and anonymization

Signal Processing

SignalProcessor in core/signals.py computes 32 features from OHLCV data:

Technical Indicators: RSI, MACD (line/signal/histogram), Bollinger Bands (%B and width), ATR, Stochastic (%K/%D), ADX

Volume Signals: OBV, VWAP, order flow imbalance

Volatility: Realized volatility (5/20-bar), volatility ratio

Momentum: ROC (5/20-bar), price momentum (10/20-bar)

Directional Change: DC state machine with overshoot and bars-since-event tracking

Regime Detection: Volatility-based classification into calm/normal/turbulent

Asset-Aware: AssetConfig calibrates thresholds per instrument class (forex, crypto, equity, commodity)

Repository Structure

Dignity/
├── __init__.py               # Package root (v0.1.0)
├── setup.py                  # Installation config (console scripts: dignity-train, dignity-export, dignity-backtest)
├── requirements.txt          # Dependencies
├── pytest.ini                # Test configuration
├── pyproject.toml            # Ruff config
│
├── core/                     # Core utilities
│   ├── config.py            # YAML-based configuration (DignityConfig)
│   ├── signals.py           # 32-feature signal processor (SignalProcessor)
│   └── privacy.py           # Privacy operations (PrivacyManager)
│
├── data/                     # Data pipeline
│   ├── pipeline.py          # TransactionPipeline (signals, scaling, windowing)
│   ├── loader.py            # PyTorch Dataset and DataLoader
│   └── source/
│       ├── synthetic.py     # SyntheticGenerator (OHLCV + transaction data)
│       ├── crypto.py        # CryptoSource (CSV and exchange data)
│       └── metaapi.py       # MetaApiSource (live/historical forex data)
│
├── models/                   # Neural architectures
│   ├── dignity.py           # Main model (Dignity class, cascade loss)
│   ├── backbone/
│   │   ├── cnn1d.py        # 1D-CNN for local patterns
│   │   ├── lstm.py         # Stacked LSTM for temporal modeling
│   │   ├── attention.py    # Additive attention mechanism
│   │   └── hybrid.py       # DignityBackbone (CNN→LSTM→Attention)
│   └── head/
│       ├── risk.py         # Dual-output risk head (VaR + position limit)
│       ├── forecast.py     # Multi-step forecasting head
│       ├── policy.py       # Actor-critic policy head
│       ├── regime.py       # Market regime classification head
│       └── alpha.py        # Alpha scoring head
│
├── train/                    # Training infrastructure
│   ├── engine.py            # Training/validation loops with AMP
│   └── cli.py               # CLI entry point (dignity-train)
│
├── export/                   # Deployment
│   └── to_onnx.py           # ONNX export with verification and benchmarking
│
├── backtest/                 # Backtesting framework
│
├── config/                   # YAML configurations (6 files)
│   ├── base.yaml            # Default configuration template
│   ├── train_risk.yaml      # Risk scoring
│   ├── train_forecast.yaml  # Forecasting
│   ├── train_quant_paper.yaml  # Paper trading (cascade)
│   ├── train_quant.yaml     # Live execution (gated)
│   └── colab.yaml           # Google Colab optimized
│
├── tests/                    # Test suite (324 tests)
│   ├── conftest.py          # Pytest fixtures
│   ├── test_core.py         # Core utilities
│   ├── test_data.py         # Data pipeline
│   ├── test_models.py       # Model components
│   ├── test_train.py        # Training
│   ├── test_export.py       # ONNX export
│   └── test_backtest.py     # Backtesting
│
└── docs/                     # Documentation

Package Stats:

48 Python modules (~8,000 lines of code)
324 tests across 6 test files
6 YAML configs for different tasks and environments
32 input features per timestep (default config)

Advanced Usage

Custom Signal Processing

from core.signals import SignalProcessor
import numpy as np

prices = np.array([100.0, 102.0, 98.0, 101.0, 99.0, 103.0])
volumes = np.array([1000.0, 1200.0, 800.0, 1100.0, 900.0, 1300.0])

# Technical indicators
rsi = SignalProcessor.rsi(prices, period=14)
macd_line, macd_signal, macd_hist = SignalProcessor.macd(prices)
pct_b, bandwidth = SignalProcessor.bollinger_bands(prices, window=20)

# Volatility and momentum
vol = SignalProcessor.volatility(prices, window=3)
momentum = SignalProcessor.price_momentum(prices, window=2)
realized_vol = SignalProcessor.realized_volatility(prices, window=20)

# Directional change state machine
dc = SignalProcessor.dc_state_machine(prices, threshold=0.005)

# Regime detection
regime = SignalProcessor.regime_detection(vol)

# Full 32-feature computation
signals = SignalProcessor.process_sequence(volumes, prices)

Configuration Management

from core.config import DignityConfig

# Load config from YAML
config = DignityConfig.from_yaml("config/train_risk.yaml")

# Access nested configs
print(f"Task: {config.model.task}")
print(f"Hidden size: {config.model.hidden_size}")
print(f"Batch size: {config.data.batch_size}")
print(f"Learning rate: {config.train.lr}")

# Save modified config
config.train.epochs = 100
config.to_yaml("config/custom_config.yaml")

Custom Data Source

from data.source.crypto import CryptoSource
import pandas as pd

# Implement custom data source
class CustomSource:
    def load_data(self, symbol: str, start_date: str, end_date: str) -> pd.DataFrame:
        # Must return DataFrame with columns: timestamp, open, high, low, close, volume
        pass

Model Customization

from models.dignity import Dignity
import torch

# Create model with custom config
model = Dignity(
    task="risk",
    input_size=32,      # Number of features
    hidden_size=256,    # Backbone hidden dimension
    n_layers=2,         # LSTM layers
    dropout=0.3
)

# Forward pass
x = torch.randn(4, 100, 32)  # [batch, seq_len, features]
predictions, attention_weights = model(x)

# Cascade mode returns a dict
cascade_model = Dignity(task="cascade", input_size=32)
outputs = cascade_model(x)  # dict with regime_probs, var_estimate, alpha_score, etc.

Running Tests

# Run all tests
pytest tests/ -v

# Run specific test suite
pytest tests/test_core.py -v
pytest tests/test_data.py -v
pytest tests/test_models.py -v

# Run with coverage
pytest tests/ --cov=. --cov-report=html

Design Philosophy

Dignity is built on three principles:

Minimal: ~8,000 lines of focused code. Every module has a single purpose.
Deniable: Privacy-preserving operations baked in. Transaction hashing, anonymization, noise injection.
Deployable: ONNX export, production-ready from day one.

You are not refactoring code. You are distilling intent.

Contributing

Contributions are welcome. Please:

Run tests before submitting: pytest tests/ -v
Follow existing code style: ruff format . and ruff check .
Add tests for new features
Update docs accordingly

License

This project is licensed under the MIT License - see the LICENSE file for details.

Citation

If you use this framework in your research or applications, please cite:

@software{dignity_core,
  title = {Dignity Core: Privacy-Preserving Sequence Modeling for Transactional Behavior},
  author = {crichalchemist},
  year = {2026},
  url = {https://github.com/crichalchemist/Dignity}
}

Acknowledgments

Refactored from Sequence research prototype
PyTorch team for the deep learning framework
Open source community for privacy-preserving ML techniques

Built for deniability. Optimized for persistence.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Dignity Core – Privacy-Preserving Sequence Modeling for Transactional Behavior

Overview

Key Features

Quick Start

Installation

Basic Usage

Generate Synthetic Data

Privacy Operations

Train a Model

Export to ONNX

Architecture

Data Pipeline Flow

Neural Network Design

Privacy Operations

Signal Processing

Repository Structure

Advanced Usage

Custom Signal Processing

Configuration Management

Custom Data Source

Model Customization

Running Tests

Design Philosophy

Contributing

License

Citation

Acknowledgments

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
backtest		backtest
config		config
core		core
data		data
docs		docs
export		export
models		models
scripts		scripts
tests		tests
train		train
.coverage		.coverage
.editorconfig		.editorconfig
.gitattributes		.gitattributes
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
GEMINI.md		GEMINI.md
README.md		README.md
__init__.py		__init__.py
pyproject.toml		pyproject.toml
pytest.ini		pytest.ini
requirements.txt		requirements.txt
setup.py		setup.py

Folders and files

Latest commit

History

Repository files navigation

Dignity Core – Privacy-Preserving Sequence Modeling for Transactional Behavior

Overview

Key Features

Quick Start

Installation

Basic Usage

Generate Synthetic Data

Privacy Operations

Train a Model

Export to ONNX

Architecture

Data Pipeline Flow

Neural Network Design

Privacy Operations

Signal Processing

Repository Structure

Advanced Usage

Custom Signal Processing

Configuration Management

Custom Data Source

Model Customization

Running Tests

Design Philosophy

Contributing

License

Citation

Acknowledgments

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages