🎉 Check out our new Blog Post to see the latest features in Splink 3, plus a sneak peak of what we have in store for Splink 4! 🎉

Splink

Interactive Settings Editor

Initializing search

GitHub

Home
Getting Started
Tutorial
Examples
Topic Guides
Documentation
Contributing
Blog

Splink

GitHub

Home
Getting Started
Tutorial
Tutorial
Examples
Examples
- Introduction
- DuckDB
  DuckDB
- PySpark
  PySpark
  - Deduplication using Pyspark
- Athena
  Athena
  - Deduplicate 50k rows historical persons
- SQLite
  SQLite
  - Deduplicate 50k rows historical persons
Topic Guides
Topic Guides
- Introduction
- Record Linkage Theory
  Record Linkage Theory
- Linkage Models in Splink
  Linkage Models in Splink
  - Splink's SQL backends - Spark, DuckDB etc
    Splink's SQL backends - Spark, DuckDB etc
    
    Backends overview
    
    PostgreSQL
  - Link type - linking vs deduping
  - Defining Splink models
  - Retrieving and querying Splink results
- Data Preparation
  Data Preparation
  - Feature Engineering
- Blocking
  Blocking
- Comparing Records
  Comparing Records
  - Defining and customising comparisons
  - Out-of-the-box comparisons
  - Comparing strings
    Comparing strings
    
    Choosing comparators and thresholds
    
    String comparators
    
    Phonetic transformations
    
    Regular Expressions
  - Term-Frequency adjustments
- Evaluation
  Evaluation
  - Overview
  - Model
  - Edges (Links)
    Edges (Links)
    
    Overview
    
    Edge Metrics
    
    Clerical Labelling
  - Clusters
    Clusters
    
    Overview
    
    Graph metrics
    
    How to compute graph metrics
- Performance
  Performance
  - Run times, performance and linking large data
  - Spark Performance
    Spark Performance
    
    Optimising Spark performance
    
    Salting blocking rules
  - DuckDB Performance
    DuckDB Performance
    
    Optimising DuckDB performance
Documentation
Documentation
- Introduction
- API
  API
  - Linker API
    Linker API
    
    Full API
    
    Exploratory analysis
    
    Blocking
    
    Estimating model parameters
    
    Predicting results
    
    Visualisation
    
    Evaluation
  - Comparisons Library API
    Comparisons Library API
    
    Comparison Template Library
    
    Comparison Library
    
    Comparison Level Library
    
    Comparison Composition
    
    Comparison Helpers
  - Blocking Rule Library API
    Blocking Rule Library API
    
    Blocking Rule Library
    
    Blocking Rule Composition
  - EM Training Session API
  - SplinkDataFrame API
  - Comparisons API
    Comparisons API
    
    Comparison
    
    Comparison Level
- Charts Gallery
  Charts Gallery
  - Exploratory Analysis
    Exploratory Analysis
    
    completeness chart
    
    missingness chart
    
    profile columns
  - Blocking
    Blocking
    
    cumulative num comparisons from blocking rules chart
  - Comparison Helpers
    Comparison Helpers
    
    comparator score chart
    
    comparator score threshold chart
    
    phonetic match chart
  - Model Training
    Model Training
    
    comparison viewer dashboard
    
    match weights chart
    
    m u parameters chart
    
    parameter estimate comparisons chart
    
    tf adjustment chart
    
    unlinkables chart
    
    waterfall chart
  - Clustering
    Clustering
    
    cluster studio dashboard
  - Model Evaluation
    Model Evaluation
    
    accuracy chart from labels table
    
    precision recall chart from labels table
    
    roc chart fromm labels table
- In-built datasets
- Settings
  Settings
  - Settings Dictionary Reference
  - Interactive Settings Editor
Contributing
Contributing
- Contributing to Splink
  Contributing to Splink
- How Splink works
  How Splink works
  - Understanding and debugging Splink
  - Transpilation using sqlglot
  - Performance and caching
    Performance and caching
    
    Caching and pipelining
    
    Spark caching
  - Comparison and comparison level libraries
    Comparison and comparison level libraries
    
    Creating new comparisons and comparison levels
    
    Extending existing comparisons and comparison levels
  - Charts
    Charts
    
    Understanding and editing charts
    
    Building new charts
  - User-Defined Functions
  - Settings Validation
    Settings Validation
    
    Settings Validation Overview
    
    Extending the Settings Validator
  - Dependency Compatibility Policy
Blog
Blog
- Categories
  Categories
  - Ethics
  - Feature Updates

settings

Interactive Settings Editor

2024-04-12 2024-04-12

Made with Material for MkDocs