LD Clumping

LD clumping identifies independent index variants by iteratively selecting the variant with the highest chi-squared statistic and pruning variants in high LD with it.

import polars as pl
import graphld as gld

sumstats_clumped: pl.DataFrame = gld.run_clump(
    sumstats=sumstats_dataframe_with_z_scores,
    z_col="Z",
    ldgm_metadata_path="data/test/metadata.csv",
    populations="EUR",
    rsq_threshold=0.1,
    chisq_threshold=30.0,
).filter(pl.col("is_index"))

Clumping plus thresholding is a common baseline for polygenic score construction, though it is typically less efficient than model-based methods.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LD Clumping

FilesExpand file tree

clumping.md

Latest commit

History

clumping.md

File metadata and controls

LD Clumping