Die Häufigkeit von PCR-Duplikaten ist direkt mit Qualität und Menge des zur Verfügung gestellten Ausgangsmaterials korreliert.
Aufgrund unserem voll-automatisiertenBibliotheken-Herstellungsprozesses (Probentyp abhängiger DNA Input, Anpassung der PCR Zyklen) erhalten wir allerdings die geringstmögliche Anzahl an PCR-Duplikatraten. Die segmentierten "Flow cells" des HiSeq4000 und des NovaSeq6000, können allerdings zu auch zu PCR Duplikaten führen, durch technische Duplikate.
Wenn weitere bioinformatische Analysen (z. B. SNP-Identifizierung) in Auftrag gegeben werden, dann wird nur ein Exemplar des doppelten Read-Paares im Alignment behalten. Die restlichen Duplikate werden zur Vermeidung eines Bias aus der weiteren Analyse ausgenommen.