ΦΑΚΕΛΛΟΣ "ΙΟΛΟΓΙΑ": Οι Προκλήσεις στην Κατασκευή Γονιδιωματικής Βιβλιοθήκης
Μετάφραση: Απολλόδωρος
21 Φεβρουαρίου 2022 | Mike Stone, ViroLIEgy | Διαβάστε το εδώ
Αυτό που είναι πραγματικά επαναστατικό στη μοριακή βιολογία στη μετά-Watson-Crick εποχή είναι ότι έχει γίνει ψηφιακή... ο μηχανικός κώδικας των γονιδίων μοιάζει απίστευτα με υπολογιστή".
-Richard Dawkins
Σύμφωνα με την Britannica, μια γονιδιωματική βιβλιοθήκη είναι ουσιαστικά "μια συλλογή τμημάτων DNA που αποτελούν το γονιδίωμα πλήρους μήκους ενός οργανισμού. Μια γονιδιωματική βιβλιοθήκη δημιουργείται με την απομόνωση του DNA από κύτταρα και στη συνέχεια με την ενίσχυση του χρησιμοποιώντας την τεχνολογία κλωνοποίησης του DNA". Η δημιουργία της βιβλιοθήκης για την αλληλούχιση ενός "ιικού" γονιδιώματος περιλαμβάνει πολλαπλά βήματα, το καθένα με τους δικούς του περιορισμούς και μειονεκτήματα. Από την εξαγωγή, τον κατακερματισμό και στη συνέχεια τη μετατροπή του RNA σε cDNA, κρίσιμα ζητήματα όπως η μόλυνση καθώς και η εισαγωγή μεροληψιών και τεχνουργημάτων μπορούν να παρεισφρήσουν ανά πάσα στιγμή και να απειλήσουν να εκτροχιάσουν ολόκληρη τη διαδικασία αλληλούχησης. Οποιοδήποτε από τα εισαγόμενα σφάλματα μπορεί να επιδεινωθεί και να περάσει στο τελικό προϊόν. Αυτό οδηγεί σε προβλήματα με ψευδή, λανθασμένα και μη αναπαραγώγιμα αποτελέσματα. Ενώ έχω εξετάσει κάθε ένα από αυτά τα βήματα ξεχωριστά (οι σύνδεσμοι παραπάνω), οι πηγές που παρουσιάζονται παρακάτω εξετάζουν την προετοιμασία της βιβλιοθήκης στο σύνολό της και δίνουν περαιτέρω σάρκα και οστά στις αναπόφευκτες προκλήσεις που εισάγονται κατά τη δημιουργία μιας γονιδιωματικής βιβλιοθήκης.
Πρώτα γίνεται μια ανασκόπηση των στρατηγικών αυτοματοποίησης για την προετοιμασία βιβλιοθήκης.Οι ερευνητές παραδέχονται ότι η ίδια η διαδικασία είναι πολύπλοκη και δυσκίνητη και έχει γίνει κάτι σαν τροχοπέδη, πράγμα που σημαίνει ότι ανακόπτει την πρόοδο. Προκειμένου να είναι δυνατή η λήψη αναπαραγώγιμων αποτελεσμάτων, πρέπει να δοθεί έμφαση στην τυποποίηση της διαδικασίας, καθώς σε κάθε στάδιο της ροής εργασίας εμφανίζονται προκλήσεις. Η επιμόλυνση αποτελεί εγγενές πρόβλημα και μπορεί να μεταφερθεί κατά τη διάρκεια διαδοχικών τρεξίματος αλληλούχισης, οδηγώντας σε σημαντικά σφάλματα. Οι λύσεις για τα προβλήματα που παρουσιάζονται κατά την προετοιμασία της βιβλιοθήκης βρίσκονται ακόμη υπό ανάπτυξη, πράγμα που σημαίνει ότι πρόκειται για ένα πρόβλημα που δεν έχει διορθωθεί και δεν φαίνεται να εξαφανίζεται σύντομα:
Προετοιμασία βιβλιοθήκης για την αλληλούχιση επόμενης γενιάς: Ανασκόπηση των στρατηγικών αυτοματοποίησης
"Τα πρόσφατα εισαχθέντα όργανα υψηλής απόδοσης και τα όργανα πάγκου προσφέρουν πλήρως αυτοματοποιημένες σειρές αλληλούχισης με χαμηλότερο κόστος ανά βάση και ταχύτερους χρόνους ανάλυσης. Με τη σειρά της, η πολύπλοκη και δυσκίνητη προετοιμασία της βιβλιοθήκης, η οποία ξεκινά με απομονωμένα νουκλεϊκά οξέα και καταλήγει σε ενισχυμένο και γραμμωτό DNA με προσαρμογείς αλληλούχισης, έχει αναγνωριστεί ως σημαντικό σημείο συμφόρησης. Τα πρωτόκολλα προετοιμασίας βιβλιοθήκης αποτελούνται συνήθως από μια διαδικασία πολλών βημάτων και απαιτούν δαπανηρά αντιδραστήρια και σημαντικό χρόνο εργασίας. Θα πρέπει να δοθεί σημαντική έμφαση στην τυποποίηση για να διασφαλιστεί η ευρωστία και η αναπαραγωγιμότητα".
"Το NGS μπορεί να χωριστεί χονδρικά στα στοιχεία της διαδικασίας της προεπεξεργασίας του δείγματος, της προετοιμασίας της βιβλιοθήκης, της ίδιας της αλληλούχισης και της βιοπληροφορικής (Σχήμα 1). Ανεξάρτητα από τις βασικές αρχές της εκάστοτε μεθόδου αλληλούχισης, όλες οι σύγχρονες τεχνολογίες αλληλούχισης απαιτούν ειδική προετοιμασία του δείγματος για την παραγωγή της βιβλιοθήκης αλληλούχισης που φορτώνεται στο όργανο (Goodwin et al., 2016- Metzker, 2010). Οι βιβλιοθήκες αλληλούχισης αποτελούνται από θραύσματα DNA καθορισμένης κατανομής μήκους με ολιγομερείς προσαρμογείς στο 5′ και 3′ άκρο για τη γραμμωτή κωδικοποίηση, καθώς και την πραγματική διαδικασία αλληλούχισης. Μετά την αλληλούχιση, τα παραγόμενα δεδομένα αναλύονται με τη χρήση βιοπληροφορικής.
Η αξιόπιστη και τυποποιημένη εφαρμογή και τα μέτρα ελέγχου ποιότητας για όλα τα στάδια της διαδικασίας είναι ζωτικής σημασίας στην εργαστηριακή πρακτική ρουτίνας (Endrullat et al., 2016- Gargis et al., 2012). Σε κάθε ένα από τα προαναφερθέντα στάδια της ροής εργασίας αντιμετωπίζονται προκλήσεις, οι οποίες πρέπει να αντιμετωπιστούν προκειμένου να διασφαλιστούν υψηλής ποιότητας αποτελέσματα αλληλούχισης. Για παράδειγμα, η εκχύλιση επαρκούς ποσότητας DNA από το δείγμα εισόδου χωρίς την εκχύλιση ενοχλητικών αναστολέων μπορεί να ποικίλλει σε πολυπλοκότητα ανάλογα με το υλικό του δείγματος(Chiu, 2013- Trombetta et al., 2014). Κατά τη διάρκεια των τρεξίματος αλληλούχισης, η μόλυνση από μεταφορά μπορεί να οδηγήσει σε σημαντικά σφάλματα (Kircher et al., 2012- Kotrova et al., 2017- Nelson et al., 2014). Για τη βιοπληροφορική, ο χειρισμός των εξαιρετικά μεγάλων όγκων δεδομένων που παράγονται από τα NGS υψηλής απόδοσης απαιτεί σημαντικούς πόρους πληροφορικής και οι ολοκληρωμένες λύσεις ανάλυσης βρίσκονται ακόμη υπό ανάπτυξη (Korneliussen et al., 2014- Naccache et al., 2014- Scholz et al., 2012).
Κατά την προετοιμασία της βιβλιοθήκης παρατηρούνται τρεις μεγάλες προκλήσεις: πολυπλοκότητα των πρωτοκόλλων, μόλυνση και κόστος.
Η ροή εργασίας Illumina TruSeq Nano(Illumina, 2019), για παράδειγμα, απαιτεί δέκα βήματα για την προσάρτηση προσαρμογέων και γραμμωτών κωδικών στα νουκλεοτίδια. Ειδικότερα, τα βήματα καθαρισμού με βάση τα σφαιρίδια, τα οποία συνεπάγονται τον χειρισμό μαγνητών και μαγνητικών σωματιδίων από τον χρήστη, είναι επιρρεπή σε σφάλματα και μπορεί να οδηγήσουν σε αποτυχία της προετοιμασίας της βιβλιοθήκης (Meyer and Kircher, 2010).
Η επιμόλυνση των δειγμάτων αποτελεί εγγενές πρόβλημα, καθώς οι βιβλιοθήκες προετοιμάζονται συνήθως παράλληλα(Kotrova et al., 2017- Salter et al., 2014). Οι κύριες πηγές επιμόλυνσης είναι οι προ-δειγματοληψίες που απαιτούνται για χαμηλές αρχικές συγκεντρώσεις νουκλεϊκών οξέων (Kotrova et al., 2017)".
https://www.sciencedirect.com/science/article/pii/S0734975020300343
Αυτή η επόμενη πηγή παρέχει περισσότερες λεπτομέρειες σχετικά με το ζήτημα της μεροληψίας που εισάγεται κατά την προετοιμασία της βιβλιοθήκης. Η μεροληψία αναφέρεται σε οποιονδήποτε από τους παράγοντες που σχετίζονται με τον πειραματικό σχεδιασμό και μπορούν να προκαλέσουν στρέβλωση στις γενετικές προβλέψεις. Ο στόχος κατά την προετοιμασία της βιβλιοθήκης είναι να δημιουργηθεί όσο το δυνατόν λιγότερη μεροληψία, καθώς είναι εντελώς αναπόφευκτη και στην καλύτερη περίπτωση μπορεί μόνο να μετριαστεί. Πολλά από τα ζητήματα μεροληψίας μπορούν να συνδεθούν άμεσα με τη διαδικασία ενίσχυσης, η οποία απαιτεί τη χρήση PCR για τη δημιουργία περισσότερου υλικού για την αλληλούχιση. Συνεπώς, είναι απαραίτητο να κατασκευάζεται μια βιβλιοθήκη με τέτοιο τρόπο ώστε να αυξάνεται η πολυπλοκότητα (η ποσότητα των μοναδικών τμημάτων DNA) και να περιορίζεται η ενίσχυση με PCR, η οποία μειώνει την πολυπλοκότητα αυξάνοντας την ποσότητα του διπλού υλικού:
Κατασκευή βιβλιοθήκης για την αλληλούχιση επόμενης γενιάς: Βιβλιοθήκη: Επισκοπήσεις και προκλήσεις
Εκτιμήσεις για την προετοιμασία βιβλιοθήκης NGS: πολυπλοκότητα, μεροληψία και επιδράσεις παρτίδας
"Ο κύριος στόχος κατά την προετοιμασία μιας βιβλιοθήκης αλληλούχισης είναι να δημιουργηθεί όσο το δυνατόν λιγότερη μεροληψία. Η μεροληψία μπορεί να οριστεί ως η συστηματική παραμόρφωση των δεδομένων λόγω του πειραματικού σχεδιασμού. Δεδομένου ότι είναι αδύνατο να εξαλειφθούν όλες οι πηγές πειραματικής μεροληψίας, οι καλύτερες στρατηγικές είναι οι εξής: (i) να γνωρίζετε πού εμφανίζεται η μεροληψία και να λαμβάνετε όλα τα πρακτικά μέτρα για την ελαχιστοποίησή της καιii) να δίνετε προσοχή στον πειραματικό σχεδιασμό ώστε οι πηγές μεροληψίας που δεν μπορούν να εξαλειφθούν να έχουν ελάχιστο αντίκτυπο στην τελική ανάλυση.
Η πολυπλοκότητα μιας βιβλιοθήκης NGS μπορεί να αντικατοπτρίζει το μέγεθος της μεροληψίας που δημιουργείται από έναν δεδομένο πειραματικό σχεδιασμό. Όσον αφορά την πολυπλοκότητα της βιβλιοθήκης, το ιδανικό είναι μια εξαιρετικά πολύπλοκη βιβλιοθήκη που αντικατοπτρίζει με μεγάλη πιστότητα την αρχική πολυπλοκότητα του αρχικού υλικού. Η τεχνολογική πρόκληση είναι ότι οποιαδήποτε ποσότητα ενίσχυσης μπορεί να μειώσει αυτή την πιστότητα. Η πολυπλοκότητα της βιβλιοθήκης μπορεί να μετρηθεί με τον αριθμό ή το ποσοστό των διπλών αναγνώσεων που υπάρχουν στα δεδομένα αλληλούχισης (39). Οι διπλές αναγνώσεις ορίζονται γενικά ως αναγνώσεις που είναι ακριβώς ίδιες ή έχουν ακριβώς τις ίδιες θέσεις εκκίνησης όταν ευθυγραμμίζονται με μια αλληλουχία αναφοράς (40). Μια επιφύλαξη είναι ότι η συχνότητα των διπλών αναγνώσεων που εμφανίζονται τυχαία (και αντιπροσωπεύουν πραγματικά ανεξάρτητη δειγματοληψία από την αρχική πηγή δείγματος) αυξάνεται με την αύξηση του βάθους αλληλούχισης. Συνεπώς, είναι σημαντικό να κατανοήσουμε υπό ποιες συνθήκες τα ποσοστά διπλών αναγνώσεων αποτελούν ακριβές μέτρο της πολυπλοκότητας της βιβλιοθήκης.
Η χρήση των ποσοστών διπλών αναγνώσεων ως μέτρο της πολυπλοκότητας της βιβλιοθήκης λειτουργεί καλά όταν γίνεται αλληλούχιση γονιδιωματικού DNA, επειδή οι αλληλουχίες νουκλεϊκών οξέων στην αρχική δεξαμενή είναι περίπου σε ισομοριακές αναλογίες. Ωστόσο, η RNA-seq είναι σημαντικά πιο πολύπλοκη, επειδή εξ ορισμού η αρχική δεξαμενή αλληλουχιών αντιπροσωπεύει ένα σύνθετο μείγμα διαφορετικού αριθμού μεταγράφων mRNA που αντανακλά τη βιολογία της διαφορικής έκφρασης. Στην περίπτωση του ChIP-seq η πολυπλοκότητα δημιουργείται τόσο από τη διαφορετική συγγένεια των πρωτεϊνών-στόχων για συγκεκριμένες αλληλουχίες DNA (δηλ. υψηλή έναντι χαμηλής). Αυτές οι βιολογικά σημαντικές διαφορές σημαίνουν ότι ο αριθμός των αλληλουχιών που καταλήγουν στην τελική δεξαμενή δεν είναι ισοδύναμος.
Ωστόσο, το νόημα είναι το ίδιο - ο στόχος κατά την προετοιμασία μιας βιβλιοθήκης είναι να προετοιμαστεί με τέτοιο τρόπο ώστε να μεγιστοποιηθεί η πολυπλοκότητα και να ελαχιστοποιηθεί η κλωνική μεροληψία που βασίζεται στην PCR ή σε άλλους ενισχυτές. Αυτό αποτελεί σημαντική πρόκληση για βιβλιοθήκες με χαμηλή είσοδο, όπως σε πολλά πειράματα ChIP-seq ή σε δείγματα RNA/DNA που προέρχονται από περιορισμένο αριθμό κυττάρων. Είναι πλέον τεχνολογικά δυνατή η εκτέλεση αλληλούχισης γονιδιωματικού DNA και RNA από μεμονωμένα κύτταρα. Το βασικό σημείο είναι ότι το επίπεδο της εκτεταμένης ενίσχυσης που απαιτείται δημιουργεί μεροληψία με τη μορφή προτιμησιακής ενίσχυσης διαφορετικών αλληλουχιών, και αυτή η μεροληψία παραμένει ένα σοβαρό ζήτημα στην ανάλυση των δεδομένων που προκύπτουν. Μια προσέγγιση για την αντιμετώπιση της πρόκλησης είναι μια μέθοδος ψηφιακής αλληλούχισης που χρησιμοποιεί πολλαπλούς συνδυασμούς ευρετηριασμένων προσαρμογέων για να επιτρέπει τη διαφοροποίηση των βιολογικών και των παραγόμενων με PCR διπλών αναγνώσεων σε εφαρμογές RNA-seq (41,42).. Μια έκδοση αυτής της μεθόδου είναι πλέον εμπορικά διαθέσιμη ως κιτ από την Bioo Scientific (Austin, TX).
Κατά την προετοιμασία βιβλιοθηκών για την αλληλούχιση NGS, είναι επίσης κρίσιμο να λαμβάνεται υπόψη ο μετριασμός των επιδράσεων παρτίδας(43-45). Είναι επίσης σημαντικό να αναγνωριστεί ο αντίκτυπος της συστηματικής μεροληψίας που προκύπτει από τους μοριακούς χειρισμούς που απαιτούνται για τη δημιουργία δεδομένων NGS- για παράδειγμα, η μεροληψία που εισάγεται από τις εξαρτώμενες από την αλληλουχία διαφορές στην αποτελεσματικότητα σύνδεσης προσαρμογέων στις προετοιμασίες βιβλιοθηκών miRNA-seq. Οι επιδράσεις παρτίδας μπορεί να προκύψουν από τη μεταβλητότητα στην καθημερινή επεξεργασία των δειγμάτων, όπως οι συνθήκες αντίδρασης, οι παρτίδες αντιδραστηρίων, η ακρίβεια της πιπετοποίησης, ακόμη και οι διαφορετικοί τεχνικοί. Επιπλέον, μπορεί να παρατηρηθούν επιδράσεις παρτίδας μεταξύ τμημάτων αλληλούχισης και μεταξύ διαφορετικών λωρίδων σε ένα κύτταρο ροής της Illumina. Ο μετριασμός των επιδράσεων παρτίδας μπορεί να είναι αρκετά απλός ή αρκετά περίπλοκος. Όταν υπάρχει αμφιβολία, η συμβουλή ενός στατιστικολόγου κατά τη διαδικασία πειραματικού σχεδιασμού μπορεί να εξοικονομήσει ένα τεράστιο ποσό χαμένου χρήματος και χρόνου".
"Ένα πρόβλημα που σχετίζεται με την αλληλούχιση αμπλικονίων είναι η παρουσία χιμαιρικών αμπλικονίων που δημιουργούνται κατά τη διάρκεια της PCR από ανασυνδυασμό με τη μεσολάβηση της PCR (61). Το πρόβλημα αυτό επιδεινώνεται σε βιβλιοθήκες χαμηλής πολυπλοκότητας και από την υπεραποτύπωση. Μια πρόσφατη μελέτη εντόπισε ότι έως και το 8% των ακατέργαστων αναγνώσεων αλληλουχίας είναι χιμαιρικά (62). Ωστόσο, οι συγγραφείς κατάφεραν να μειώσουν το ποσοστό των χιμαιρών στο 1% με ποιοτικό φιλτράρισμα των αναγνώσεων και εφαρμογή του βιοπληροφορικού εργαλείου Uchime (63). Η παρουσία των αλληλουχιών εκκινητών PCR ή άλλων εξαιρετικά συντηρημένων αλληλουχιών αποτελεί τεχνικό περιορισμό σε ορισμένες πλατφόρμες αλληλούχισης που χρησιμοποιούν ανίχνευση φθορισμού (π.χ. Illumina). Αυτό μπορεί να συμβεί με την αλληλούχιση που βασίζεται σε αμπλικόνια, όπως οι μελέτες μικροβιώματος που χρησιμοποιούν 16S rRNA για την ταυτοποίηση ειδών. Σε αυτή την περίπτωση, οι αλληλουχίες εκκινητών PCR στην αρχή της ανάγνωσης θα παράγουν την ίδια ακριβώς βάση με κάθε κύκλο αλληλούχισης, δημιουργώντας προβλήματα για το υλικό και το λογισμικό ανίχνευσης σήματος".
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4351865/
Αυτή η τρίτη πηγή ασχολείται με το πρόβλημα των επιδράσεων της παρτίδας κατά την προετοιμασία της βιβλιοθήκης, καθώς πρόκειται για ένα κρίσιμο ζήτημα που συχνά παραβλέπεται. Σύμφωνα με τη Wikipedia (το ξέρω... δυστυχώς ο καλύτερος διαθέσιμος ορισμός), "στη μοριακή βιολογία, ένα φαινόμενο παρτίδας εμφανίζεται όταν μη βιολογικοί παράγοντες σε ένα πείραμα προκαλούν αλλαγές στα δεδομένα που παράγονται από το πείραμα. Τέτοιες επιδράσεις μπορούν να οδηγήσουν σε ανακριβή συμπεράσματα όταν τα αίτιά τους συσχετίζονται με ένα ή περισσότερα αποτελέσματα ενδιαφέροντος σε ένα πείραμα". Παρότι πρόκειται για ένα γνωστό πρόβλημα, δεν είναι καλά κατανοητό και δεν υπάρχουν ακόμη αλγόριθμοι για τον εντοπισμό αυτών των φαινομένων ούτε τυποποιημένες κατευθυντήριες γραμμές για τη διόρθωσή τους. Οι επιδράσεις παρτίδας μπορούν να εισαχθούν με πολλούς τρόπους κατά τη διάρκεια των διαφόρων βημάτων που εμπλέκονται στην προετοιμασία της βιβλιοθήκης και χωρίς επιτυχημένες και επικυρωμένες μεθόδους για την εύρεση και τη διόρθωση αυτών των επιδράσεων, αυτό καθιστά τα παραγόμενα δεδομένα εντελώς αναξιόπιστα:
Εντοπισμός και μετριασμός των επιδράσεων παρτίδας σε δεδομένα αλληλούχισης ολόκληρου γονιδιώματος
Περίληψη
Ιστορικό
"Παράγονται μεγάλα σύνολα δειγμάτων αλληλούχισης ολόκληρου γονιδιώματος με βαθιά κάλυψη, ωστόσο η συναρμολόγηση συνόλων δεδομένων από διαφορετικές πηγές εισάγει αναπόφευκτα φαινόμενα παρτίδας. Αυτές οι επιδράσεις παρτίδας δεν είναι καλά κατανοητές και μπορεί να οφείλονται σε αλλαγές στο πρωτόκολλο αλληλούχισης ή στα εργαλεία βιοπληροφορικής που χρησιμοποιούνται για την επεξεργασία των δεδομένων. Δεν υπάρχουν συστηματικοί αλγόριθμοι ή ευρετικές μέθοδοι για την ανίχνευση και το φιλτράρισμα των batch effects ή την αφαίρεση των συσχετίσεων που επηρεάζονται από batch effects σε δεδομένα αλληλούχισης ολόκληρου γονιδιώματος".
Συμπεράσματα
"Οι ερευνητές δεν διαθέτουν επί του παρόντος αποτελεσματικά εργαλεία για τον εντοπισμό και τον μετριασμό των φαινομένων παρτίδας σε δεδομένα αλληλούχισης ολόκληρου γονιδιώματος. Αναπτύξαμε και επικυρώσαμε μεθόδους και φίλτρα για την αντιμετώπιση αυτής της έλλειψης".
"Οι πρόσφατες μειώσεις στο κόστος της αλληλούχισης ολόκληρου γονιδιώματος[1] (WGS) άνοιξαν το δρόμο για έργα αλληλούχισης μεγάλης κλίμακας[2]. Η ταχεία εξέλιξη της τεχνολογίας WGS χαρακτηρίστηκε από αλλαγές στις μεθόδους προετοιμασίας βιβλιοθηκών, στη χημεία αλληλούχισης, στις κυψέλες ροής και στα εργαλεία βιοπληροφορικής για την ευθυγράμμιση αναγνώσεων και την κλήση παραλλαγών. Αναπόφευκτα, οι αλλαγές στην τεχνολογία WGS είχαν ως αποτέλεσμα μεγάλες διαφορές μεταξύ των δειγμάτων και την πιθανότητα επιδράσεων παρτίδας [3, 4]".
"Οι επιδράσεις παρτίδας στις WGS έρχονται με την πρόσθετη πολυπλοκότητα της διερεύνησης δύσκολα χαρακτηριζόμενων περιοχών του γονιδιώματος και οι κοινές προσεγγίσεις, όπως το βήμα Variant Quality Score Recalibration (VQSR) στο GATK[14] και η επεξεργασία δειγμάτων από κοινού με τη χρήση του αγωγού GATK HaplotypeCaller αποτυγχάνουν να απομακρύνουν όλες τις επιδράσεις παρτίδας. Οι παράγοντες που οδηγούν σε φαινόμενα παρτίδας δεν είναι επαρκώς κατανοητοί και μπορεί να προέρχονται από πολλαπλές πηγές, γεγονός που καθιστά δύσκολη την ανάπτυξη συστηματικών αλγορίθμων για τον εντοπισμό και την αφαίρεση των φαινομένων παρτίδας".
"Εκτός από την αφαίρεση των ανεπιβεβαίωτων και πιθανώς ψευδών συσχετίσεων που προκαλούνται από batch effects, οι ερευνητές πρέπει επίσης να προσδιορίσουν ότι υπάρχει φαινόμενο batch effect. Ο προσδιορισμός μιας μεθόδου για την ανίχνευση των επιδράσεων της παρτίδας που έχουν αντίκτυπο στις αναλύσεις συσχέτισης που ακολουθούν είναι ζωτικής σημασίας, καθώς οι ερευνητές πρέπει να γνωρίζουν εκ των προτέρων αν τα σύνολα δεδομένων WGS μπορούν να συνδυαστούν ή αν οι αλλαγές στη χημεία της αλληλούχισης θα οδηγήσουν σε αλληλουχίες που δεν μπορούν πλέον να αναλυθούν μαζί".
"Οι μεγάλης κλίμακας προσπάθειες WGS ευδοκιμούν, ωστόσο υπάρχουν λίγες κατευθυντήριες γραμμές για τον προσδιορισμό του κατά πόσον ένα σύνολο δεδομένων έχει batch effects και, αν ναι, ποιες μέθοδοι θα μειώσουν τον αντίκτυπό τους. Αντιμετωπίζουμε και τις δύο αυτές ελλείψεις και παρουσιάζουμε ένα νέο λογισμικό (πακέτο R, genotypeeval, βλ. Μέθοδοι για πρόσθετες λεπτομέρειες και διαδικτυακό σύνδεσμο) που μπορεί να βοηθήσει στον εντοπισμό των επιδράσεων παρτίδας."
Μετριασμός των επιδράσεων παρτίδας μέσω φιλτραρίσματος
"Μελέτες συσχέτισης μεγάλης κλίμακας σε επίπεδο γονιδιώματος που χρησιμοποιούν δεδομένα βασισμένα σε συστοιχίες SNP συχνά συνδυάζουν περιπτώσεις και ελέγχους που λαμβάνονται από διαφορετικές πηγές[39,40,41] και η πρακτική αυτή συνεχίζεται με δεδομένα βασισμένα σε WGS[19, 20]. Ο αυστηρός έλεγχος ποιότητας των δεδομένων που βασίζονται σε συστοιχίες SNP μείωσε τις επιδράσεις παρτίδας σε αυτό το περιβάλλον. Η ευαισθησία της τεχνολογίας WGS σε διαφορές στην προετοιμασία της βιβλιοθήκης, στη χημεία αλληλούχισης κ.λπ. την καθιστά σημαντικά ευάλωτη σε επιδράσεις παρτίδας, ωστόσο δεν έχει καθιερωθεί κανένα πρότυπο σύνολο κατευθυντήριων γραμμών για το QC της WGS".
Συζήτηση
"Ενώ το κόστος αλληλούχισης μειώνεται, απαιτούνται πολλές χιλιάδες δείγματα για να υπάρχει επαρκής ισχύς για τον εντοπισμό νέων παραλλαγών που σχετίζονται με κοινές σύνθετες ασθένειες [45]. Προκειμένου να συλλεχθούν αρκετά κρούσματα για ασθένειες, πολλές ομάδες συχνά συνεργάζονται, συνεισφέροντας δείγματα σε μια κοινοπραξία. Προκειμένου να αναλυθούν αυτές οι περιπτώσεις, είναι επιθυμητός ένας ακόμη μεγαλύτερος αριθμός ελέγχων[46] Έτσι, η ανάγκη συνδυασμού δειγμάτων που έχουν υποστεί ανεξάρτητη επεξεργασία είναι σαφής, όπως και η αναπόφευκτη εισαγωγή επιδράσεων παρτίδας." Αυτές οι επιδράσεις παρτίδας είναι λεπτές και το απλό φιλτράρισμα π.χ. η αφαίρεση παραλλαγών σε "δύσκολες περιοχές" είναι αναποτελεσματικό. Διαπιστώσαμε ότι οι αλλαγές στη χημεία αλληλούχισης που σχετίζονται με τις ροές εργασίας PCR έναντι των ροών εργασίας χωρίς PCR συνέβαλαν σε μεγάλο βαθμό στις ανιχνεύσιμες επιδράσεις παρτίδας τόσο στο Batch GWAS όσο και στο RA Batch GWAS".
"Οι επιδράσεις παρτίδας στα δεδομένα WGS δεν είναι καλά κατανοητές και, ίσως εξαιτίας αυτού, δεν μπορέσαμε να βρούμε μια υπάρχουσα μέθοδο ή να αναπτύξουμε μια νέα μέθοδο που να αφαιρεί όλες τις περιοχές που επηρεάζονται από τις επιδράσεις παρτίδας χωρίς να επηρεάζει την ισχύ για την ανίχνευση πραγματικών συσχετίσεων. Ενώ επικεντρωθήκαμε στη δημιουργία στοχευμένων φίλτρων που αφαιρούσαν ένα μικρό ποσοστό του γονιδιώματος, στην πράξη αυτά πρέπει να χρησιμοποιούνται σε συνδυασμό με τα συνήθη μέτρα ελέγχου ποιότητας (για παράδειγμα την αφαίρεση των θέσεων εκτός ισορροπίας Hardy-Weinberg), τα οποία μπορεί να οδηγήσουν σε πολύ αυστηρό φιλτράρισμα. Σε περίπτωση σοβαρής επίδρασης παρτίδας, όπως η αλλαγή χημείας που υπάρχει στο RA Batch GWAS, ήταν απαραίτητο αυστηρότερο φιλτράρισμα ακόμη και μετά την εφαρμογή του τυπικού ποιοτικού ελέγχου και των προτεινόμενων φίλτρων μας, καθώς σχεδόν 40.000 UGAs παρέμειναν μετά το φιλτράρισμα. Προκειμένου να αντιμετωπιστούν πλήρως οι επιδράσεις παρτίδας, θα χρειαστεί να διαχωριστεί η επίδραση των αλλαγών στη χημεία αλληλούχισης και στη βιοπληροφορική επεξεργασία στην ανάλυση συσχετίσεων.
"Οι επιδράσεις παρτίδας θα προκύψουν καθώς ανεξάρτητες ομάδες προσπαθούν να συνδυάσουν δεδομένα αλληλούχισης που παράγονται και υποβάλλονται σε επεξεργασία από διαφορετικές πηγές - αυτή η συνεργασία είναι απαραίτητη ιδίως για την επίτευξη ισχύος για την ανίχνευση νέων παραλλαγών που σχετίζονται με ασθένειες. Πόροι μεγάλης κλίμακας δαπανώνται από ερευνητικούς, βιομηχανικούς και κυβερνητικούς οργανισμούς για τη δημιουργία βάσεων δεδομένων που δεν μπορούν εύκολα να συγχωνευθούν".
https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-017-1756-z
Η τέταρτη και τελευταία πηγή εμβαθύνει και πάλι στα ζητήματα που σχετίζονται με τη μεροληψία που εισάγεται κατά την προετοιμασία της βιβλιοθήκης. Παρέχει μια γενική επισκόπηση των τρόπων με τους οποίους η μεροληψία μπορεί να εισέλθει σε κάθε ένα από τα βήματα που εμπλέκονται στη δημιουργία της γονιδιωματικής βιβλιοθήκης. Το άρθρο επικεντρώνεται σε μεγάλο βαθμό στην ενίσχυση με PCR, καθώς θεωρείται η κύρια πηγή μεροληψίας και παρόλο που υπάρχουν μέθοδοι που αποσκοπούν στην εξάλειψη της PCR, έχουν τα δικά τους σύνολα περιορισμών, τεχνουργημάτων και μεροληψιών. Λέγεται ότι τα περισσότερα πρωτόκολλα εισάγουν σοβαρές αποκλίσεις οι οποίες διαδίδονται σε περαιτέρω κύκλους με αποτέλεσμα λανθασμένες ερμηνείες. Οι συγγραφείς αναφέρουν ότι όλες οι μελέτες αλληλούχισης περιορίζονται από την ακρίβεια των πειραμάτων αλληλούχισης, τα οποία υπόκεινται σε σφάλματα και μεροληψίες που εισάγονται κατά την προετοιμασία. Οι ερευνητές αναλύουν τις πηγές της μεροληψίας καθ' όλη τη διαδικασία και τελικά καταλήγουν στο συμπέρασμα ότι πρόκειται για ένα πρόβλημα που μπορεί μόνο να μετριαστεί, καθώς η μεροληψία δεν μπορεί να εξαλειφθεί:
Mεροληψία κατά την προετοιμασία βιβλιοθήκης RNA-seq : Τρέχουσες προκλήσεις και λύσεις
"Σε γενικές γραμμές, η αντιπροσωπευτική ροή εργασίας της ανάλυσης RNA-seq περιλαμβάνει την εξαγωγή και τον καθαρισμό του RNA από κύτταρο ή ιστό, την προετοιμασία της βιβλιοθήκης αλληλούχισης, συμπεριλαμβανομένης της κατακερματισμού, της γραμμικής ενίσχυσης ή της ενίσχυσης με PCR, την αλληλούχιση RNA και την επεξεργασία και ανάλυση των δεδομένων αλληλούχισης (Εικόνα 1). Οι ευρέως χρησιμοποιούμενες πλατφόρμες NGS, συμπεριλαμβανομένων των Illumina και Pacific Biosciences, χρειάζονται ενίσχυση με PCR κατά τη διάρκεια της κατασκευής βιβλιοθήκης για να αυξηθεί ο αριθμός των μορίων cDNA ώστε να καλυφθούν οι ανάγκες της αλληλούχισης. Παρ' όλα αυτά, το πιο προβληματικό βήμα στις διαδικασίες προετοιμασίας δειγμάτων είναι η ενίσχυση. Αυτό οφείλεται στο γεγονός ότι η ενίσχυση με PCR εισάγει στοχαστικά μεροληψίες, οι οποίες μπορούν να μεταδοθούν σε μεταγενέστερους κύκλους [2]. Επιπλέον, η PCR ενισχύει επίσης διαφορετικά μόρια με άνισες πιθανότητες, οδηγώντας στην άνιση ενίσχυση των μορίων cDNA [3, 4]. Πρόσφατα, οι ερευνητές πρότειναν διάφορες διαφορετικές μεθόδους προκειμένου να μειώσουν την ενίσχυση με PCR, όπως πρωτόκολλα χωρίς PCR και ισοθερμική ενίσχυση. Ωστόσο, οι μέθοδοι αυτές δεν είναι τέλειες και εξακολουθούν να παρουσιάζουν ορισμένα τεχνουργήματα και μεροληψίες της αλληλούχισης. Κατά συνέπεια, η κατανόηση αυτών των μεροληψιών είναι ζωτικής σημασίας για την απόκτηση αξιόπιστων δεδομένων και θα παράσχει ορισμένες χρήσιμες συμβουλές στον ερευνητή".
2. Διατήρηση και απομόνωση δειγμάτων
"Παρά το γεγονός ότι πολλές μελέτες έχουν δείξει ότι η RNA-seq έχει πολλά πλεονεκτήματα, εξακολουθεί να είναι μια ταχέως αναπτυσσόμενη βιοτεχνολογία και να αντιμετωπίζει αρκετές προκλήσεις. Μεταξύ αυτών, μια πτυχή που συχνά παραβλέπεται είναι η διαδικασία προετοιμασίας του δείγματος, η οποία μπορεί επίσης να επιφέρει πιθανές παραλλαγές και αποκλίσεις στο πείραμα RNA-seq, συμπεριλαμβανομένης της απομόνωσης RNA, της επεξεργασίας του δείγματος, του χρόνου αποθήκευσης της βιβλιοθήκης, του επιπέδου εισόδου RNA (όπως η διαφορά στον αριθμό του RNA εκκίνησης) και της κρυοσυντήρησης του δείγματος (όπως η νωπή ή η κατεψυγμένη συντήρηση)".
2.2. Η απομόνωση και η εκχύλιση του RNA
"Ο υψηλής ποιότητας καθαρισμός του RNA είναι η προϋπόθεση του RNA-seq. Ωστόσο, λόγω της ευρείας ύπαρξης ενζύμων αποικοδόμησης του RNA (RNάσες) [10-12], η επιτυχής απομόνωση RNA υψηλής ποιότητας παραμένει πρόκληση. Επί του παρόντος, η μέθοδος εκχύλισης RNA μπορεί να χωριστεί σε δύο τύπους, συμπεριλαμβανομένης της TRIzol (εκχύλιση με φαινόλη: χλωροφόρμιο) και της Qiagen (διαδικασίες στήλης με βάση το silica-gel). Αυτές οι μέθοδοι αναπτύχθηκαν κυρίως για την εκχύλιση μακρών mRNA και έχουν βασιστεί στην υπόθεση ότι όλα τα RNA καθαρίζονται εξίσου, όταν αυτές οι μέθοδοι εφαρμόζονται σε μη κωδικοποιημένα RNA, γεγονός που μπορεί να έχει ως αποτέλεσμα την υποβάθμιση του RNA [13]".
Κατασκευή βιβλιοθήκης
"Μετά την απομόνωση και την εξαγωγή RNA, το επόμενο βήμα είναι η κατασκευή βιβλιοθήκης για την αλληλούχιση του μεταγραφώματος. Η κατασκευή βιβλιοθήκης αρχίζει συνήθως με την απομάκρυνση του ριβοσωμικού RNA (rRNA) ή τον εμπλουτισμό του mRNA, επειδή το μεγαλύτερο μέρος του συνολικού RNA των κυττάρων ή των ιστών είναι rRNA. Για το ευκαρυωτικό μεταγράφημα, τα πολυαδενυλιωμένα mRNA συνήθως εξάγονται με σφαιρίδια oligo-dT ή τα rRNA εξαντλούνται επιλεκτικά. Απίθανο, τα mRNA των προκαρυωτών δεν είναι σταθερά πολυαδενυλιωμένα. Ως εκ τούτου, ο εμπλουτισμός αγγελιοφόρων με τη μεσολάβηση ολιγο-d(T)-σφαιριδίων δεν είναι κατάλληλος- υπάρχει μόνο η δεύτερη επιλογή. Στη συνέχεια, το RNA κατακερματίζεται συνήθως σε ένα ορισμένο εύρος μεγέθους με φυσική ή χημική μέθοδο. Τα επακόλουθα βήματα διαφέρουν ανάλογα με τον πειραματικό σχεδιασμό και τις πλατφόρμες NGS. Ωστόσο, μελέτες έδειξαν ότι τα περισσότερα από τα πρωτόκολλα που χρησιμοποιούνται σήμερα για την κατασκευή βιβλιοθηκών μπορεί να εισάγουν σοβαρές αποκλίσεις. Για παράδειγμα, ο κατακερματισμός του RNA μπορεί να εισάγει μεροληψίες μήκους ή σφάλματα, τα οποία στη συνέχεια μεταδίδονται σε μεταγενέστερους κύκλους. Επιπλέον, η ενίσχυση της βιβλιοθήκης μπορεί επίσης να επηρεαστεί από μεροληψία εκκινητών, όπως μεροληψία εκκινητών στην ενίσχυση πολλαπλών μετατοπίσεων (MDA) [15], αναντιστοιχία εκκινητών στην ενίσχυση PCR [16, 17]. Κατά συνέπεια, μπορεί να εισαγάγει μη γραμμικά αποτελέσματα και αναπόφευκτα να θέσει σε κίνδυνο την ποιότητα του συνόλου δεδομένων RNA-seq, οδηγώντας στο αποτέλεσμα λανθασμένης ερμηνείας. Κατά συνέπεια, στην επόμενη ενότητα θα περιγράψουμε και θα συνοψίσουμε τις πηγές μεροληψίας κατά την προετοιμασία της βιβλιοθήκης, συμπεριλαμβανομένου του εμπλουτισμού mRNA, του κατακερματισμού, της μεροληψίας εκκινητών, της σύνδεσης προσαρμογέα, της αντίστροφης μεταγραφής και κυρίως της PCR. Στον πίνακα 3 παρουσιάζονται συνοπτικά προτάσεις βελτίωσης".
3.1. RNA εισόδου
"Παρά το γεγονός ότι το RNA-seq μπορεί να χρησιμοποιηθεί για τη μέτρηση των μεταγράφων οποιουδήποτε δείγματος καταρχήν- έχει αποτελέσει πρόκληση η εφαρμογή τυποποιημένων πρωτοκόλλων σε δείγματα με είτε πολύ μικρή ποσότητα είτε χαμηλής ποιότητας (μερικώς αποικοδομημένο) RNA εισόδου. Αυτό οφείλεται στο γεγονός ότι η μεροληψία που σχετίζεται με χαμηλές ποσότητες RNA εισόδου έχει ισχυρές και επιβλαβείς επιπτώσεις στην ανάλυση που ακολουθεί. Εάν δεν γίνει αντιληπτό, αυτό μπορεί να έχει σημαντικό αντίκτυπο στην επακόλουθη βιολογική ερμηνεία".
3.2. Εξάντληση rRNA
"Τα rRNAs είναι πολύ άφθονα, αποτελώντας συχνά το 80% έως 90% του συνολικού RNA. Λόγω του γεγονότος ότι η αλληλουχία rRNA σπάνια προκαλεί το ενδιαφέρον των ανθρώπων στα πειράματα RNA-seq, είναι απαραίτητο να αφαιρείται το rRNA από το δείγμα πριν από την κατασκευή βιβλιοθήκης. Ο στόχος είναι προκειμένου να αποτραπεί το μεγαλύτερο μέρος της βιβλιοθήκης και η πλειονότητα των αναγνώσεων αλληλούχισης να είναι rRNA".
3.3. Κατακερματισμός RNA
"Επί του παρόντος, το RNA είναι συνήθως κατακερματισμένο λόγω του περιορισμού του μήκους ανάγνωσης (<600 bp) των τεχνολογιών αλληλούχισης και της ευαισθησίας της ενίσχυσης σε μεγάλα μόρια cDNA. Υπάρχουν δύο κύριες προσεγγίσεις κατακερματισμού του RNA: η χημική (με χρήση ιόντων μετάλλων) και η ενζυμική (με χρήση RNase III)[30]. Συνήθως, το RNA κατακερματίζεται με τη χρήση ιόντων μετάλλων, όπως Mg++ και Zn++, σε υψηλές θερμοκρασίες και αλκαλικές συνθήκες. Αυτή η μέθοδος αποδίδει ακριβέστερη ταυτοποίηση των μεταγράφων σε σχέση με την πέψη με RNάση III [31]. Το αποτέλεσμα αυτό επιβεβαιώθηκε επίσης από τους Wery et al. []. Επιπλέον, τα άθικτα RNA μπορούν να μεταγραφούν αντίστροφα (RT) σε cDNA με αντίστροφη μεταγραφάση, στη συνέχεια κατακερματιστεί. Στη συνέχεια, το cDNA κατακερματίστηκε με τη χρήση ενζυμικής ή φυσικής μεθόδου. Παραδείγματα της ενζυμικής μεθόδου περιλαμβάνουν την πέψη με DNase I, μη ειδική ενδονουκλεάση (όπως η NEBNext dsDNA Fragmentase της New England Biolabs) και τον κατακερματισμό DNA με τη μεσολάβηση τρανσποζάσης (Illumina Nextera XT). Πάντως, η μέθοδος της Tn5 τρανσποζάσης έδειξε μεροληψία ως προς την αλληλουχία [32], η οποία είναι η προτιμώμενη μέθοδος όταν είναι διαθέσιμες μόνο μικρές ποσότητες cDNA, καθώς ο κατακερματισμός του cDNA και η σύνδεση του προσαρμογέα συνδέονται σε ένα βήμα [33]".
"Η φυσική μέθοδος περιλαμβάνει την ακουστική διάτμηση, τον ηχητικό καθαρισμό και την υδροδυναμική [17, 37, 38], η οποία μπορεί επίσης να παρουσιάσει μη τυχαία μεροληψία κατακερματισμού του DNA [35]. Ωστόσο, η φυσική μέθοδος κατακερματισμού cDNA είναι λιγότερο επιδεκτική σε αυτοματοποίηση από ό,τι ο κατακερματισμός RNA. Ως εκ τούτου, η φυσική μέθοδος θα αντικατασταθεί από τα εμπορικά διαθέσιμα κιτ και την ενζυμική μέθοδο".
3.4. Μεροληψία εκκινητών
"Συνήθως, μετά τον κατακερματισμό του mRNA, το οποίο μπορεί να μεταγραφεί αντίστροφα σε cDNA με τυχαία εξαμερή. Ωστόσο, μελέτες έχουν δείξει ότι ο τυχαίος εξαμερής εκκινητής μπορεί να οδηγήσει σε απόκλιση του νουκλεοτιδικού περιεχομένου των αναγνώσεων αλληλούχισης RNA, γεγονός που επηρεάζει επίσης τη συνέπεια των θέσεων των αναγνώσεων κατά μήκος των εκφραζόμενων μεταγράφων. Αυτό μπορεί να οδηγήσει σε χαμηλή πολυπλοκότητα των δεδομένων αλληλούχισης RNA".
3.5. Συζεύξεις προσαρμογέα
"Γενικά, όπως και για τη βαθιά αλληλούχιση της προετοιμασίας βιβλιοθήκης RNA, ένα κρίσιμο βήμα είναι η σύνδεση των αλληλουχιών προσαρμογέα. Η επιλογή της λιγάσης T4 RNA (Rnl1 ή Rnl2) ή άλλης λιγάσης RNA είναι πολύ σημαντική. Στη συνέχεια, τα προϊόντα σύνδεσης ενισχύονται με PCR. Ή προστέθηκαν νουκλεοτιδικές ομοπολυμερείς αλληλουχίες με πολυ(Α)πολυμεράση[41] ή τερματική δεοξυριβονουκλεοτιδυλοτρανσφεράση[41] αλλά εμποδίζουν τον σαφή προσδιορισμό των άκρων των RNA εισόδου. Η μέθοδος αυτή έχει επίσης χρησιμοποιηθεί ευρέως στην κατασκευή βιβλιοθήκης μικρών RNA. Πρόσφατα, μελέτες έδειξαν ότι η σύνδεση προσαρμογέα εισάγει μια σημαντική αλλά ευρέως παραγνωρισμένη μεροληψία στα αποτελέσματα της αλληλούχισης μικρών RNA NGS".
3.6. Αντίστροφη μεταγραφή
"Επί του παρόντος, οι στρατηγικές της ανάλυσης του μεταγραφώματος εξακολουθούν να μετατρέπουν το RNA σε cDNA πριν από την αλληλούχιση. Ένα γνωστό χαρακτηριστικό των αντίστροφων μεταγραφασών είναι ότι τείνουν να παράγουν ψευδές cDNA δεύτερης αλυσίδας μέσω της εξαρτώμενης από το DNA DNA πολυμεράσης. Αυτό μπορεί να μην είναι σε θέση να διακρίνει το sense και antisense μεταγράφημα και να δημιουργήσει δυσκολίες για την ανάλυση των δεδομένων".
3.7. Ενίσχυση με PCR
"Η PCR είναι ένα βασικό εργαλείο που χρησιμοποιείται ευρέως στα εργαστήρια μοριακής βιολογίας. Ειδικότερα, ο συνδυασμός της PCR και της αλληλούχισης NGS προώθησε την εκρηκτική ανάπτυξη της απόκτησης αλληλουχιών RNA. Ωστόσο, η ενίσχυση με PCR έχει αποδειχθεί ότι είναι η κύρια πηγή τεχνουργημάτων και μεροληψίας της σύνθεσης των βάσεων κατά τη διαδικασία κατασκευής βιβλιοθήκης, η οποία μπορεί να οδηγήσει σε παραπλανητικά ή ανακριβή συμπεράσματα κατά την ανάλυση των δεδομένων. Ως εκ τούτου, είναι απαραίτητο να αποφεύγεται η μεροληψία της PCR και έχουν καταβληθεί μεγάλες προσπάθειες για την προσπάθεια ελέγχου και μετριασμού της μεροληψίας στο ρεύμα".
5. Συζήτηση και συμπεράσματα
"Επί του παρόντος, το RNA-seq έχει χρησιμοποιηθεί ευρέως στη βιολογική, ιατρική, κλινική και φαρμακευτική έρευνα. Ωστόσο, όλες αυτές οι μελέτες αλληλούχισης περιορίζονται από την ακρίβεια των υποκείμενων πειραμάτων αλληλούχισης, επειδή η τεχνολογία RNA-seq μπορεί να εισάγει διάφορα σφάλματα και μεροληψίες κατά την προετοιμασία του δείγματος, την κατασκευή βιβλιοθήκης, την αλληλούχιση και την απεικόνιση κ.λπ.".
"Επιπλέον, οι μέθοδοι κατασκευής βιβλιοθηκών είναι συχνά μεροληπτικές , γεγονός που αποτελεί βασική ανησυχία για την ποιότητα των δεδομένων RNA-seq. Μεταξύ αυτών, η ενίσχυση με PCR είναι η κύρια πηγή μεροληψίας. Μια προηγούμενη μελέτη έδειξε ότι η περιεκτικότητα σε GC έχει εικονική επίδραση στην αποτελεσματικότητα της ενίσχυσης PCR".
"Συνοψίζοντας, ο κύριος στόχος της κατασκευής της βιβλιοθήκης αλληλούχισης είναι η ελαχιστοποίηση της μεροληψίας. Η μεροληψία ορίστηκε συχνά ως η συστηματική παραμόρφωση των δεδομένων λόγω των πειραματικών πρωτοκόλλων. Ως εκ τούτου, είναι αύνατο να εξαλειφθούν όλες οι πηγές πειραματικής μεροληψίας. Οι καλύτερες στρατηγικές είναι οι εξής: (i) να κατανοήσουμε πώς δημιουργείται η μεροληψία και να λάβουμε μέτρα για την ελαχιστοποίησή της- (ii) να δώσουμε προσοχή στον πειραματικό σχεδιασμό και να ελαχιστοποιήσουμε την επίδραση της μη αναγώγιμης μεροληψίας στην τελική ανάλυση".
https://www.hindawi.com/journals/bmri/2021/6647597/
Συνοψίζοντας:
Η πολύπλοκη και δυσκίνητη προετοιμασία της βιβλιοθήκης, η οποία ξεκινά με απομονωμένα νουκλεϊκά οξέα και καταλήγει σε ενισχυμένο και γραμμωτό DNA με προσαρμογείς αλληλούχισης, έχει αναγνωριστεί ως ένα σημαντικό σημείο συμφόρησης(δηλαδή κάτι που καθυστερεί ή σταματά την ελεύθερη κίνηση και πρόοδο)
Τα πρωτόκολλα προετοιμασίας της βιβλιοθήκης αποτελούνται συνήθως από μια διαδικασία πολλών βημάτων και απαιτούν δαπανηρά αντιδραστήρια και σημαντικό χρόνο εργασίας.
Θα πρέπει να δοθεί μεγάλη έμφαση στην τυποποίηση για να εξασφαλιστεί η ευρωστία και η αναπαραγωγιμότητα.
Ανεξάρτητα από τις βασικές αρχές της εκάστοτε μεθόδου αλληλούχισης, όλες οι σύγχρονες τεχνολογίες αλληλούχισης απαιτούν ειδική προετοιμασία δείγματος για την παραγωγή της βιβλιοθήκης αλληλούχισης που φορτώνεται στο όργανο
Οι βιβλιοθήκες αλληλούχισης αποτελούνται από θραύσματα DNA καθορισμένης κατανομής μήκους με ολιγομερείς προσαρμογείς στο 5′ και 3′ άκρο για τη γραμμωτή κωδικοποίηση, καθώς και την πραγματική διαδικασία αλληλούχισης
Η αξιόπιστη και τυποποιημένη εφαρμογή και τα μέτρα ποιοτικού ελέγχου για όλα τα στάδια της διαδικασίας είναι ζωτικής σημασίας στην εργαστηριακή πρακτική ρουτίνας
Σε κάθε ένα από τα προαναφερθέντα στάδια της ροής εργασίας παρουσιάζονται προκλήσεις που πρέπει να αντιμετωπιστούν για να εξασφαλιστούν υψηλής ποιότητας αποτελέσματα αλληλούχισης.
Κατά τη διάρκεια της αλληλούχισης, η μόλυνση από τη μεταφορά μπορεί να οδηγήσει σε σημαντικά σφάλματα.
Η ροή εργασίας Illumina TruSeq Nano (Illumina, 2019) απαιτεί δέκα βήματα για την προσάρτηση προσαρμογέων και γραμμωτών κωδικών στα νουκλεοτίδια
Ειδικά τα βήματα καθαρισμού με βάση τα σφαιρίδια, τα οποία συνεπάγονται το χειρισμό μαγνητών και μαγνητικών σωματιδίων από το χρήστη, είναι επιρρεπή σε σφάλματα και μπορεί να οδηγήσουν σε αποτυχία της προετοιμασίας της βιβλιοθήκης
Η μόλυνση των δειγμάτων αποτελεί εγγενές πρόβλημα, καθώς οι βιβλιοθήκες προετοιμάζονται συνήθως παράλληλα
Κύριες πηγές μόλυνσης είναι οι προ-δειγματοληψίες που απαιτούνται για χαμηλή αρχική συγκέντρωση νουκλεϊκών οξέων
Ο κύριος στόχος κατά την προετοιμασία μιας βιβλιοθήκης αλληλούχισης είναι να δημιουργηθεί όσο το δυνατόν λιγότερη μεροληψία
Η μεροληψία μπορεί να οριστεί ως η συστηματική παραμόρφωση των δεδομένων λόγω του πειραματικού σχεδιασμού
Δεδομένου ότι είναι αδύνατο να εξαλειφθούν όλες οι πηγές πειραματικής μεροληψίας, οι καλύτερες στρατηγικές είναι οι εξής
Να γνωρίζετε πού εμφανίζεται η μεροληψία και να λαμβάνετε όλα τα πρακτικά μέτρα για την ελαχιστοποίησή της
Δώστε προσοχή στον πειραματικό σχεδιασμό ώστε οι πηγές μεροληψίας που δεν μπορούν να εξαλειφθούν να έχουν ελάχιστο αντίκτυπο στην τελική ανάλυση
Η πολυπλοκότητα μιας βιβλιοθήκης NGS μπορεί να αντικατοπτρίζει την ποσότητα της μεροληψίας που δημιουργείται από έναν δεδομένο πειραματικό σχεδιασμό
Η τεχνολογική πρόκληση είναι ότι οποιαδήποτε ποσότητα ενίσχυσης(μέσω RT-PCR) μπορεί να μειώσει αυτή την πιστότητα
Οι διπλές αναγνώσεις ορίζονται γενικά ως αναγνώσεις που είναι ακριβώς ίδιες ή έχουν ακριβώς τις ίδιες θέσεις εκκίνησης όταν ευθυγραμμίζονται με μια αλληλουχία αναφοράς
Είναι σημαντικό να κατανοήσουμε υπό ποιες συνθήκες τα ποσοστά διπλής ανάγνωσης αποτελούν ακριβές μέτρο της πολυπλοκότητας της βιβλιοθήκης.
Το RNA-seq είναι σημαντικά πιο πολύπλοκο από το DNA, διότι εξ ορισμού, η αρχική δεξαμενή αλληλουχιών αντιπροσωπεύει ένα σύνθετο μείγμα διαφορετικού αριθμού μεταγράφων mRNA που αντανακλά τη βιολογία της διαφορικής έκφρασης.
Ο στόχος κατά την προετοιμασία μιας βιβλιοθήκης είναι να προετοιμαστεί με τέτοιο τρόπο ώστε να μεγιστοποιηθεί η πολυπλοκότητα και να ελαχιστοποιηθεί η μεροληψία των κλώνων με βάση την PCR ή άλλη ενίσχυση
Το σημείο κλειδί είναι ότι το επίπεδο της εκτεταμένης ενίσχυσης που απαιτείται δημιουργεί μεροληψία με τη μορφή προτιμησιακής ενίσχυσης διαφορετικών αλληλουχιών, και αυτή η μεροληψία παραμένει ένα σοβαρό ζήτημα στην ανάλυση των δεδομένων που προκύπτουν
Είναι σημαντικό να αναγνωριστεί ο αντίκτυπος της συστηματικής μεροληψίας που προκύπτει από τους μοριακούς χειρισμούς που απαιτούνται για τη δημιουργία δεδομένων NGS- για παράδειγμα, η μεροληψία που εισάγεται από τις εξαρτώμενες από την αλληλουχία διαφορές στην αποτελεσματικότητα της σύνδεσης προσαρμογέων σε παρασκευές βιβλιοθηκών miRNA-seq.
Οι επιδράσεις της παρτίδας μπορεί να προκύψουν από τη μεταβλητότητα της καθημερινής επεξεργασίας των δειγμάτων, όπως:
Συνθήκες αντίδρασης
παρτίδες αντιδραστηρίων
Ακρίβεια σιφώνων
Διαφορετικοί τεχνικοί
Ένα πρόβλημα που σχετίζεται με την αλληλούχιση αμπλικονίων είναι η παρουσία χιμαιρικών αμπλικονίων (αλληλουχίες που σχηματίζονται από δύο ή περισσότερες βιολογικές αλληλουχίες ενωμένες μεταξύ τους) που δημιουργούνται κατά τη διάρκεια της PCR με ανασυνδυασμό με τη μεσολάβηση της PCR
Το πρόβλημα αυτό επιδεινώνεται σε βιβλιοθήκες χαμηλής πολυπλοκότητας και από την υπερενίσχυση
Μια πρόσφατη μελέτη προσδιόρισε έως και το 8% των ακατέργαστων αναγνώσεων αλληλουχίας ως χιμαιρικά
Η παρουσία των αλληλουχιών εκκινητών PCR ή άλλων εξαιρετικά συντηρημένων αλληλουχιών αποτελεί τεχνικό περιορισμό σε ορισμένες πλατφόρμες αλληλούχισης που χρησιμοποιούν ανίχνευση φθορισμού (π.χ. Illumina).
Σε αυτή την περίπτωση, οι αλληλουχίες εκκινητών PCR στην αρχή της ανάγνωσης θα παράγουν την ίδια ακριβώς βάση με κάθε κύκλο αλληλούχισης, δημιουργώντας προβλήματα για το υλικό και το λογισμικό ανίχνευσης σήματος
Η συναρμολόγηση συνόλων δεδομένων από διαφορετικές πηγές εισάγει αναπόφευκτα φαινόμενα παρτίδας.
Αυτές οι επιδράσεις παρτίδας δεν είναι καλά κατανοητές και μπορεί να οφείλονται σε αλλαγές στο πρωτόκολλο αλληλούχισης ή στα εργαλεία βιοπληροφορικής που χρησιμοποιούνται για την επεξεργασία των δεδομένων.
Δεν υπάρχουν συστηματικοί αλγόριθμοι ή ευρετικές μέθοδο ι για την ανίχνευση και το φιλτράρισμα των επιδράσεων παρτίδας ή την αφαίρεση των συσχετίσεων που επηρεάζονται από τις επιδράσεις παρτίδας σε δεδομένα αλληλούχισης ολόκληρου γονιδιώματος.
Η ταχεία εξέλιξη της τεχνολογίας WGS χαρακτηρίζεται από αλλαγές σε:
Μέθοδοι προετοιμασίας βιβλιοθηκών
Χημεία αλληλούχισης
Κυψέλες ροής
Εργαλεία βιοπληροφορικής για ευθυγράμμιση αναγνώσεων και κλήση παραλλαγών
Αναπόφευκτα, οι αλλαγές στην τεχνολογία WGS είχαν ως αποτέλεσμα μεγάλες διαφορές μεταξύ των δειγμάτων και την πιθανότητα επιδράσεων παρτίδας.
Οι παράγοντες που οδηγούν σε επιδράσεις παρτίδας δεν είναι επαρκώς κατανοητοί και μπορούν να προκύψουν από πολλαπλές πηγές, γεγονός που καθιστά δύσκολη την ανάπτυξη συστηματικών αλγορίθμων για την ανίχνευση και την εξάλειψη των επιδράσεων παρτίδας
Ο προσδιορισμός μιας μεθόδου για την ανίχνευση επιδράσεων παρτίδας που έχουν αντίκτυπο στις αναλύσεις συσχέτισης που ακολουθούν είναι ζωτικής σημασίας, καθώς οι ερευνητές πρέπει να γνωρίζουν εκ των προτέρων αν τα σύνολα δεδομένων WGS μπορούν να συνδυαστούν ή αν οι αλλαγές στη χημεία αλληλούχισης θα οδηγήσουν σε αλληλουχίες που δεν μπορούν πλέον να αναλυθούν μαζί.
Υπάρχουν λίγες κατευθυντήριες γραμμές για τον προσδιορισμό του κατά πόσον ένα σύνολο δεδομένων έχει φαινόμενα παρτίδας και, εάν ναι, ποιες μέθοδοι θα μειώσουν τον αντίκτυπό τους
Η ευαισθησία της τεχνολογίας WGS σε διαφορές στην προετοιμασία της βιβλιοθήκης, στη χημεία αλληλούχισης, κ.λπ. την καθιστά ιδιαίτερα ευαίσθητη σε φαινόμενα παρτίδας, ωστόσο δεν έχει καθιερωθεί ένα πρότυπο σύνολο κατευθυντήριων γραμμών για τον έλεγχο ποιότητας των WGS.
Πολλές χιλιάδες δείγματα είναι απαραίτητα για να υπάρχει επαρκής ισχύς για τον εντοπισμό νέων παραλλαγών που σχετίζονται με κοινές σύνθετες ασθένειες
Προκειμένου να συλλεχθούν αρκετές περιπτώσεις για ασθένειες, πολλές ομάδες συχνά συνεργάζονται συνεισφέροντας δείγματα σε μια κοινοπραξία
Η ανάγκη συνδυασμού δειγμάτων που έχουν υποβληθεί σε ανεξάρτητη επεξεργασία είναι σαφής, όπως και η αναπόφευκτη εισαγωγή επιδράσεων παρτίδας
Οι ερευνητές διαπίστωσαν ότι οι αλλαγές στη χημεία αλληλούχισης που σχετίζονται με τις ροές εργασίας PCR έναντι των ροών εργασίας χωρίς PCR συνέβαλαν σε μεγάλο βαθμό στις ανιχνεύσιμες επιδράσεις παρτίδας τόσο στο Batch GWAS όσο και στο RA Batch GWAS
Οι επιδράσεις παρτίδας στα δεδομένα WGS δεν είναι καλά κατανοητές και ίσως εξαιτίας αυτού, οι ερευνητές δεν ήταν σε θέση να βρουν μια υπάρχουσα μέθοδο ή να αναπτύξουν μια νέα μέθοδο που να αφαιρεί όλες τις περιοχές που επηρεάζονται από τις επιδράσεις παρτίδας χωρίς να επηρεάζει την ισχύ για την ανίχνευση πραγματικών συσχετίσεων
Προκειμένου να αντιμετωπιστούν πλήρως οι επιδράσεις της παρτίδας, θα πρέπει να διαχωριστεί ο αντίκτυπος των αλλαγών στη χημεία αλληλούχισης και στην επεξεργασία βιοπληροφορικής στην ανάλυση συσχέτισης.
Οι επιδράσεις παρτίδας θα προκύψουν καθώς ανεξάρτητες ομάδες θα προσπαθήσουν να συνδυάσουν δεδομένα αλληλούχισης που παράγονται και υποβάλλονται σε επεξεργασία από διαφορετικές πηγές.
Μεγάλης κλίμακας πόροι δαπανώνται από ερευνητικούς, βιομηχανικούς και κυβερνητικούς οργανισμούς για τη δημιουργία βάσεων δεδομένων που δεν μπορούν εύκολα να συγχωνευθούν
Οι ευρέως χρησιμοποιούμενες πλατφόρμες NGS, συμπεριλαμβανομένων των Illumina και Pacific Biosciences, χρειάζονται ενίσχυση με PCR κατά τη διάρκεια της κατασκευής βιβλιοθήκης για να αυξηθεί ο αριθμός των μορίων cDNA ώστε να καλυφθούν οι ανάγκες της αλληλούχισης
Το πιο προβληματικό βήμα στις διαδικασίες προετοιμασίας δειγμάτων είναι η ενίσχυση λόγω του γεγονότος ότι η PCR εισάγει στοχαστικά μεροληψίες, οι οποίες μπορούν να μεταδοθούν σε μεταγενέστερους κύκλους
Η PCR ενισχύει επίσης διαφορετικά μόρια με άνισες πιθανότητες, οδηγώντας στην άνιση ενίσχυση των μορίων cDNA
Πρόσφατα, οι ερευνητές πρότειναν διάφορες μεθόδους για τη μείωση της ενίσχυσης με PCR, όπως πρωτόκολλα χωρίς PCR και ισοθερμική ενίσχυση , ωστόσο οι μέθοδοι αυτές δεν είναι τέλειες και εξακολουθούν να παρουσιάζουν ορισμένα τεχνουργήματα και μεροληψίες της αλληλούχισης
Η διαδικασία προετοιμασίας του δείγματος μπορεί να επιφέρει πιθανές παραλλαγές και αποκλίσεις στο πείραμα RNA-seq, συμπεριλαμβανομένων των εξής:
Απομόνωση RNA
Επεξεργασία δείγματος
Χρόνος αποθήκευσης της βιβλιοθήκης
επίπεδο εισόδου RNA (όπως η διαφορά στον αριθμό των RNA εκκίνησης)
κρυοσυντήρηση του δείγματος (όπως νωπή ή κατεψυγμένη συντήρηση)
Λόγω της εκτεταμένης ύπαρξης ενζύμων που αποικοδομούν το RNA (RNάσες), η επιτυχής απομόνωση RNA υψηλής ποιότητας παραμένει πρόκληση.
Οι μέθοδοι καθαρισμού αναπτύχθηκαν κυρίως για την εξαγωγή μακρών mRNA και βασίστηκαν στην υπόθεση ότι όλα τα RNA καθαρίζονται εξίσου, όταν οι μέθοδοι αυτές εφαρμόζονται σε μη κωδικοποιημένα RNA, γεγονός που μπορεί να οδηγήσει σε αποικοδόμηση του RNA
Μελέτες έδειξαν ότι τα περισσότερα από τα πρωτόκολλα που χρησιμοποιούνται σήμερα για την κατασκευή βιβλιοθηκών μπορεί να εισάγουν σοβαρές αποκλίσεις
Ο κατακερματισμός του RNA μπορεί να εισάγει μεροληψίες ή σφάλματα μήκους, τα οποία στη συνέχεια μεταδίδονται σε μεταγενέστερους κύκλους
Η ενίσχυση της βιβλιοθήκης μπορεί επίσης να επηρεαστεί από σφάλματα εκκινητών, όπως σφάλματα εκκινητών στην ενίσχυση πολλαπλής μετατόπισης (MDA), αναντιστοιχία εκκινητών στην ενίσχυση PCR
Κατά συνέπεια, μπορεί να εισαγάγει μη γραμμικά αποτελέσματα και να θέσει αναπόφευκτα σε κίνδυνο την ποιότητα του συνόλου δεδομένων RNA-seq, οδηγώντας σε εσφαλμένη ερμηνεία
Οι πηγές μεροληψίας κατά την προετοιμασία της βιβλιοθήκης περιλαμβάνουν:
Εμπλουτισμός mRNA
RNA εισόδου
Η μεροληψία που σχετίζεται με χαμηλές ποσότητες RNA εισόδου έχει ισχυρές και επιβλαβείς επιπτώσεις στην ανάλυση που ακολουθεί
Εάν δεν γίνει αντιληπτή, μπορεί να έχει σημαντικό αντίκτυπο στην επακόλουθη βιολογική ερμηνεία
Εξάντληση rRNA
Είναι απαραίτητο να αφαιρεθεί το rRNA από το δείγμα πριν από την κατασκευή βιβλιοθήκης
Ο στόχος είναι προκειμένου να αποφευχθεί ότι το μεγαλύτερο μέρος της βιβλιοθήκης και η πλειονότητα των αναγνωσμάτων αλληλούχισης είναι rRNA
Κατακερματισμός
Η μέθοδος της τρανσποζάσης Tn5 έδειξε μεροληψία ανάλογα με την αλληλουχία, η οποία είναι η προτιμώμενη μέθοδος όταν είναι διαθέσιμες μόνο μικρές ποσότητες cDNA, δεδομένου ότι ο κατακερματισμός του cDNA και η σύνδεση του προσαρμογέα συνδέονται σε ένα βήμα.
Η φυσική μέθοδος περιλαμβάνει την ακουστική διάτμηση, τον ηχητικό καθαρισμό και την υδροδυναμική, οι οποίες μπορούν επίσης να παρουσιάσουν μη τυχαία μεροληψία κατακερματισμού του DNA
Μεροληψία εκκινητών
Μελέτες έχουν δείξει ότι ο τυχαίος εξαμερής εκκινητής μπορεί να οδηγήσει σε απόκλιση του περιεχομένου νουκλεοτιδίων των αναγνώσεων αλληλούχισης RNA, η οποία επηρεάζει επίσης τη συνέπεια των θέσεων των αναγνώσεων κατά μήκος των εκφραζόμενων μεταγράφων
Αυτό μπορεί να οδηγήσει σε χαμηλή πολυπλοκότητα των δεδομένων αλληλούχισης RNA
Σύνδεση προσαρμογέα
Μελέτες έχουν δείξει ότι η σύνδεση προσαρμογέα εισάγει μια σημαντική αλλά ευρέως παραγνωρισμένη μεροληψία στα αποτελέσματα της αλληλούχισης μικρών RNA NGS
Αντίστροφη μεταγραφή
Ένα γνωστό χαρακτηριστικό των αντίστροφων μεταγραφασών είναι ότι τείνουν να παράγουν ψευδές cDNA δεύτερης αλυσίδας μέσω της DNA-εξαρτώμενης DNA πολυμεράσης
Αυτό μπορεί να μην είναι σε θέση να διακρίνει το sense και antisense μεταγράφημα και να δημιουργήσει δυσκολίες στην ανάλυση των δεδομένων
Ενίσχυση PCR
Αποδεδειγμένα αποτελεί την κύρια πηγή τεχνουργημάτων και μεροληψίας της σύνθεσης των βάσεων κατά τη διαδικασία κατασκευής βιβλιοθήκης, η οποία μπορεί να οδηγήσει σε παραπλανητικά ή ανακριβή συμπεράσματα κατά την ανάλυση των δεδομένων
Όλες οι μελέτες αλληλούχισης περιορίζονται από την ακρίβεια των υποκείμενων πειραμάτων αλληλούχισης, επειδή η τεχνολογία RNA-seq μπορεί να εισάγει διάφορα σφάλματα και μεροληψίες κατά την προετοιμασία του δείγματος, την κατασκευή της βιβλιοθήκης, την αλληλούχιση και την απεικόνιση κ.λπ.
Οι μέθοδοι κατασκευής βιβλιοθηκών είναι συχνά μεροληπτικές, γεγονός που αποτελεί βασική ανησυχία για την ποιότητα των δεδομένων RNA-seq.
Μεταξύ αυτών, η ενίσχυση με PCR είναι η κύρια πηγή μεροληψίας
Ο κύριος στόχος της κατασκευής της βιβλιοθήκης αλληλούχισης είναι η ελαχιστοποίηση της μεροληψίας
Είναι αδύνατο να εξαλειφθούν όλες οι πηγές πειραματικής μεροληψίας
Το γονιδίωμα που αποκωδικοποιούμε σε αυτή τη γενιά δεν είναι παρά ένα στιγμιότυπο ενός διαρκώς μεταβαλλόμενου εγγράφου. Δεν υπάρχει οριστική έκδοση".
Matt Ridley, Genome: the Autobiography of a Species in 23 Chapters (Γονιδίωμα: η αυτοβιογραφία ενός είδους σε 23 κεφάλαια)
Είναι προφανές ότι κάθε βήμα κατά την προετοιμασία της βιβλιοθήκης αλληλούχισης είναι γεμάτο με μεροληψίες, τεχνουργήματα, σφάλματα και επιδράσεις παρτίδας. Παραδέχονται ανοιχτά ότι η μεροληψία δεν μπορεί να εξαλειφθεί και μπορεί μόνο να μετριαστεί και ότι τα batch effects είναι αναπόφευκτα χωρίς να υπάρχει τρόπος να ανιχνευθούν ή να αφαιρεθούν. Γνωρίζοντας τα διάφορα ζητήματα μόλυνσης, σφαλμάτων, τεχνουργημάτων και μεροληψιών που είναι εγγενή στα στάδια που οδηγούν στη δημιουργία της γονιδιωματικής βιβλιοθήκης, πώς μπορούν τα δεδομένα που παράγονται από αυτές τις βιβλιοθήκες να θεωρηθούν ακριβή ή/και αξιόπιστα; Κάθε βήμα από το οποίο διέρχεται το δείγμα το απομακρύνει περαιτέρω από τη φυσική του κατάσταση. Αυτό που τελικά αντιγράφεται ως cDNA, αλληλουχίζεται και συντάσσεται σε ένα γονιδίωμα δεν αντικατοπτρίζει πλέον την πραγματικότητα. Αυτοί οι ερευνητές διασπούν τα υγρά και τα υλικά που λαμβάνονται από μέσα μας σε μη αναγνωρίσιμα κλωνοποιημένα θραύσματα που δημιουργήθηκαν στο εργαστήριο και στη συνέχεια προσπαθούν να τα συναρμολογήσουν ξανά σε ένα κατασκεύασμα που μπορεί να παρατηρηθεί μόνο στην οθόνη ενός υπολογιστή. Αυτοί οι ερευνητές πιστεύουν ότι μπορούν να αποκτήσουν πολύτιμες γνώσεις από "συγκεκριμένους" γενετικούς δείκτες μέσα σε αυτές τις έντονα τροποποιημένες θεωρητικές κατασκευές που δημιουργούνται από υπολογιστή. Μέχρι στιγμής, αυτή η πεποίθηση δεν είναι παρά τυφλή θρησκευτική πίστη, καθώς τα ιατρικά θαύματα που υποσχέθηκε η άνοδος της γονιδιωματικής με την αλληλούχιση του ανθρώπινου γονιδιώματος πριν από σχεδόν 20 χρόνια δεν έχουν ακόμη υλοποιηθεί σε όφελος για την κοινωνία. Όταν γίνεται παραδεκτό ότι οι διάφορες πηγές σφαλμάτων σε κάθε βήμα που οδηγούν σε λανθασμένα και αναξιόπιστα δεδομένα δεν μπορούν να εξαλειφθούν, είναι καιρός να συνειδητοποιήσουμε ότι η υπόσχεση της γονιδιωματικής είναι ένα όνειρο απατηλό που βασίζεται σε απατηλά δεδομένα.
—Δικτυογραφία:
The Challenges in Genome Library Construction – ViroLIEgy
https://viroliegy.com/2022/02/21/the-challenges-in-genome-library-construction/