Ο εύκολος τρόπος για να ανακαλύψετε, να σχολιάσετε και να φιλτράρετε παραλλαγές

Ο εύκολος τρόπος για να ανακαλύψετε, να σχολιάσετε και να φιλτράρετε παραλλαγές

Januar 15, 2023 0 Von admin

Γιατί είναι σημαντικός ο σχολιασμός παραλλαγής;

Η ανάλυση παραλλαγών μπορεί να χρησιμοποιηθεί για:

Προσδιορίστε την αιτία(ες) της νόσου συγκρίνοντας το DNA προσβεβλημένων και μη προσβεβλημένων ατόμων.
Κατανοήστε την εξέλιξη κάνοντας φυλογενετικές συγκρίσεις παραλλαγών σε διαφορετικούς πληθυσμούς.
Προσδιορίστε σωματικές παραλλαγές που εμφανίζονται σε μεικτούς κυτταρικούς πληθυσμούς μωσαϊκού ή ιστών όγκου.
Κατανοήστε τη βιολογία μιας μετάλλαξης μαθαίνοντας πώς οι παραλλαγές επηρεάζουν τη δομή και τη λειτουργία της πρωτεΐνης.
Προσδιορίστε παραλλαγές σε ιικά ή βακτηριακά στελέχη που μπορεί να επηρεάσουν τη διάρκεια και την ένταση μιας επιδημίας.

Τι τύπο δεδομένων αλληλουχίας χρειάζομαι για την ανάλυση παραλλαγών;

Ορισμένες κοινές τεχνολογίες αλληλουχίας που δημιουργούν δεδομένα κατάλληλα για σχολιασμό και ανάλυση παραλλαγών περιλαμβάνουν τα Sanger/ABI, Illumina, Ion Torrent, PacBio και Oxford Nanopore. Η τεχνολογία Sanger εξακολουθεί να χρησιμοποιείται ευρέως για ανάλυση παραλλαγών μικρής κλίμακας όπου η ακρίβεια είναι πιο σημαντική, ενώ η πλατφόρμα Illumina παρέχει ανάλυση παραλλαγών με ακρίβεια και υψηλή απόδοση. Οι πλατφόρμες μακράς ανάγνωσης έχουν πολύ βελτιωμένη ακρίβεια για την ανάλυση παραλλαγών και τα εκτεταμένα μήκη ανάγνωσης καθιστούν επίσης πιο πρακτική την πρόσθετη ανάλυση, όπως η ανάλυση απλότυπου και η ανάλυση μεγάλων δομικών παραλλαγών.

Κατά τη διάρκεια της αλληλουχίας NGS για το Illumina και το Ion Torrent, τα εργαλεία διοχέτευσης που σχετίζονται με το όργανο αλληλουχίας συνήθως καθαρίζουν τα αρχεία δεδομένων. Αυτό είναι συνήθως αρκετό, αλλά ορισμένα αρχεία ακολουθίας εξόδου μπορούν να επωφεληθούν από τη σάρωση με ένα εργαλείο τρίτου κατασκευαστή όπως το FastQC.

Αντίθετα, τα δεδομένα Sanger συνήθως περιέχουν πολλά βασικά σφάλματα κλήσης στα άκρα 5′ και 3′ όπου οι κορυφές του χρωματογράμματος δεν είναι υψηλής ποιότητας. Αυτός ο τύπος δεδομένων απαιτεί ένα πρόγραμμα λογισμικού υψηλής ποιότητας που μπορεί να περικόψει με ακρίβεια τα άκρα της σειράς πριν από τη συναρμολόγηση.

Τι πρέπει να αναζητήσω σε ένα πακέτο λογισμικού ανάλυσης παραλλαγών;

Για να αναλύσετε δεδομένα παραλλαγής, θα χρειαστείτε πρώτα λογισμικό για να ευθυγραμμίσετε τις πειραματικές ακολουθίες με μια γνωστή ακολουθία αναφοράς. Αλληλουχίες αναφοράς για κοινά μοντέλα οργανισμών είναι διαθέσιμες για δωρεάν λήψη σε ιστότοπους όπως NCBI.

Γιατί είναι σημαντικό το βήμα φιλτραρίσματος;

Ο εντοπισμός πιο ενδιαφέρουσες παραλλαγές από χιλιάδες εντοπισμένες παραλλαγές μπορεί να είναι δύσκολος και συχνά απαιτεί αρκετούς γύρους ανάλυσης και φιλτραρίσματος δεδομένων.

Οι περισσότερες παραλλαγές είναι καλοήθεις μεταλλάξεις στο DNA που δεν επηρεάζουν την κωδικοποίηση των πρωτεϊνών και δεν εντοπίζονται μέσα ή κοντά στα γονίδια. Θα πρέπει να υπάρχουν προεπιλεγμένα φίλτρα για την αφαίρεση αυτών των παραλλαγών από την αρχική ανάλυση. Το φιλτράρισμα παραλλαγών μπορεί να εξαλείψει γρήγορα χιλιάδες παραλλαγές από την εξέταση και να σας εξοικονομήσει χρόνο και απογοήτευση.

Ποιες είναι μερικές από τις μεγαλύτερες προκλήσεις στον σχολιασμό παραλλαγής;

Οι περισσότεροι ερευνητές ξεκινούν χρησιμοποιώντας τον υπάρχοντα σχολιασμό από το γονιδίωμα αναφοράς για τον εντοπισμό παραλλαγών σε περιοχές κωδικοποίησης των οποίων η παρουσία επηρεάζει την κωδικοποίηση πρωτεΐνης («μη συνώνυμες» παραλλαγές AKA). Ορισμένοι οργανισμοί μπορεί επίσης να έχουν σύνολα παραλλαγών που είχαν προσδιοριστεί προηγουμένως, συνήθως σε μορφή αρχείου VCF. Αυτές οι πληροφορίες σχολιασμού μπορούν να εισαχθούν στην ανάλυση, ώστε ο ερευνητής να μπορεί να διαφοροποιήσει μεταξύ των παραλλαγών που είχαν χαρακτηριστεί προηγουμένως και των νέων παραλλαγών.

Οι σχολιασμοί για γνωστές παραλλαγές μπορεί να περιλαμβάνουν πληροφορίες σχετικά με την κατανομή συχνότητας αλληλόμορφων, καθώς και αναφορές ή συνδέσμους σε πρόσθετες βάσεις δεδομένων σχολιασμών που μπορούν να χρησιμοποιηθούν για την ερμηνεία του λειτουργικού αντίκτυπου της παραλλαγής.

Οι διαδικτυακές βάσεις δεδομένων σχολιασμών παραλλαγών περιέχουν τεράστιες ποσότητες χρήσιμων πληροφοριών, αλλά η πρόσβαση σε αυτά τα δεδομένα μπορεί να είναι δύσκολη. Οι περισσότερες βάσεις δεδομένων είναι απαγορευτικά μεγάλες για μη αυτόματες αναζητήσεις. Επιπλέον, πολλοί χρησιμοποιούν ιδιόκτητες μορφές που απαιτούν από τους ερευνητές να πληρώσουν για την πρόσβαση. Για αυτούς τους λόγους, η ενσωμάτωση παραλλαγών σχολιασμών από πολλές πηγές μπορεί να είναι εξαιρετικά δυσκίνητη και χρονοβόρα για ερευνητές που εργάζονται ακόμη και με μικρά σύνολα δεδομένων.

Ακόμη και με το αρχικό φιλτράρισμα, μπορεί να απομένουν χιλιάδες παραλλαγές. Η δυνατότητα εφαρμογής πρόσθετου φιλτραρίσματος στους σχολιασμούς της βάσης δεδομένων των εισαγόμενων παραλλαγών είναι κρίσιμη για τη δημιουργία ενός διαχειρίσιμου και ουσιαστικού συνόλου δεδομένων για ερμηνεία.