CRISPR Cascade protein (cyan) bound to CRISPR RNA (green) and phage DNA (red)[1]
Identifiers
Oργανισμός
Escherichia coli
Συμβολισμός
CRISPR
Entrez
947229
PDB
4QYZ
RefSeq (Prot)
NP_417241.1
UniProt
P38036
H CRISPR (/ˈkrɪspər/) (ακρωνύμιο των clustered regularly interspaced short palindromic repeats) είναι μια οικογένεια αλληλουχιών DNA που βρίσκονται στα γονιδιώματα προκαρυωτικών οργανισμών, όπως τα βακτήρια και τα αρχαία[2].Οι αλληλουχίες αυτές προέρχονται από τμήματα DNA βακτηριοφάγων που είχαν προηγουμένως μολύνει τον προκαρυώτη. Χρησιμοποιούνται για την ανίχνευση και την καταστροφή του DNA από παρόμοιους βακτηριοφάγους κατά τη διάρκεια μεταγενέστερων μολύνσεων. Ως εκ τούτου, οι αλληλουχίες αυτές διαδραματίζουν βασικό ρόλο στο σύστημα αντιικής (δηλαδή αντι-φάγου) άμυνας των προκαρυωτών και παρέχουν μια μορφή επίκτητης ανοσίας.[3][4][5][6] Το CRISPR βρίσκεται περίπου στο 50% των βακτηριακών γονιδιωμάτων που έχουν αλληλουχηθεί και σχεδόν στο 90% των αρχαίων που έχουν αλληλουχηθεί.
Η Cas9 (ή «CRISPR-associated protein 9») είναι ένα ένζυμο που χρησιμοποιεί τις αλληλουχίες CRISPR ως οδηγό για να αναγνωρίζει και να ανοίγει συγκεκριμένες αλυσίδες DNA που είναι συμπληρωματικές προς την αλληλουχία CRISPR. Τα ένζυμα Cas9 μαζί με τις αλληλουχίες CRISPR αποτελούν τη βάση μιας τεχνολογίας γνωστής ως CRISPR-Cas9 που μπορεί να χρησιμοποιηθεί για την επεξεργασία γονιδίων μέσα στους οργανισμούς[7][8] Αυτή η διαδικασία επεξεργασίας έχει μια ευρεία ποικιλία εφαρμογών, συμπεριλαμβανομένης της βασικής βιολογικής έρευνας, της ανάπτυξης βιοτεχνολογικών προϊόντων και της θεραπείας ασθενειών[9][10] Η ανάπτυξη της τεχνικής επεξεργασίας γονιδιώματος CRISPR-Cas9 αναγνωρίστηκε με το βραβείο Νόμπελ Χημείας το 2020, το οποίο απονεμήθηκε στις Emmanuelle Charpentier και Jennifer Doudna[11][12]
Ιστορία
Επαναλαμβανόμενες ακολουθίες
Η ανακάλυψη των ομαδοποιημένων επαναλαμβανόμενων αλληλουχιών DNA πραγματοποιήθηκε ανεξάρτητα σε τρία μέρη του κόσμου. Η πρώτη περιγραφή αυτού που αργότερα θα ονομαζόταν CRISPR προέρχεται από τον ερευνητή του Πανεπιστημίου της Οσάκα Yoshizumi Ishino και τους συναδέλφους του το 1987. Κλωνοποίησαν τυχαία μέρος μιας αλληλουχίας CRISPR μαζί με το γονίδιο «iap» (ισοζυμική μετατροπή της αλκαλικής φωσφατάσης) από το γονιδίωμα της Escherichia coli[13][13] που ήταν ο στόχος τους. Η οργάνωση των επαναλήψεων ήταν ασυνήθιστη. Οι επαναλαμβανόμενες αλληλουχίες τυπικά διατάσσονται διαδοχικά, χωρίς να παρεμβάλλονται διαφορετικές αλληλουχίες [10][14]. Δεν γνώριζαν τη λειτουργία των διακοπτόμενων ομαδοποιημένων επαναλήψεων.
Το 1993, ερευνητές του Mycobacterium tuberculosis στις Κάτω Χώρες δημοσίευσαν δύο άρθρα σχετικά με μια συστάδα διακοπτόμενων άμεσων επαναλήψεων (DR) στο εν λόγω βακτήριο. Αναγνώρισαν την ποικιλομορφία των αλληλουχιών που παρεμβάλλονταν στις άμεσες επαναλήψεις μεταξύ των διαφόρων στελεχών του M. tuberculosis[15] και χρησιμοποίησαν αυτή την ιδιότητα για να σχεδιάσουν μια μέθοδο τυποποίησης που ονομάστηκε spoligotyping, η οποία χρησιμοποιείται ακόμη και σήμερα [16][17].
Ο Francisco Mojica του Πανεπιστημίου του Αλικάντε στην Ισπανία μελέτησε τις επαναλήψεις που παρατηρούνται στους οργανισμούς των ειδών Haloferax και Haloarcula και τη λειτουργία τους. Ο επόπτης του Mojica υπέθεσε τότε ότι οι ομαδοποιημένες επαναλήψεις είχαν ρόλο στον σωστό διαχωρισμό του αντιγραμμένου DNA στα θυγατρικά κύτταρα κατά τη διάρκεια της κυτταρικής διαίρεσης, επειδή πλασμίδια και χρωμοσώματα με πανομοιότυπες διατάξεις επαναλήψεων δεν μπορούσαν να συνυπάρξουν στον Haloferax volcanii. Για πρώτη φορά παρατηρήθηκε επίσης η μεταγραφή των διακοπτόμενων επαναλήψεων- αυτός ήταν ο πρώτος πλήρης χαρακτηρισμός του CRISPR.[17][18] Μέχρι το 2000, ο Mojica πραγματοποίησε μια έρευνα στην επιστημονική βιβλιογραφία και ένας από τους φοιτητές του πραγματοποίησε μια αναζήτηση σε δημοσιευμένα γονιδιώματα με ένα πρόγραμμα που επινόησε ο ίδιος. Εντόπισαν διακεκομμένες επαναλήψεις σε 20 είδη μικροβίων που ανήκαν στην ίδια οικογένεια[19]. Επειδή οι αλληλουχίες αυτές ήταν διακεκομμένες, ο Mojica ονόμασε αρχικά τις αλληλουχίες αυτές «σύντομες επαναλήψεις με τακτά διαστήματα» (short regular spaced repeats, SRSR)[20]. Το 2001, ο Mojica και ο Ruud Jansen, οι οποίοι αναζητούσαν μια επιπλέον διακοπτόμενη επανάληψη, πρότειναν το ακρωνύμιο CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) για να αμβλύνουν τη σύγχυση που προέκυπτε από τα πολυάριθμα ακρωνύμια που χρησιμοποιούνταν για την περιγραφή των αλληλουχιών στην επιστημονική βιβλιογραφία[18][21]. Το 2002, οι Tang, et al. έδειξαν στοιχεία ότι οι επαναλαμβανόμενες περιοχές CRISPR από το γονιδίωμα του Archaeoglobus fulgidus μεταγράφηκαν στα μακρά μόρια RNA που στη συνέχεια επεξεργάστηκαν σε μικρά RNAs μήκους μονάδας, καθώς και σε ορισμένες μεγαλύτερες μορφές 2, 3 ή περισσότερων μονάδων επανάληψης διαστήματος[22][23].
Το 2005, ο ερευνητής του γιαουρτιού Rodolphe Barrangou ανακάλυψε ότι ο Streptococcus thermophilus, μετά από επαναλαμβανόμενες προκλήσεις φάγων, αναπτύσσει αυξημένη αντοχή στους φάγους και αυτή η αυξημένη αντοχή οφείλεται στην ενσωμάτωση πρόσθετων αλληλουχιών διαστήματος CRISPR[24] Η δανέζικη εταιρεία τροφίμων Danisco, για την οποία εργαζόταν τότε ο Barrangou, ανέπτυξε στη συνέχεια στελέχη S. thermophilus ανθεκτικά στους φάγους για χρήση στην παραγωγή γιαουρτιού. Η Danisco εξαγοράστηκε αργότερα από την DuPont, η οποία «κατέχει περίπου το 50% της παγκόσμιας αγοράς γαλακτοκομικών καλλιεργειών» και η τεχνολογία καθιερώθηκε [24].
Συστήματα που σχετίζονται με το CRISPR
Μια σημαντική προσθήκη στην κατανόηση του CRISPR ήρθε με την παρατήρηση του Jansen ότι το σύμπλεγμα επαναλήψεων των προκαρυωτών συνοδεύεται από ένα σύνολο ομόλογων γονιδίων που αποτελούν τα συστήματα που σχετίζονται με το CRISPR ή τα γονίδια cas. Αρχικά αναγνωρίστηκαν τέσσερα γονίδια cas (cas 1-4). Οι πρωτεΐνες Cas εμφάνιζαν μοτίβα ελικάσης και νουκλεάσης, υποδηλώνοντας έναν ρόλο στη δυναμική δομή των τόπων CRISPR[25].Σε αυτή τη δημοσίευση, το ακρωνύμιο CRISPR χρησιμοποιήθηκε ως η καθολική ονομασία αυτού του μοτίβου. Ωστόσο, η λειτουργία του CRISPR παρέμενε αινιγματική.
Το 2005, τρεις ανεξάρτητες ερευνητικές ομάδες έδειξαν ότι ορισμένοι αποστάτες CRISPR προέρχονται από DNA φάγων και εξωχρωμοσωμικό DNA, όπως πλασμίδια[26][27][28].Στην πραγματικότητα, οι αποστάτες είναι θραύσματα DNA που συγκεντρώθηκαν από ιούς που προσπάθησαν προηγουμένως να επιτεθούν στο κύτταρο. Η προέλευση των spacers ήταν ένα σημάδι ότι το σύστημα CRISPR-cas θα μπορούσε να έχει ρόλο στην προσαρμοστική ανοσία στα βακτήρια[29][30].Και οι τρεις μελέτες που πρότειναν αυτή την ιδέα απορρίφθηκαν αρχικά από περιοδικά υψηλού κύρους, αλλά τελικά εμφανίστηκαν σε άλλα περιοδικά [31].
Η πρώτη δημοσίευση[27] που πρότεινε τον ρόλο του CRISPR-Cas στη μικροβιακή ανοσία, από τον Mojica και τους συνεργάτες του στο Πανεπιστήμιο του Αλικάντε, προέβλεψε έναν ρόλο της μεταγραφής των διαστημάτων RNA στην αναγνώριση των στόχων σε έναν μηχανισμό που θα μπορούσε να είναι ανάλογος με το σύστημα παρεμβολής RNA που χρησιμοποιείται από τα ευκαρυωτικά κύτταρα. Ο Koonin και οι συνεργάτες του επέκτειναν αυτή την υπόθεση της παρεμβολής RNA προτείνοντας μηχανισμούς δράσης για τους διάφορους υποτύπους CRISPR-Cas σύμφωνα με την προβλεπόμενη λειτουργία των πρωτεϊνών τους[32].
Οι πειραματικές εργασίες διαφόρων ομάδων αποκάλυψαν τους βασικούς μηχανισμούς της ανοσίας CRISPR-Cas. Το 2007 δημοσιεύθηκαν οι πρώτες πειραματικές αποδείξεις ότι το CRISPR ήταν ένα προσαρμοστικό ανοσοποιητικό σύστημα[5][10]. Μια περιοχή CRISPR στον Streptococcus thermophilus απέκτησε διαστήματα από το DNA ενός βακτηριοφάγου που τον μόλυνε. Οι ερευνητές χειραγώγησαν την ανθεκτικότητα του S. thermophilus σε διαφορετικούς τύπους φάγων προσθέτοντας και διαγράφοντας spacers των οποίων η αλληλουχία ταίριαζε με εκείνες που βρέθηκαν στους εξεταζόμενους φάγους [33][34] Το 2008, οι Brouns και Van der Oost εντόπισαν ένα σύμπλεγμα πρωτεϊνών Cas (που ονομάζεται Cascade) που στο E. coli έκοψε τον πρόδρομο CRISPR RNA εντός των επαναλήψεων σε ώριμα μόρια RNA που περιείχαν αποστάτες και ονομάζονταν CRISPR RNA (crRNA), τα οποία παρέμεναν συνδεδεμένα με το πρωτεϊνικό σύμπλοκο[35]. Επιπλέον, διαπιστώθηκε ότι η Cascade, το crRNA και μια ελικάση/νουκλεάση (Cas3) απαιτούνταν για να παρέχουν σε έναν βακτηριακό ξενιστή ανοσία έναντι μόλυνσης από έναν ιό DNA. Σχεδιάζοντας ένα CRISPR κατά του ιού, απέδειξαν ότι δύο προσανατολισμοί του crRNA (sense/antisense) παρείχαν ανοσία, υποδεικνύοντας ότι οι οδηγοί crRNA στόχευαν dsDNA. Εκείνη τη χρονιά οι Marraffini και Sontheimer επιβεβαίωσαν ότι μια αλληλουχία CRISPR του S. epidermidis στόχευε το DNA και όχι το RNA για να αποτρέψει τη σύζευξη. Αυτό το εύρημα ήταν σε αντίθεση με τον προτεινόμενο μηχανισμό RNA-παρεμβολής της ανοσίας CRISPR-Cas, αν και ένα σύστημα CRISPR-Cas που στοχεύει ξένο RNA βρέθηκε αργότερα στον Pyrococcus furiosus[10][34] Μια μελέτη του 2010 έδειξε ότι το CRISPR-Cas κόβει και τα δύο σκέλη του DNA του φάγου και του πλασμιδιακού DNA στον S. thermophilus [36].
Cas9
Κύριο άρθρο: Cas9
Ένα απλούστερο σύστημα CRISPR από τον Streptococcus pyogenes βασίζεται στην πρωτεΐνη Cas9. Η ενδονουκλεάση Cas9 είναι ένα σύστημα τεσσάρων συστατικών που περιλαμβάνει δύο μικρά μόρια: το crRNA και το trans-ενεργοποιητικό CRISPR RNA (tracrRNA)[37][38]. Το 2012, η Jennifer Doudna και η Emmanuelle Charpentier επανασχεδίασαν την ενδονουκλεάση Cas9 σε ένα πιο εύχρηστο σύστημα δύο συστατικών, συγχωνεύοντας τα δύο μόρια RNA σε ένα «single-guide RNA» που, όταν συνδυάζεται με το Cas9, μπορεί να βρει και να κόψει τον στόχο DNA που καθορίζεται από το guide RNA. Η συμβολή αυτή ήταν τόσο σημαντική που αναγνωρίστηκε με το βραβείο Νόμπελ Χημείας το 2020. Με τον χειρισμό της νουκλεοτιδικής αλληλουχίας του καθοδηγητικού RNA, το τεχνητό σύστημα Cas9 μπορούσε να προγραμματιστεί ώστε να στοχεύει οποιαδήποτε αλληλουχία DNA για διαχωρισμό[39]. Μια άλλη ομάδα συνεργατών, αποτελούμενη από τον Virginijus Šikšnysμαζί με τους Gasiūnas, Barrangou και Horvath, έδειξε ότι το Cas9 από το σύστημα CRISPR του S. thermophilus μπορεί επίσης να επαναπρογραμματιστεί ώστε να στοχεύει μια περιοχή της επιλογής τους, αλλάζοντας την αλληλουχία του crRNA του. Αυτές οι εξελίξεις τροφοδότησαν τις προσπάθειες για την επεξεργασία γονιδιωμάτων με το τροποποιημένο σύστημα CRISPR-Cas9[17].
Ομάδες με επικεφαλής τους Feng Zhang και George Church δημοσίευσαν ταυτόχρονα περιγραφές της επεξεργασίας γονιδιώματος σε καλλιέργειες ανθρώπινων κυττάρων με τη χρήση του CRISPR-Cas9 για πρώτη φορά [10][40][41].Έκτοτε έχει χρησιμοποιηθεί σε ένα ευρύ φάσμα οργανισμών, συμπεριλαμβανομένης της ζύμης αρτοποιίας (Saccharomyces cerevisiae)[42][43][44], του ευκαιριακού παθογόνου Candida albicans[45][46], του ψαριού ζέβρα (Danio rerio)[47], της μύγας των φρούτων (Drosophila melanogaster)[48][49], μυρμήγκια (Harpegnathos saltator[50] και Ooceraea biroi [51]), κουνούπια (Aedes aegypti[52]), νηματώδεις (Caenorhabditis elegans)[53],φυτά[54], ποντίκια (Mus musculus domesticus)[55][56], πίθηκοι [57] και ανθρώπινα έμβρυα [58].
Το CRISPR έχει τροποποιηθεί ώστε να κατασκευάζει προγραμματιζόμενους μεταγραφικούς παράγοντες που επιτρέπουν τη στόχευση και την ενεργοποίηση ή την αποσιώπηση συγκεκριμένων γονιδίων[59].
Το σύστημα CRISPR-Cas9 έχει δείξει ότι μπορεί να κάνει αποτελεσματικές γονιδιακές επεμβάσεις σε ανθρώπινα τριπύρηνα ζυγωτά που περιγράφηκαν για πρώτη φορά το 2015 σε μια εργασία των Κινέζων επιστημόνων P. Liang και Y. Xu. Το σύστημα πραγματοποίησε επιτυχή διάσπαση της μεταλλαγμένης β-αιμοσφαιρίνης (HBB) σε 28 από τα 54 έμβρυα. Τέσσερα από τα 28 έμβρυα ανασυνδυάστηκαν επιτυχώς χρησιμοποιώντας ένα πρότυπο δότη που έδωσαν οι επιστήμονες. Οι επιστήμονες έδειξαν ότι κατά τον ανασυνδυασμό του DNA της διασπασμένης αλυσίδας, η ομόλογη ενδογενής αλληλουχία HBD ανταγωνίζεται το εξωγενές πρότυπο δότη. Η επιδιόρθωση του DNA στα ανθρώπινα έμβρυα είναι πολύ πιο περίπλοκη και ιδιαίτερη από ό,τι στα παράγωγα βλαστικά κύτταρα[60].
Cas12a
Κύριο άρθρο: Cas12a
Το 2015, η νουκλεάση Cas12a (παλαιότερα γνωστή ως Cpf1[61]) χαρακτηρίστηκε στο σύστημα CRISPR-Cpf1 του βακτηρίου Francisella novicida[62][63].Το αρχικό της όνομα, από έναν ορισμό της οικογένειας πρωτεϊνών TIGRFAMs που κατασκευάστηκε το 2012, αντανακλά την επικράτηση του υποτύπου CRISPR-Cas της στις γενεαλογίες Prevotella και Francisella. Το Cas12a παρουσίασε αρκετές βασικές διαφορές από το Cas9, μεταξύ των οποίων: προκαλεί μια «κλιμακωτή» τομή σε δίκλωνο DNA σε αντίθεση με την «αμβλεία» τομή που παράγει το Cas9, βασίζεται σε ένα «πλούσιο σε Τ» PAM (παρέχοντας εναλλακτικές θέσεις στόχευσης σε σχέση με το Cas9) και απαιτεί μόνο ένα CRISPR RNA (crRNA) για την επιτυχή στόχευση. Αντίθετα, το Cas9 απαιτεί τόσο crRNA όσο και ένα trans-ενεργοποιητικό crRNA (tracrRNA).
Αυτές οι διαφορές ενδέχεται να προσδίδουν στο Cas12a ορισμένα πλεονεκτήματα έναντι του Cas9. Για παράδειγμα, τα μικρά crRNA του Cas12a είναι ιδανικά για πολυπλεξική επεξεργασία γονιδιώματος, καθώς περισσότερα από αυτά μπορούν να συσκευαστούν σε έναν φορέα από ό,τι τα sgRNA του Cas9. Οι κολλώδεις προεξοχές 5′ που αφήνει το Cas12a μπορούν επίσης να χρησιμοποιηθούν για τη συναρμολόγηση DNA που είναι πολύ πιο συγκεκριμένη για τον στόχο από την παραδοσιακή κλωνοποίηση με ένζυμο περιορισμού[64].Τέλος, το Cas12a κόβει το DNA 18-23 ζεύγη βάσεων κατάντη της θέσης PAM. Αυτό σημαίνει ότι δεν υπάρχει διακοπή της αλληλουχίας αναγνώρισης μετά την επιδιόρθωση και έτσι το Cas12a επιτρέπει πολλαπλούς γύρους διάσπασης του DNA. Αντίθετα, δεδομένου ότι η Cas9 κόβει μόνο 3 ζεύγη βάσεων ανάντη της θέσης PAM, το μονοπάτι NHEJ οδηγεί σε μεταλλάξεις indel που καταστρέφουν την αλληλουχία αναγνώρισης, εμποδίζοντας έτσι περαιτέρω γύρους κοπής. Θεωρητικά, οι επαναλαμβανόμενοι γύροι διάσπασης του DNA θα πρέπει να προκαλούν αυξημένη ευκαιρία για την πραγματοποίηση της επιθυμητής γονιδιωματικής επεξεργασίας[65]. Ένα ιδιαίτερο χαρακτηριστικό της Cas12a, σε σύγκριση με την Cas9, είναι ότι μετά την κοπή του στόχου της, η Cas12a παραμένει συνδεδεμένη με τον στόχο και στη συνέχεια κόβει άλλα μόρια ssDNA χωρίς διάκριση[66]. Αυτή η ιδιότητα ονομάζεται «παράπλευρη δραστηριότητα διάσπασης» ή «trans-cleavage» και έχει αξιοποιηθεί για την ανάπτυξη διαφόρων διαγνωστικών τεχνολογιών[67][68].
Cas13
Το 2016 χαρακτηρίστηκε η νουκλεάση Cas13a (πρώην γνωστή ως C2c2) από το βακτήριο Leptotrichia shahii. Η Cas13 είναι μια RNA-καθοδηγούμενη RNA-ενδονουκλεάση, πράγμα που σημαίνει ότι δεν κόβει DNA, αλλά μόνο μονόκλωνο RNA. Η Cas13 καθοδηγείται από το crRNA της σε έναν ssRNA-στόχο και δεσμεύει και κόβει τον στόχο. Παρόμοια με την Cas12a, η Cas13 παραμένει συνδεδεμένη στο στόχο και στη συνέχεια κόβει άλλα μόρια ssRNA χωρίς διάκριση [69]. Αυτή η παράπλευρη ιδιότητα διάσπασης έχει αξιοποιηθεί για την ανάπτυξη διαφόρων διαγνωστικών τεχνολογιών [70][71][72].
Το 2021, ο Δρ Hui Yang χαρακτήρισε νέες παραλλαγές της πρωτεΐνης Cas13 σε μικρογραφία (mCas13), τις Cas13X και Cas13Y. Χρησιμοποιώντας ένα μικρό τμήμα της αλληλουχίας του γονιδίου N από τον SARS-CoV-2 ως στόχο για τον χαρακτηρισμό της mCas13, αποκάλυψε την ευαισθησία και την ειδικότητα της mCas13 σε συνδυασμό με την RT-LAMP για την ανίχνευση του SARS-CoV-2 τόσο σε συνθετικά όσο και σε κλινικά δείγματα σε σχέση με άλλες διαθέσιμες τυπικές δοκιμασίες όπως η RT-qPCR (1 αντίγραφο/μL)[73].
Δομή
Επαναλήψεις και διαστήματα
Η συστοιχία CRISPR αποτελείται από μια πλούσια σε ΑΤ αρχική αλληλουχία, ακολουθούμενη από σύντομες επαναλήψεις που χωρίζονται από μοναδικά διαστήματα[74].Οι επαναλήψεις CRISPR κυμαίνονται συνήθως σε μέγεθος από 28 έως 37 ζεύγη βάσεων (bps), αν και μπορεί να είναι τόσο λίγες όσο 23 bps και τόσο πολλές όσο 55 bps [75].Ορισμένες παρουσιάζουν συμμετρία δυάδας, υποδηλώνοντας το σχηματισμό μιας δευτερογενούς δομής όπως ένας βρόχος-στέλεχος («φουρκέτα») στο RNA, ενώ άλλες είναι σχεδιασμένες να είναι αδόμητες. Το μέγεθος των διατημάτων στις διάφορες συστοιχίες CRISPR είναι συνήθως 32 έως 38 bp (εύρος 21 έως 72 bp)[75]. Νέα διαστήματα μπορούν να εμφανιστούν γρήγορα ως μέρος της ανοσολογικής απόκρισης στη μόλυνση από φάγο [76] Υπάρχουν συνήθως λιγότερες από 50 μονάδες της αλληλουχίας επανάληψης-διαστήματα σε μια συστοιχία CRISPR[75].
Γονίδια Cas και υπότυποι CRISPR
Μικρές συστάδες γονιδίων cas βρίσκονται συχνά δίπλα σε συστοιχίες επαναλαμβανόμενων διαστημάτων CRISPR. Συλλογικά, τα 93 γονίδια cas ομαδοποιούνται σε 35 οικογένειες με βάση την ομοιότητα αλληλουχίας των πρωτεϊνών που κωδικοποιούνται. 11 από τις 35 οικογένειες αποτελούν τον πυρήνα cas, ο οποίος περιλαμβάνει τις οικογένειες πρωτεϊνών Cas1 έως Cas9. Ένας πλήρης τόπος CRISPR-Cas έχει τουλάχιστον ένα γονίδιο που ανήκει στον πυρήνα cas[77].
Τα συστήματα CRISPR-Cas διακρίνονται σε δύο κατηγορίες. Τα συστήματα της κατηγορίας 1 χρησιμοποιούν ένα σύμπλεγμα πολλαπλών πρωτεϊνών Cas για την αποικοδόμηση ξένων νουκλεϊκών οξέων. Τα συστήματα της κατηγορίας 2 χρησιμοποιούν μία μόνο μεγάλη πρωτεΐνη Cas για τον ίδιο σκοπό. Η κλάση 1 χωρίζεται σε τύπους I, III και IV- η κλάση 2 χωρίζεται σε τύπους II, V και VI [78].Οι 6 τύποι συστημάτων χωρίζονται σε 19 υπότυπους[79].Κάθε τύπος και οι περισσότεροι υπότυποι χαρακτηρίζονται από ένα «γονίδιο υπογραφής» που απαντάται σχεδόν αποκλειστικά στην κατηγορία. Η ταξινόμηση βασίζεται επίσης στο συμπλήρωμα των γονιδίων cas που είναι παρόντα. Τα περισσότερα συστήματα CRISPR-Cas διαθέτουν μια πρωτεΐνη Cas1. Η φυλογένεση των πρωτεϊνών Cas1 γενικά συμφωνεί με το σύστημα ταξινόμησης[80], αλλά υπάρχουν εξαιρέσεις λόγω της αναδιάταξης των μονάδων[77]. Πολλοί οργανισμοί περιέχουν πολλαπλά συστήματα CRISPR-Cas, γεγονός που υποδηλώνει ότι είναι συμβατά και μπορεί να μοιράζονται συστατικά[81][82]. Η σποραδική κατανομή των υποτύπων CRISPR-Cas υποδηλώνει ότι το σύστημα CRISPR-Cas υπόκειται σε οριζόντια γονιδιακή μεταφορά κατά τη διάρκεια της μικροβιακής εξέλιξης.
Μηχανισμός
Η ανοσία CRISPR-Cas είναι μια φυσική διαδικασία των βακτηρίων και των αρχαίων[83]. Η CRISPR-Cas αποτρέπει τη μόλυνση από βακτηριοφάγους, τη σύζευξη και το φυσικό μετασχηματισμό, αποικοδομώντας τα ξένα νουκλεϊκά οξέα που εισέρχονται στο κύτταρο[34].
Απόκτηση διαστήματος
Όταν ένας μικροοργανισμός προσβάλλεται από έναν βακτηριοφάγο, το πρώτο στάδιο της ανοσολογικής απόκρισης είναι η σύλληψη του DNA του φάγου και η εισαγωγή του σε έναν τόπο CRISPR με τη μορφή διαστήματος. Οι Cas1 και Cas2 βρίσκονται και στους δύο τύπους ανοσοποιητικών συστημάτων CRISPR-Cas, γεγονός που υποδηλώνει ότι εμπλέκονται στην απόκτηση διαστήματος. Μελέτες μετάλλαξης επιβεβαίωσαν αυτή την υπόθεση, δείχνοντας ότι η αφαίρεση των Cas1 ή Cas2 σταμάτησε την απόκτηση διαστήματος, χωρίς να επηρεάσει την ανοσολογική απόκριση CRISPR[84][85][86][87][88].
Πολλαπλές πρωτεΐνες Cas1 έχουν χαρακτηριστεί και οι δομές τους έχουν επιλυθεί[89][90][91] Οι πρωτεΐνες Cas1 έχουν ποικίλες αλληλουχίες αμινοξέων. Ωστόσο, οι κρυσταλλικές δομές τους είναι παρόμοιες και όλες οι καθαρισμένες πρωτεΐνες Cas1 είναι μεταλλοεξαρτώμενες νουκλεάσες/ενσωματώματα που προσδένονται στο DNA με τρόπο ανεξάρτητο από την αλληλουχία[81].Αντιπροσωπευτικές πρωτεΐνες Cas2 έχουν χαρακτηριστεί και διαθέτουν είτε (μονόκλωνη) ssRNA-[92] είτε (δίκλωνη) dsDNA-[93][94] ειδική δραστικότητα ενδοριβονουκλεάσης.
Στο σύστημα I-E του E. coli το Cas1 και το Cas2 σχηματίζουν ένα σύμπλοκο όπου ένα διμερές Cas2 γεφυρώνει δύο διμερή Cas1[95].Σε αυτό το σύμπλοκο το Cas2 επιτελεί έναν μη ενζυμικό ρόλο ικριώματος[95] δεσμεύοντας δίκλωνα θραύσματα του εισβάλλοντος DNA, ενώ το Cas1 δεσμεύει τα μονόκλωνα πλευρικά τμήματα του DNA και καταλύει την ενσωμάτωσή τους στις συστοιχίες CRISPR[96][97][98].Οι νέοι αποστάτες προστίθενται συνήθως στην αρχή του CRISPR δίπλα στην αρχηγική αλληλουχία δημιουργώντας ένα χρονολογικό αρχείο των ιικών μολύνσεων[99]. Στην E. coli μια πρωτεΐνη που μοιάζει με ιστόνη και ονομάζεται παράγοντας υποδοχής ενσωμάτωσης (IHF), η οποία συνδέεται με την αλληλουχία ηγέτη, είναι υπεύθυνη για την ακρίβεια αυτής της ενσωμάτωσης[100].Ο IHF ενισχύει επίσης την αποτελεσματικότητα της ενσωμάτωσης στο σύστημα τύπου I-F του Pectobacterium atrosepticum[101], αλλά σε άλλα συστήματα μπορεί να απαιτούνται διαφορετικοί παράγοντες υποδοχής[102].