Az Rfamnem kódoló RNS- (ncRNS-) családokról és más strukturált RNS-ekről szóló információt tartalmazó adatbázis. Jelölt, nyílt hozzáférésű adatbázis, melyet a Wellcome Trust Sanger Institute fejlesztett a Janelia Farmmal együttműködve,[1][2][3][4] és jelenleg a European Bioinformatics Institute működteti.[5] Az Rfam a fehérjecsaládokat leíró Pfamhez hasonlóan működik.
A fehérjékkel szemben az ncRNS-ek másodlagos szerkezete hasonló lehet elsődleges szerkezetükben lévő jelentős hasonlóság nélkül. Az Rfam az ncRNS-eket közös ősük alapján sorolja be. E családok többszekvenciás rendezése (MSA) lehetővé teszi a szerkezetük és működésük megismerését, hasonlóan a fehérjecsaládokhoz. Ezen MSA-k hasznos lehet a másodlagos szerkezetről szóló információ hozzáadásával.[4][6]
Az Rfam számos célra használható. Minden ncRNS-család esetén lehetővé teszi a szekvenciahasonlóságok megtekintését és letöltését, a jelölések olvasását és a családtagok eloszlását fajokban. Ezenkívül irodalmi forrásokra és más RNS-adatbázisokra is vannak linkek. Az Rfam ezenkívül hivatkozásokat is biztosít a Wikipédia számára, lehetővé téve a bejegyzések felhasználók általi létrehozását vagy szerkesztését.
Az Rfam felülete lehetővé teszi ncRNS-ek kulcsszó, családnév, genom, ncRNS-szekvencia vagy EMBL-hozzáférésiszám szerinti keresését.[7] Az adatbázis-információ továbbá használható INFERNAL szoftvercsomaggal.[8][9][10] Az INFERNAL továbbá használható az Rfammel szekvenciák vagy teljes genomok ismert ncRNS-ekkel való homológjainak keresésére.
Az első MSA a „mag”. Ez kézzel ellenőrzött, az ncRNS-család képviselőit szerkezeti információval együtt tartalmazó MSA. Ezt használják fel SCFG létrehozására, melyet az INFERNAL a további családtagok azonosítására és hozzáadására használ. A hamis pozitívok elkerüléséhez családspecifikus küszöbérték használatos.
A 12. verzióig az Rfam BLAST szűrőlépést használt, mivel a profil-SCFG-k túl számításigényesek voltak. Azonban a későbbi INFERNAL-verziók elég gyorsak,[10] így a BLAST-lépés nem szükséges.[11]
A második MSA a „teljes” elrendezés, és a szekvencia-adatbázis kovarianciamodelles keresésével jön létre. Minden észlelt homológot a modellhez rendeznek az automatikusan előállított teljes elrendezést adva.
Az Rfam 1.0 2003-ban jelent meg, és 25 ncRNS-csaláot és 50 000 ncRNS-gént tartalmazott. 2005-ben jelent meg a 379 családban több mint 280 000 gént tartalmazó Rfam 6.1. A 2012 augusztusában megjelent Rfam 11.0 2208, a 2022 novemberében megjelent 14.9 4108 családot tartalmaz.[7]
A miRNS-leíró adatbázis 2004-ben jelent meg. Ez ViennaRNA-t használ a miRNS-ek bázispárosodásának előrejelzésére.[15]
A miRBase 2002-ben jelent meg, célja a miRNS és az NGS ismeretének alkalmazása a miRNS-ek stabil, konzisztens elnevezéséhez. A 21. kiadás (2014) 28 645 prekurzor miRNS-t és 35 828 termék miRNS-t tartalmaz 223 fajból.[16]
Az RNAiFold egyéni és Rfam-alapú RNS-ek tervezését teszi lehetővé.[17] Az RNAiFold 1.0 2013-ban, a 2.0 2015-ben jelent meg,[17] a 3.0 2016 januárjában, a 3.1 2016 márciusában.[18]
A magasabb szintű eukarióták számos ncRNS-ből származó pszeudogént és ismétlődést tartalmaznak. E nem működő anyagok megkülönböztetése a működő ncRNS-től nehéz.[2]
↑ abcGriffiths-Jones S, Bateman A, Marshall M, Khanna A, Eddy SR (2003). „Rfam: an RNA family database”. Nucleic Acids Res.31 (1), 439–41. o. DOI:10.1093/nar/gkg006. PMID12520045. PMC165453.
↑ abcGriffiths-Jones S, Moxon S, Marshall M, Khanna A, Eddy SR, Bateman A (2005). „Rfam: annotating non-coding RNAs in complete genomes”. Nucleic Acids Res.33 (Database issue), D121–4. o. DOI:10.1093/nar/gki081. PMID15608160. PMC540035.
↑ abcGardner PP, Daub J, Tate JG et al. (2008. október 1.). „Rfam: updates to the RNA families database”. Nucleic Acids Research37 (Database issue), D136–D140. o. DOI:10.1093/nar/gkn766. PMID18953034. PMC2686503.
↑ abcGardner PP, Daub J, Tate J, Moore BL, Osuch IH, Griffiths-Jones S, Finn RD, Nawrocki EP, Kolbe DL, Eddy SR, Bateman A (2011). „Rfam: Wikipedia, clans and the "decimal" release.”. Nucleic Acids Res39 (Database issue), D141–5. o. DOI:10.1093/nar/gkq1129. PMID21062808. PMC3013711.
↑ abDaub J, Gardner PP, Tate J, Ramsköld D, Manske M, Scott WG, Weinberg Z, Griffiths-Jones S, Bateman A (2008. december 1.). „The RNA WikiProject: community annotation of RNA families”. RNA14 (12), 2462–4. o. DOI:10.1261/rna.1200508. PMID18945806. PMC2590952.
↑Eddy SR (2002). „A memory-efficient dynamic programming algorithm for optimal alignment of a sequence to an RNA secondary structure”. BMC Bioinformatics3, 18. o. DOI:10.1186/1471-2105-3-18. PMID12095421. PMC119854.
↑Nawrocki EP, Burge SW, Bateman A, Daub J, Eberhardt RY, Eddy SR, Floden EW, Gardner PP, Jones TA, Tate J, Finn RD (2015. január 1.). „Rfam 12.0: updates to the RNA families database”. Nucleic Acids Res43 (Database issue), D130–7. o. DOI:10.1093/nar/gku1063. PMID25392425. PMC4383904.
↑Burge SW, Daub J, Eberhardt R, Tate J, Barquist L, Nawrocki EP, Eddy SR, Gardner PP, Bateman A (2013. január 1.). „Rfam 11.0: 10 years of RNA families”. Nucleic Acids Res41 (Database issue), D226–32. o. DOI:10.1093/nar/gks1005. PMID23125362. PMC3531072.
↑Kalvari I, Argasinska J, Quinones-Olvera N, Nawrocki EP, Rivas E, Eddy SR, Bateman A, Finn RD, Petrov AI (2018. január 1.). „Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families”. Nucleic Acids Res46 (D1), D335–D342. o. DOI:10.1093/nar/gkx1038. PMID29112718. PMC5753348.
↑Kalvari I, Nawrocki EP, Ontiveros-Palacios N, Argasinska J, Lamkiewicz K, Marz M, Griffiths-Jones S, Toffano-Nioche C, Gautheret D, Weinberg Z, Rivas E, Eddy SR, Finn RD, Bateman A, Petrov AI (2021. január 1.). „Rfam 14: expanded coverage of metagenomic, viral and microRNA families”. Nucleic Acids Res49 (D1), D192–D200. o. DOI:10.1093/nar/gkaa1047. PMID33211869. PMC7779021.
↑Sam Griffiths-Jones (2004. január 1.). „The microRNA Registry”. Nucleic Acids Res32 (Database issue), D109–D111. o. DOI:10.1093/nar/gkh023. PMID14681370. PMC308757. (Hozzáférés: 2023. november 24.)
↑Alyssa C. Moore, Jonathan S. Winkjer, Tsai Tien Tseng (2015). „Bioinformatics Resources for MicroRNA Discovery”. Biomark Insights10 (Suppl 4), 53–58. o. PMID26819547. PMC4718083. (Hozzáférés: 2023. november 24.)
↑ abJuan Antonio Garcia-Martin, Ivan Dotu, Peter Clote (2015. július 1.). „RNAiFold 2.0: a web server and software to design custom and Rfam-based RNA molecules”. Nucleic Acids Res43 (Web Server issue), W513–W521. o. DOI:10.1093/nar/gkv460. PMID26019176. PMC4489274. (Hozzáférés: 2023. november 24.)
Ez a szócikk részben vagy egészben a Rfam című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.