Rfam

Rfam

Kategóriabiológiai adatbázis
LicencKözkincs
A Rfam weboldala

Az Rfam nem kódoló RNS- (ncRNS-) családokról és más strukturált RNS-ekről szóló információt tartalmazó adatbázis. Jelölt, nyílt hozzáférésű adatbázis, melyet a Wellcome Trust Sanger Institute fejlesztett a Janelia Farmmal együttműködve,[1][2][3][4] és jelenleg a European Bioinformatics Institute működteti.[5] Az Rfam a fehérjecsaládokat leíró Pfamhez hasonlóan működik.

A fehérjékkel szemben az ncRNS-ek másodlagos szerkezete hasonló lehet elsődleges szerkezetükben lévő jelentős hasonlóság nélkül. Az Rfam az ncRNS-eket közös ősük alapján sorolja be. E családok többszekvenciás rendezése (MSA) lehetővé teszi a szerkezetük és működésük megismerését, hasonlóan a fehérjecsaládokhoz. Ezen MSA-k hasznos lehet a másodlagos szerkezetről szóló információ hozzáadásával.[4][6]

Használata

[szerkesztés]

Az Rfam számos célra használható. Minden ncRNS-család esetén lehetővé teszi a szekvenciahasonlóságok megtekintését és letöltését, a jelölések olvasását és a családtagok eloszlását fajokban. Ezenkívül irodalmi forrásokra és más RNS-adatbázisokra is vannak linkek. Az Rfam ezenkívül hivatkozásokat is biztosít a Wikipédia számára, lehetővé téve a bejegyzések felhasználók általi létrehozását vagy szerkesztését.

Az Rfam felülete lehetővé teszi ncRNS-ek kulcsszó, családnév, genom, ncRNS-szekvencia vagy EMBL-hozzáférésiszám szerinti keresését.[7] Az adatbázis-információ továbbá használható INFERNAL szoftvercsomaggal.[8][9][10] Az INFERNAL továbbá használható az Rfammel szekvenciák vagy teljes genomok ismert ncRNS-ekkel való homológjainak keresésére.

Módszerek

[szerkesztés]
Elméleti ncRNS-egyeztetés 6 fajból. A másodlagosszerkezet-bázispárok blokkokban színezve, és a másodlagos szerkezet konszenzusszakaszában (alul) találhatók a < és > szimbólumok közt.

Az adatbázisban az elsődleges szekvencia és másodlagos szerkezet MSA által képviselt információi a profilok sztochasztikus kontextusmentes nyelvtanaival (SCFG), más néven kovarianciamodellekkel együtt van jelen. Ezek a Pfamben használt fehérjecsalád-jelölés rejtett Markov-modelljeinek analógjai.[1] Az adatbázis családjait két többszekvenciás egyezés képviseli Stockholm-formátumban és egy SCFG.

Az első MSA a „mag”. Ez kézzel ellenőrzött, az ncRNS-család képviselőit szerkezeti információval együtt tartalmazó MSA. Ezt használják fel SCFG létrehozására, melyet az INFERNAL a további családtagok azonosítására és hozzáadására használ. A hamis pozitívok elkerüléséhez családspecifikus küszöbérték használatos.

A 12. verzióig az Rfam BLAST szűrőlépést használt, mivel a profil-SCFG-k túl számításigényesek voltak. Azonban a későbbi INFERNAL-verziók elég gyorsak,[10] így a BLAST-lépés nem szükséges.[11]

A második MSA a „teljes” elrendezés, és a szekvencia-adatbázis kovarianciamodelles keresésével jön létre. Minden észlelt homológot a modellhez rendeznek az automatikusan előállított teljes elrendezést adva.

Története

[szerkesztés]

Az Rfam 1.0 2003-ban jelent meg, és 25 ncRNS-csaláot és 50 000 ncRNS-gént tartalmazott. 2005-ben jelent meg a 379 családban több mint 280 000 gént tartalmazó Rfam 6.1. A 2012 augusztusában megjelent Rfam 11.0 2208, a 2022 novemberében megjelent 14.9 4108 családot tartalmaz.[7]

Fő kiadások és publikációk

[szerkesztés]
  • 2003 - Rfam: an RNA family database.[1]
  • 2005 - Rfam: annotating non-coding RNAs in complete genomes.[2]
  • 2008 - The RNA WikiProject: community annotation of RNA families.[6]
  • 2008 - Rfam: updates to the RNA families database.[3]
  • 2011 - Rfam: Wikipedia, clans and the “decimal” release.[4]
  • 2012 - Rfam 11.0: 10 years of RNA families.[12]
  • 2014 - Rfam 12.0: updates to the RNA families database. [3]
  • 2017 - Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families.[13]
  • 2020 - Rfam 14: expanded coverage of metagenomic, viral and microRNA families.[14]

Rfamet használó szoftverek

[szerkesztés]

A miRNS-leíró adatbázis 2004-ben jelent meg. Ez ViennaRNA-t használ a miRNS-ek bázispárosodásának előrejelzésére.[15]

A miRBase 2002-ben jelent meg, célja a miRNS és az NGS ismeretének alkalmazása a miRNS-ek stabil, konzisztens elnevezéséhez. A 21. kiadás (2014) 28 645 prekurzor miRNS-t és 35 828 termék miRNS-t tartalmaz 223 fajból.[16]

Az RNAiFold egyéni és Rfam-alapú RNS-ek tervezését teszi lehetővé.[17] Az RNAiFold 1.0 2013-ban, a 2.0 2015-ben jelent meg,[17] a 3.0 2016 januárjában, a 3.1 2016 márciusában.[18]

Problémák

[szerkesztés]
  1. A magasabb szintű eukarióták számos ncRNS-ből származó pszeudogént és ismétlődést tartalmaznak. E nem működő anyagok megkülönböztetése a működő ncRNS-től nehéz.[2]
  2. A kovarianciamodellek nem modelleznek intronokat.

Jegyzetek

[szerkesztés]
  1. a b c Griffiths-Jones S, Bateman A, Marshall M, Khanna A, Eddy SR (2003). „Rfam: an RNA family database”. Nucleic Acids Res. 31 (1), 439–41. o. DOI:10.1093/nar/gkg006. PMID 12520045. PMC 165453. 
  2. a b c Griffiths-Jones S, Moxon S, Marshall M, Khanna A, Eddy SR, Bateman A (2005). „Rfam: annotating non-coding RNAs in complete genomes”. Nucleic Acids Res. 33 (Database issue), D121–4. o. DOI:10.1093/nar/gki081. PMID 15608160. PMC 540035. 
  3. a b c Gardner PP, Daub J, Tate JG et al. (2008. október 1.). „Rfam: updates to the RNA families database”. Nucleic Acids Research 37 (Database issue), D136–D140. o. DOI:10.1093/nar/gkn766. PMID 18953034. PMC 2686503. 
  4. a b c Gardner PP, Daub J, Tate J, Moore BL, Osuch IH, Griffiths-Jones S, Finn RD, Nawrocki EP, Kolbe DL, Eddy SR, Bateman A (2011). „Rfam: Wikipedia, clans and the "decimal" release.”. Nucleic Acids Res 39 (Database issue), D141–5. o. DOI:10.1093/nar/gkq1129. PMID 21062808. PMC 3013711. 
  5. Moving to xfam.org. Xfam Blog. (Hozzáférés: 2014. május 3.)
  6. a b Daub J, Gardner PP, Tate J, Ramsköld D, Manske M, Scott WG, Weinberg Z, Griffiths-Jones S, Bateman A (2008. december 1.). „The RNA WikiProject: community annotation of RNA families”. RNA 14 (12), 2462–4. o. DOI:10.1261/rna.1200508. PMID 18945806. PMC 2590952. 
  7. a b Rfam families. rfam.xfam.org
  8. Eddy SR, Durbin R (1994. június 1.). „RNA sequence analysis using covariance models”. Nucleic Acids Research 22 (11), 2079–88. o. DOI:10.1093/nar/22.11.2079. PMID 8029015. PMC 308124. 
  9. Eddy SR (2002). „A memory-efficient dynamic programming algorithm for optimal alignment of a sequence to an RNA secondary structure”. BMC Bioinformatics 3, 18. o. DOI:10.1186/1471-2105-3-18. PMID 12095421. PMC 119854. 
  10. a b Nawrocki EP, Eddy SR (2013). „Infernal 1.1: 100-fold faster RNA homology searches”. Bioinformatics 29 (22), 2933–5. o. DOI:10.1093/bioinformatics/btt509. PMID 24008419. PMC 3810854. 
  11. Nawrocki EP, Burge SW, Bateman A, Daub J, Eberhardt RY, Eddy SR, Floden EW, Gardner PP, Jones TA, Tate J, Finn RD (2015. január 1.). „Rfam 12.0: updates to the RNA families database”. Nucleic Acids Res 43 (Database issue), D130–7. o. DOI:10.1093/nar/gku1063. PMID 25392425. PMC 4383904. 
  12. Burge SW, Daub J, Eberhardt R, Tate J, Barquist L, Nawrocki EP, Eddy SR, Gardner PP, Bateman A (2013. január 1.). „Rfam 11.0: 10 years of RNA families”. Nucleic Acids Res 41 (Database issue), D226–32. o. DOI:10.1093/nar/gks1005. PMID 23125362. PMC 3531072. 
  13. Kalvari I, Argasinska J, Quinones-Olvera N, Nawrocki EP, Rivas E, Eddy SR, Bateman A, Finn RD, Petrov AI (2018. január 1.). „Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families”. Nucleic Acids Res 46 (D1), D335–D342. o. DOI:10.1093/nar/gkx1038. PMID 29112718. PMC 5753348. 
  14. Kalvari I, Nawrocki EP, Ontiveros-Palacios N, Argasinska J, Lamkiewicz K, Marz M, Griffiths-Jones S, Toffano-Nioche C, Gautheret D, Weinberg Z, Rivas E, Eddy SR, Finn RD, Bateman A, Petrov AI (2021. január 1.). „Rfam 14: expanded coverage of metagenomic, viral and microRNA families”. Nucleic Acids Res 49 (D1), D192–D200. o. DOI:10.1093/nar/gkaa1047. PMID 33211869. PMC 7779021. 
  15. Sam Griffiths-Jones (2004. január 1.). „The microRNA Registry”. Nucleic Acids Res 32 (Database issue), D109–D111. o. DOI:10.1093/nar/gkh023. PMID 14681370. PMC 308757. (Hozzáférés: 2023. november 24.) 
  16. Alyssa C. Moore, Jonathan S. Winkjer, Tsai Tien Tseng (2015). „Bioinformatics Resources for MicroRNA Discovery”. Biomark Insights 10 (Suppl 4), 53–58. o. PMID 26819547. PMC 4718083. (Hozzáférés: 2023. november 24.) 
  17. a b Juan Antonio Garcia-Martin, Ivan Dotu, Peter Clote (2015. július 1.). „RNAiFold 2.0: a web server and software to design custom and Rfam-based RNA molecules”. Nucleic Acids Res 43 (Web Server issue), W513–W521. o. DOI:10.1093/nar/gkv460. PMID 26019176. PMC 4489274. (Hozzáférés: 2023. november 24.) 
  18. Juan Antonio Garcia-Martin: Github - clotelab/RNAiFold: A constraint programming algorithm for RNA inverse folding and molecular design

Fordítás

[szerkesztés]

Ez a szócikk részben vagy egészben a Rfam című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

További információk

[szerkesztés]