FASTQ format | |
---|---|
Dateiendung: | .fastq
|
Entwickelt von: | Wellcome Trust Sanger Institute |
Erstveröffentlichung: | ~2000 |
Art: | Bioinformatik |
Erweitert von: | ASCII and FASTA format |
https://maq.sourceforge.net/fastq.shtml | |
Das FASTQ-Format ist ein textbasiertes Format zum Speichern einer biologischen Sequenz (meist Nukleotidsequenz) und ihrer entsprechenden Qualitätskennzahlen. Sowohl der Sequenzbuchstabe als auch die Qualitätskennzahl sind mit einem einzigen ASCII-Zeichen codiert.
Es wurde ursprünglich am Wellcome Trust Sanger Institute entwickelt, um eine Sequenz im FASTA-Format mit ihren Qualitätsdaten zu verbinden und gemeinsam abzuspeichern. Das Format ist aber mittlerweile zum Standard für die Speicherung von high-throughput Sequenzdaten geworden[1].
Eine FASTQ-Datei hat vier Zeilen pro Sequenz:
Eine FASTQ-Datei mit einer einzigen Sequenz kann folgendermaßen aussehen:
@SEQ_ID GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT + !''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65