Файл

Списък с файлове, показани във файловия мениджър Dolphin

Файл в информационните технологии представлява организиран ресурс на информация, предназначен за ползване от компютърна програма. Файловете позволяват разглеждането на данните като една неделима структура и по този начин улесняват работата с тях – съхранение, четене, промяна, преместване, изтриване и др. Съхраняват се като последователност от байтове, върху определен носител на информация (твърд диск, компакт диск, флаш устройство), така че са достъпни за ползване и от други програми, а не само от тази, която ги е създала. Всеки файл съхранява точно определен вид информация (компютърна програма, текст, картинка, музика и т.н.). Текстовият файл например може да се разглежда като аналог на хартиен документ.

Програмите, които позволяват извършване на операции с файлове (създаване, преместване, изтриване, копиране и др.) се наричат файлови мениджъри.

Група перфокарти

Името произлиза от английското file (папка) и е използвано за първи път в контекста на компютърно съхранение на информация през 1950 г. Американската компания RCA го използва при описанието на вакуумна лампа, която може да се използва като компютърна памет.[1]. През 1952, file се използва за информацията, съхранена върху перфокарти.[2]

Една от първите многозадачни операционни системи Compatible Time-Sharing System въвежда концепцията за файлова система, с която се управлява записът и четенето от компютърната памет и това значение на термина се е запазило и до днес. При нея името на файла се състои от две части – същинско име и разширение, указващо файловия формат.[3][4]

Тази конвенция е в сила и до днес и се използва от редица операционни системи, включително Microsoft Windows.

Файловата система представлява съвкупност от файлове и информация, която описва определени характеристики на всеки от тях. Целта на файловата система е да позволи подредба на файловете с цел по-лесно откриване. Има много файлови системи – те се различават по начина, по който се осъществява подредбата на файловете и по допълнителните характеристики, които се пазят за всеки файл. Тези характеристики могат да включват вид, права за достъп, размер, дата на последна промяна и др. Файловите системи обикновено подреждат файловете в структура, наречена Файлово дърво. Има различни файлове според функциите си във файловата система. Най-често се срещат:

  • Същински файл (regular file) – Съхранява информация, която директно се ползва от потребителя.
  • Директория (directory) – Съхранява списък с имена на файлове и препратки към самото съдържание на файловете.
  • Мека връзка (soft link) – Съхранява препратка към друг файл.

Името на файла представлява последователност от символи. То се използва, за да се различават файловете един от друг и често предоставя някаква информация за съдържанието или предназначението на файла. Един файл може да бъде достъпен под 1 или повече имена. Всяко име на файла се нарича hard link. Някои компютърни програми третират файловете по различен начин в зависимост от имената им:

  • Символите след последната точка в името на файла се използват, за да покажат типа му. Понякога тези символи се наричат разширение на файла. Например:
При файла photo.jpeg символите след последната точка са jpeg. Те показват, че файлът е от тип image/jpeg. Това означава, че файлът е картинка във формат JPEG.
  • Точка (.) в началото на името на файла показва, че файлът е скрит. Такива файлове могат да не бъдат показвани при определени условия. Например:
Файлът .bashrc е скрит и не се показва, освен ако не е зададено показване на скрити файлове.
  • Тилда (~) в края на името на файла показва, че файлът е резервно копие на друг файл (обикновено той се именува по същия начин, но без тилда). Например:
Файлът status~ е резервно копие на файла status.

Типът (форматът) на файла се определя от информацията, която се съхранява в него. Необходимо е типът да се знае, за да може файлът да се чете, променя. Обикновено програмите сами определят типа на даден файл, но понякога е необходимо потребителят да направи това. Има няколко техники за определяне на типа на файл. Обикновено програмите използват комбинация между няколко от тях:

  • По името на файла – в зависимост от символите след последната точка от името (разширение – виж файлов формат).
  • По съдържанието на файла – в зависимост от първите няколко байта от съдържанието на файла (магическо число).
  • По подаден MIME тип – понякога, когато файловете се пренасят през компютърна мрежа заедно със съдържанието се предава и т. нар. MIME тип (понякога наричан Internet media type) – кратък текст, който описва съдържанието на файла.
  • По код на типа – някои файлови системи съхраняват информация за типа на всеки файл (например HFS в операционната система MacOS).

С помощта на приложната програма file, в UNIX системи може да се определи типа на файла. При извикване на програмата с аргумент име на файл, тя изписва на стандартния изход информация за файла. Например:

$ file photo.jpeg
photo.jpeg: JPEG image data, JFIF standard 1.01

Съдържание на файл

[редактиране | редактиране на кода]

Съдържанието на файла се различава в зависимост от типа му – в най-простия случай то се състои само от същински данни. Някои файлове имат освен същински данни и т. нар. заглавна част (header) или крайна част (footer). Те служат за описание на определени характеристики на файла, специфични за типа му. Например за едно изображение заглавната част може да съдържа размер и брой цветове, а за звуков файл – изпълнител и име на песен. Файловете се разделят на две основни категории – текстови и двоични. Текстовите файлове се разглеждат като последователност от редове, като всеки ред се състои от символи. Те се използват за съхраняване на неформатиран текст. Двоичните (бинарните) файлове се разглеждат по определени правила в зависимост от типа си. Те могат да се използват за съхраняване много различни видове данни.

Представляват последователност от редове. Всеки ред се състои от символи, значението на които се определя от специална таблица, наречена кодова таблица. Редът винаги трябва да завършва със знак за нов ред. Този знак може да бъде представен като един или няколко символа в зависимост от операционната система. Един символ може да се състои от 1, 2, 3 или 4 байта.

Има различни кодови таблици. За да бъде прочетен един текстов файл правилно, за него трябва да бъде използвана правилната кодова таблица. Обикновено програмите откриват правилната кодова таблица автоматично, но понякога е необходимо потребителят да посочи необходимата таблица. Различните кодови таблици имат различни възможности. Най-проста таблица е ASCII. За да могат да се поддържат писмености, различни от латиницата и някои специални символи е създаден стандарта Unicode. Съществуват няколко негови реализации, като най-популярна е кодовата таблица UTF-8.

Текстовите файлове често се използват за конфигурационни файлове или текстови документи (например HTML документ). Понякога за обозначаване на текстов файл се ползва име, завършващо на .txt, .html, .xml, .c и др.

Двоични (бинарните) файлове са всички файлове, които не се разглеждат като последователност от редове. Съдържанието на един двоичен файл може да бъде изградено по различни правила в зависимост от типа на файла. За да бъде разчетен правилно файлът е необходимо да се използва специална програма, която разбира този тип съдържание.

Файлове с изображения

[редактиране | редактиране на кода]

Един такъв файл съхранява картинка. Според начина, по който е описана картинката изображенията могат да бъдат растерни и векторни. Растерните изображения се описват като таблица от точки, като всяка точка има определен цвят. Такива изображения могат да се променят лесно, но при промяната на размера им, качеството се влошава. Векторните изображения се описват като съвкупност от обекти – точки, отсечки, полигони и др. Такива изображения са по-трудни за промяна, но при промяна на размера им качеството не се променя. Някои изображения могат да съдържат анимирани картинки, прозрачни или частично прозрачни области и др. Най-често срещаните типове изображения са JPEG, PNG, GIF и SVG.

Съхранява звукова информация. Най-често срещаните типове са: midi, Ogg Vorbis, mp3 и wav.

Съхранява визуална и звукова информация. Най-често срещаните типове са: Ogg Theora, mpeg, avi и wmv.

Форматиран документ

[редактиране | редактиране на кода]

Съхранява съвкупност от текст, картинки, таблици и друга информация. Може да бъде направен с помощта на специална програма (например Writer от пакета Open Office, MS Word, Adobe Acrobat и др.). Най-често срещаните типове форматирани документи са PDF и OpenDocument.

Архивът представлява файл, който съхранява съвкупност от файлове и информация за всеки от тях. Този метод за съхранение се използва когато е необходимо множество файлове да се пренесат наведнъж. Някои архиви са компресирани, което значи, че е приложен специален механизъм, за да заема архивът по-малко пространство. Най-често срещаните типове архиви са tar, zip и rar.

Изпълним файл представлява файл, чието съдържание описва дадени инструкции, които могат да бъдат извършени (изпълнени) от компютъра. Някои видове инструкции могат да бъдат разбрани и изпълнени от операционната система, а за други се разбират и изпълняват от специализиран приложен софтуер, наричан интерпретатор или виртуална машина. Понякога думата програма се използва като синоним на изпълним файл. В началото на съдържанието на изпълнимите файлове се записва, че са изпълними и по какъв начин трябва да бъдат изпълнени. Изпълнимите файлове могат да бъдат както текстови, така и двоични.

При някои операционни системи в правата за достъп във файловата система се записва от кои потребители могат да изпълняват файла, а при други в края на името на файла се записва разширение, което показва, че файлът е изпълним (например .exe или .bat).

  1. Popular Science Magazine, February 1950, page 96. Books.google.com. Посетен на 7 март 2014.
  2. Robert S. Casey, et al. Punched Cards: Their Applications to Science and Industry, 1952.
  3. Fernando J. Corbató et al. "An Experimental Time-Sharing System." 3 май 1962.
  4. Jerome H. Saltzer CTSS Technical Notes. Project MIT-LCS-TR016