Archivo de texto | ||
---|---|---|
Información general | ||
Extensión de archivo |
.txt, .text | |
Tipo de MIME |
text/plain | |
Formato abierto | ||
Un archivo de texto simple, texto sencillo o texto sin formato (también llamado texto plano o texto simple; en inglés «plain text»), es un archivo informático que contiene únicamente texto formado solo por caracteres que son legibles por humanos y carece de cualquier tipo de formato tipográfico.[1]
Estos archivos están compuestos de bytes que representan caracteres ordinarios como letras, números y signos de puntuación (incluyendo espacios en blanco), también incluye algunos pocos caracteres de control como tabulaciones, saltos de línea y retornos de carro. Estos caracteres se pueden codificar de distintos modos. El sistema de codificación ASCII viene a ser la base primordial y no necesita de un identificador explícito en la comunicación digital. Para poder representar diferentes sistemas de codificación de caracteres como UTF-1, UTF-7, UTF-8, UTF-16, UTF-32, UTF-EBCDIC, SCSU, BOCU-1 y GB 18030 es necesario que haya al principio de cada fichero de texto una marca de orden de bytes.
Los archivos de texto plano carecen de información destinada a generar formatos (negritas, subrayado, cursivas, tamaño, etc.)[2] y tipos de letra (por ejemplo, Arial, Times, Courier, etc.).[2] Esta simplicidad permite que una gran variedad de programas pueda leer y editar ese contenido. Las aplicaciones destinadas a la escritura y modificación de archivos de texto se llaman editores de texto. Cada texto tiene un peso diferente porque tiene una codificación distinta.
Los documentos de texto plano son legibles por humanos -a diferencia de los archivos binarios- , son usados en ocasiones por ciertos programas como una forma de almacenamiento de los datos. La ventaja que este tipo de ficheros ofrece, además de la interoperabilidad (ya que es un formato universal), es que un usuario puede acceder a los datos y modificar las variables para personalizar el programa.
Adicionalmente, cuando ocurre algún tipo de corrupción de datos, es más fácil para una persona arreglar problemas en un archivo de texto que en uno binario. Algunos formatos de texto (como XML) tienen mecanismos incluidos para especificar la codificación del documento, pero la gran mayoría de formatos no lo tiene. Como contrapartida, cualquier usuario podría leer y modificar el valor de las variables a su antojo, o aleatoriamente o por equivocación, siendo impredecibles los efectos sobre el programa.
Un inconveniente de los archivos de texto es que no hay forma segura de saber a priori qué codificación se utilizó para guardarlo. Un programa editor de texto puede grabar un archivo en UTF-8, pero un compilador puede esperar un formato ISO-8859; al tratar de compilar el archivo generará errores en el programa. El problema es aún más complejo en el caso de ficheros transmitidos a través de redes informáticas, en las que una identificación errónea de la codificación de los archivos de texto puede dar lugar a multitud de errores.
La costumbre ha hecho que los archivos de texto se nombren con la extensión .txt, aunque pueden tener cualquier otra a capricho del usuario (son válidas y habituales: .inf, .80, .dat, etc.)[cita requerida]
Es recomendable no usar para un archivo de texto plano extensiones que, estando muy difundidas y siendo muy conocidas, pueden confundir tanto al usuario como al propio sistema operativo, como por ejemplo .xls, .doc, .ppt, .wav, .gif o .jpg, aunque no hay ningún impedimento real si se quieren utilizar.
En sistemas Unix y GNU/Linux las convenciones de nombres de archivos son más relajadas. La extensión .txt se ha hecho popular en los últimos tiempos, pero habitualmente el contenido del archivo se determina con programas que examinan los primeros bytes, como por ejemplo el comando "file".