La nòrma TEI es un ensemble de preconizacions (TEI Guidelines[1]) qu'especifican de metòdes d'encodatge pels tèxtes que las maquinas pòdon legir, mai que mai en lingüistica e en sciéncias umanas e socialas.
Aquelas preconizacions son redigidas per la TEI (Text encoding initiative[2]), un consòrci que desvolopa e manten d'un biais collectiu de nòrmas per la representacion de tèxtes jos la forma numerica. Es una organizacion a tòca pas lucrativa compausada d'institucions academicas, de còlas de recèrca e d'especialistas individuals del monde tot[3].
Dempuèi la version P4, la TEI es un jos-format del lengatge XML[4]. Aquel utiliza de balisas qu'enquadran un tròç de tèxte e lo qualifican. Aquelas balisas pòdon aver d'atributs, obligatòris o facultatius, que precisan la qualificacion.
Ex. : <pron notation="IPA">trænskrɪpʃən</pron>
La balisa <pron> enquadra lo mot "trænskrɪpʃən", indicant qu'es una prononciacion. L'atribut "notacion", qu'a coma valor "IPA", indica qu'aquela prononciacion es transcriuta en Alfabet Fonetic Internacional.
Las TEI Guidelines an agut mantuna version :
La version utilizada uèi es la TEI P5 v2.0.1, publicada en 2011.
Definís un cèrt nombre de balisas adaptadas a l'etiquetatge de tèxtes numerics. Per cada balisa, prepausa d'unes atributs e balha d'exemples de valors que pòdon préner.
Aquelas balisas son amassadas dins de moduls que correspondan a las diferentas utilizacions que se pòdon far de la TEI (poesia, transcripcions de discorses, diccionaris, manuscrits...).
Aquelas Guidelines son publicadas en open source. I podèm accedir en linha[6], ne telecargar una version pdf[7] o ebook[8], ne far una còpia locala... D'efièit, la TEI vòl èstre un format obèrt que cadun pòt adaptar a sos projèctes[9]
Numeroses projèctes dins lo monde an causit la TEI per encodar los lors tèxtes. Podèm citar :