Web-orrien editoreak HTML edo XHTML motako dokumentuen sorrera eta edizioa errazteko diseinatutako aplikazioak dira. Web-orri bateko HTML markaketa edozein testu-editorerekin egin daitekeen arren, HTML-editore espezializatuek erosotasun eta funtzionaltasun erantsiak eskaini ditzakete. Izan ere, HTML-editore askok ez dute HTML markaketa-lengoaia soilik erabiltzen, CSS, XML eta JavaScript edo ECMAScript moduko teknologiak ere erabiltzen dituzte. Kasu batzuetan, urrutiko web-zerbitzarietarako komunikazioa (FTP eta WebDAV bidez, adibidez) eta bertsioen kontrolerako sistemak (Subversion edo Git kasu) ere kudeatzen dituzte.
Bi motakoak daude: formatu gabeko testu-editoreak eta WYSIWYG ("What You See Is What You Get") editoreak.[1]. Online editoreak ere badaude: Google Sites, Weebly, etab.
Testu lau motako editoreak direla ere esan ohi da, testu-editore hauek ez dutelako aldez aurretik ezarritako formatu finkorik. Windows-eko “Bloc de Notas” edo "Notepad" editorea, adibidez, testu lau motako editore bat da, nahiz eta ez den oso erabilia web-orrien ediziorako. Formatu gabeko testu-editoreetan zuzenean idatzi behar dira web-orri bat diseinatzeko beharrezkoak diren aginduak.
Edizioan laguntzeko, badira sintaxia nabarmentzen[2] duten aplikazioak, edota txantiloiak, tresna-barrak, eta teklatu-lasterbideak eskaintzen dituztenak ere. Horiei esker, HTML markaketa-lengoaiako elementu eta egitura komunak azkar txerta daitezke. Gainera, mota honetako editoreetan beste hainbat tresna integratzea posible izaten da bertsioen kontrola kudeatzeko, esteken zuzentasuna egiaztatzeko, zuzenketa ortografikoa egiteko, web-orrien FTP edo WebDAV bidezko karga errazteko, etab. Horietako funtzio batzuk, esteken zuzentasuna egiaztatzea kasu, sareko konexioa eskatzen dute.
Testu-editoreen bidez web-orriak sortzeko beharrezkoa gertatzen da erabiltzaileak HTML markaketa-lengoaia edota CSS eta JavaScript ondo ezagutzea. Zeregin horretan laguntzeko, editore batzuk kolore-nabarmenketa eskaintzeaz gain aukera ematen diote erabiltzaileari HTML-markaketa modu antolatuagoan editatzeko. Horrela, adibidez, paleta-leihoak edo elkarrizketa-koadroak erabiltzeko aukera eman ohi dute eremu indibidualetan parametroak editatzeko edo pantailan inprimaki bat betez etiketa berriak txertatzeko. Funtzio gehigarriak ere izaten dira irudi baten aurretiko ikuspegia erakusteko, adibidez.
WYSIWYG (“What You See Is What You Get”)-en akronimoa da. Euskaraz "Ikusten duzuna da lortzen duzuna" moduan itzul genezake. Mota honetako editoreek dokumentuaren emaitza ikuspegia erakusten dute uneoro. LibreOffice Writer edo Microsoft Word editoreak, adibidez, filosofia honetan oinarritzen diren editore ezagunak dira. Mota honetako HTML-editore batzuk: Nvu, KompoZer
WYSIWYG motako web-editoreek ediziorako interfaze bat eskaintzen dute, edizio-prozesu osoan zehar sortze-bidean dagoen web-orriaren aurretiko bista erakusteko. WYSIWYG motako web-editoreekin ez da beharrezkoa HTML markaketa-lengoaia ezagutzea. Hori dela eta, web-orrien edizioan esperientziarik ez duten erabiltzaileentzat errazagoak gertatzen dira. Izan ere, erabiltzaileak ez ditu HTML markaketa-lengoaiaren etiketak zuzenean editorean tekleatu behar. Horren ordez, nahikoa da testua idaztea eta ondoren formatua ematea edota irudiak txertatzea, LibreOffice Writer edo Microsoft Word editoreetan, adibidez, egin ohi den antzera lan eginez.
WYSIWYG motako web-editoreek erakusten duten aurretiko bista hori txertatua duten diseinu-motor baten bidez lortzen da. Pertsonalizatua izan daiteke edo web-nabigatzaile batean erabilitako batean oinarritua izan. Web-orria renderizatua izan ondoren web-nabigatzaile tipiko batean ikusiko litzatekeen moduan erakustea da motor horien helburua.
WYSIWYG motako editoreen paradigma alternatiboa WYSIWYM (“What You See Is What You Mean”) edo euskaraz "Ikusten duzuna da esan nahi duzuna" da. Filosofia horri jarraitzen dioten editoreek erabiltzailearen arreta dokumentuaren edukian egotea da, eta ez formatuan edo itxura kontuetan. Horregatik editatzen dira zuzenean aginduak, eta aginduen bidez adierazten dira, adibidez, dokumentuaren orri-buruak, atalak, paragrafoak, etab. Editorean aginduak ikusten ditu erabiltzaileak baina haien eragina behar bezala erakusten da nabigatzailean.
World Wide Weberako estandarrak sortzen dituen erakundea da World Wide Web Consortium (W3C), eta HTML markaketa-lengoaiaren bidez sortutako web-orriek W3Cren estandarrak bete ditzaten, idazteko moduari buruzko zenbait arau bete behar dira. Arau horiek jarraitzeak esan nahi du webguneak eskuragarri egongo direla ordenagailu-mota guztietan, baita haririk gabeko gailuetan ere (telefono mugikor edo PDA) nahiz eta haien banda-zabalera eta pantailaren tamaina mugatua izan. Desgaitasunak dituzten pertsonentzat ere irisgarri izan beharko lukete web-orriek. Hala ere, Internet sarean dauden HTML dokumentu askok ez dituzte W3Cren estandarrak betetzen. 2011ean egindako azterlan batean, 350 webgune ezagunenak (Alexa indizearen bidez aukeratutakoak) aztertu ziren, eta %94ak ez zituzten estandarraren testak gainditu.
Gerta daiteke sintaktikoki zuzenak diren dokumentuak eraginkorrak ez izatea, gaur egun zaharkituak geratu diren arauetan oinarrituz sortuak izan zirelako, adibidez. CSSren eta HTMLren erabilerari buruz W3C elkartzeak eman zituen lehen gomendioak 1996koak dira, eta berrikusiak eta finduak izan dira ordutik hona (ikus CSS, XHTML, W3Cren egungo CSS gomendioa, W3Cren egungo HTML gomendioa).[3]
Web-orrien ediziorako gomendioek web-orrien edukia (HTML edo XHTML) eta estiloa (CSS) ondo bereiztu behar direla azpimarratzen dute. Bereizketa hori egiteak duen abantaila honakoa da: webgune bat diseinatzean, estiloari buruzko informazioa behin bakarrik ematen da, ez web-orri guztietan edo HTML-elementu bakoitzean errepikatuta. WYSIWYG motako editoreen diseinatzaileak euren erabiltzaileei kontzeptu hori ahalik eta ondoen azaltzen saiatu izan dira, eta filosofia horri jarraitzen dioten gaur egungo editore moderno gehienek neurri batean arrakasta lortu dute, arrakasta erabatekoa ez bada ere.
Desgaitasun fisikoak, ikusteko desgaitasuna edo bestelakoak dituzten pertsonentzat web-orriak irisgarriak izatea ideia ona izateaz gain betebehar bat ere bada. Gaur egungo gizarte modernoan webguneek duten lekua eta garrantzia kontuan izanik, herrialde batzuetan (AEB eta Erresuma Batua, adibidez) webguneek irisgarritasun arauak betetzea legez derrigortutako zerbait da.
Egia esan, web-orriak diseinatzeko, sortzeko eta mantentzeko erabiltzen den software-tresna edozein dela ere, oinarrian dagoen HTML-markaketaren kalitatea orrialdean lan egiten duen pertsonaren trebetasunaren araberakoa da. HTML, CSS eta bestelako teknologiak ezagutzeak eta W3C erakundearen estandarrak eta gomendioak ezagutzeak edozein diseinatzaileri web-orri hobeak ekoizten lagunduko diote, noski, WYSIWYG paradigman oinarritutako web-editore bat erabilita izan edo beste batekin izan.
HTML-lengoaia ez dago pentsatuta informazio onaren eta txarraren arteko bereizketa egiteko. Bilatzaileek dokumentu bat lehenengo posizioan erakusten dutenean, ez da kalitate altuenekoa delako. HTML-etiketa gehienak testuaren egitura eta itxura deskribatzeko dira, gizakiak dokumentua irakurtzean testua modu egokian ikusi eta ulertu ahal ditzan. Etiketak ez daude pentsatuta makinek dokumentuen tratamendu automatikoa hobeto edo errazago egiteko.[4]
Bilaketa-motorrak makinak dira eta etiketetan oinarritzen dira bilatu behar dutena eskuratzeko. Baina etiketek ez dute informazio nahikorik ematen bilaketa ona izango dela bermatzeko. Hori dela eta, esanahi desberdineko hitzaren agerpenak dituen bi dokumenturen arteko bereizketa egitea oso zaila izan daiteke. "Java" hitzak, adibidez, uharte bat adieraz dezake edo programazio-lengoaia bat. "Java" hitzaren agerpenak dituzten dokumentuak hitzaren zein esanahiri dagozkion bereiztea zaila da bilatzailearentzat. WWWeko dokumentuen semantika jasotzea, Web semantikoa alegia, HTML-etiketetatik haratago doa, dudarik gabe. World Wide Web-aren sortzaile den Tim Berners-Leek bera ari da arazo horri konponbidea bilatu nahian. W3C erakundea azkenaldian gehien lantzen ari den gidalerroetako bat, hain zuzen ere, web semantikoarena da.
HTML-markaketak dokumentuak eta haien arteko loturak deskribatzeko balio du. Web semantikoan, aldiz, objektuak, pertsonak eta horrelakoak, eta haien arteko erlazioak deskribatzen dira. Etiketek orriaren itxura eta egitura azaldu beharrean, orriko elementuen esanahia etiketatzen da. Web semantikoan etiketa jakin batzuk leudeke, adibidez, musika-taldeak deklaratu eta deskribatzeko, beste batzuk pertsonak deklaratu eta deskribatzeko, beste batzuk pertsona batzuek musika talde bat osatzen dutela deskribatzeko, eta horrela gauza guztiekin. Beraz, web semantikoa izango litzateke pertsonentzat kodetzen den HTML sarearekin batera existituko litzatekeen sare paralelo bat, makinek ulertzeko moduko ezagutza-base bat, semantika adierazteko formatuetan kodetua. Lengoaia naturaleko webaz gain, testu egituratuko beste bat izango genuke. Ezagutzaren errepresentazio hori makinek ulertu ahal izango lukete, modu eraginkorrean tratatu, ezagutza berria inferitu...
Sarean dauden kontzeptu guztiak definitzeko, etiketatze-semantikoko eskema eta formatuak behar dira. W3C erakundeak formatu horiek definitu ditu hainbat estandarretan; RDF eta OWL dira garrantzitsuenak eta ezagunenak.[5]
RDF ("Resource Description Framework") baliabideak deskribatzeko balio duen formatu bat da, XMLn oinarritua. Hiru elementutan oinarritzen da: baliabideak, propietateak eta propietateen balioak. Baliabidea deskribatuko den hori da, eta URL batez (web identifikatzaile edo helbide batez) identifikatzen da. Propietatea baliabidearen ezaugarri bat da, deskribatu nahi dena. Eta balioak deskribatu nahi diren ezaugarrien balio konkretuak dira, horrela nahi duguna deskriba dezakegu. RSS ("Really Simple Syndication") formatua izatez RDF mota bat da (jatorrizko izena RDF Site Summary da), albisteak deskribatzen espezializatutakoa. Blogak teknologia honetan oinarritzen dira. Web 2.0ren iraultzaren benetako "errudunetako" bat RSSa izan zen.
OWL ("Web Ontology Language") lengoaiak gauza-mota bakoitza (pertsonak, musika taldeak, liburuak...) deskribatzeko erabili beharreko etiketetan ados jartzen laguntzen du. OWLk ezagutza-arlo edo bizitzaren esparru jakin bateko objektu edo entitateak nola deskribatuko diren definitzea ahalbidetzen du.
Ez da lan erraza, batetik, existitzen diren kontzeptu guztientzako ontologiak definitu eta adostu behar dira, eta, hainbat gauza jada egin diren arren, lan ikaragarria da. Baina, bestetik, gero edukia formatu horietan sortu behar da, eta hori oso neketsua izan daiteke. Webguneak tresnak erabiliz sortzen dira aspalditik, eta tresna horiek izan beharko dira egokitu eta edukia formatu semantikoan ere sortuko dutenak, blog-plataformek zuzenean RSSa ere publikatzen duten bezala.
Web semantikoa ez bezala, mikroformatuak ez dira World Wide Web edo sarearen etorkizuna gidatzen duen W3C erakundearen eta haren zuzendari eta Web-aren asmatzaile den Sir Tim Berners Lee-ren ekimen bat, internauten artean sortutako mugimendu bat baizik. Mikroformatuaren helburua web semantikoa iritsi bitartean ideia beraren gainean aurrerapausoak ematea da. Web semantikoarekiko paraleloan sortutako ekimen bat da.[6]
Web semantikoan, sare paralelo bat eraikitzea proposatzen da, esanahia adierazteko formatu egituratuetan kodetutakoa, eta, sare paralelo horretan, bestean aipatzen diren objektu, pertsona eta abar guztiak eta euren arteko erlazioak deskribatuko lirateke. Mikroformatuen mugimenduan, aldiz, kontzeptu jakin batzuk soilik etiketatzen dira semantikoki, erabilienak eta praktikoenak alegia, eta HTML-n dagoen egungo webaren baitan. Horretarako, HTML formatuak dituen etiketa eta atributu generiko batzuez baliatzen dira: div etiketa (orriko atalak ezberdintzeko erabilia), span etiketa (testu baten zatiak nabarmentzeko erabilia), class atributua (edozein elementu zein motatakoa den deskribatzeko erabilia) eta rel atributua (erlaziozko elementuetan erlazio mota definitzeko erabilia). Hala, etiketa horiei class eta rel atributuen balio jakin batzuk emanez definitzen da mikroformatu bat.
Mikroformatuen mugimendua ez da estandarrak definitzeko erakunde bat; beraien webgunearen bidez koordinatzen den komunitate ireki bat besterik ez da. Horko wikiak, posta-zerrendak eta abarrak erabiltzen dituzte mikroformatuak definitzeko, berriak sortzeko, eztabaidatzeko eta abarretarako, eta modu horretan definitu dituzte egun existitzen diren mikroformatuak. Beraz, webgune bat kudeatzen badugu, webgune horretako hainbat gauza (kontaktu-informazioa, ekitaldien egutegia...) mikroformatu bidez kodetu ditzakegu. Webgunearen HTML-kodean edo programazioan zuzenean egin dezakegu, baina, bestela ere, gero eta web-garapeneko tresna gehiagok ematen dute aukera mikroformatuak kodetzeko: Drupal, Wordpress, Dreamweaver... Eta balidatzaileak ere badaude, ongi egin ditugun ikusteko.
Badaude hainbat zerbitzu mikroformatuak erabiltzen dituztenak. Bilatzaile nagusiek lizentzia libreko edukiak bilatzea ahalbidetzen dute, rel-license mikroformatua erabiltzen duten webguneei esker. Google-k berriki jakinarazi du webguneetan hCard, hReview eta hProduct mikroformatuak detektatuko dituela, bilaketa-emaitza aberatsagoak eskaintzeko (Yahoo!-k egiten du hori, duela urtebetetik baino gehiagotik). Eta Firefox nabigatzaileak badu Operator izeneko plug-in bat, nabigatzen ari garen orrietan mikroformatuak detektatzen dituena; eta, haiekin, eragiketa aurreratuak egiten uzten digu: ekitaldiak gure agendara gehitu, kontaktu-informazioa automatikoki gure helbide-zerrendan sartu, koordenatu geografiko bat gure Tagzania-ko kontura eraman... Laster, horrelako aukerak zuzenean nabigatzailean integratuta etorriko dira.