Aquest article o secció necessita millorar una traducció deficient. |
URL | https://archive.is/, https://archive.ph/, https://archive.vn/, https://archive.fo/, https://archive.md/, https://archive.li/, http://archiveiya74codqgiixo33q62qlrqtkgmcitqx5u2oeqnmn5bpcbiyd.onion/ i https://archive.today/ |
---|---|
Tipus | lloc web, arxiu web i extensió del navegador |
Llengua | múltiples llengües |
Llançament | 16 maig 2012 |
Estat | Txèquia |
Rànquing Alexa | 9.725 (15 juny 2021) 277.525 (15 juny 2021) 17.117 (15 juny 2021) 55.370 (15 juny 2021) 46.722 (15 juny 2021) 112.690 (15 juny 2021) 246.870 (15 juny 2021) |
Blog oficial | https://blog.archive.today/ |
archive.today (abans archive.is) és un lloc web que emmagatzema instantànies de pàgines web.[1] Recupera una pàgina de manera similar a WebCite, de menys de 50 MB cadascuna, però amb suport per a llocs pesants de JavaScript com Google Maps i aplicacions web com Twitter.
Archive.today registra simultàniament dues "instantànies" diferents d'una pàgina web. Una és la "pàgina web" que inclou els enllaços en viu funcionals que es troben a l'original. L'altra és "captura de pantalla" que proporciona una visualització estàtica i no interactiva de la representació.[2]
Archive.today pot capturar pàgines individuals en resposta a peticions explícites de l'usuari.[3][4][5] Des del seu inici, Arxiu. Avui és compatible amb el rastreig de pàgines amb URL que contenen un fragment de hash-bang obsolet (#!).[6]
Archive.today només registra text i imatges, excloent el vídeo, XML, RTF, full de càlcul (xls o ods) i altres continguts no estàtics. Realitza un seguiment de l'historial de les instantànies desades, retornant a l'usuari una sol·licitud de confirmació abans d'afegir una nova instantània d'una adreça d'Internet ja desada.[7]
Les pàgines es capturen amb 1024 píxels d'amplada del navegador. CSS es converteix en CSS en línia, eliminant el disseny web responsiu i selectors com :hover
i :active
. El contingut generat amb JavaScript durant el procés de rastreig apareix en estat congelat.[8] Els noms de classes HTML es conserven dins de l'atribut old-class
.
Quan se selecciona el text, una miniaplicació JavaScript[Cal aclariment] genera un fragment d'URL vist a la barra d' URL del navegador que ressalta automàticament aquesta part del text quan es torna a visitar.
Les pàgines web no es poden duplicar des de archive.is a web.archive.org com a còpia de seguretat de segon nivell, ja que archive.is exclou Wayback Machine i no desa les seves instantànies en format WARC. El contrari —de web.archive.org a archive.is— és possible,[9] però la còpia sol trigar més temps que una captura directa. Alguns llocs web se suprimeixen de les llistes d'Internet Archive de manera retroactiva o es bloqueja la possibilitat de desar-los a causa del seu fitxer robots.txt, però Archive.today no l'utilitza.
La barra d'eines d'investigació permet operadors de paraules clau avançades, utilitzant *
com a caràcter comodí. Un parell de cometes davant de la recerca d'una seqüència exacta de paraules clau presents en el títol o en el cos de la pàgina web, mentre que els restringeix operador insisteix a un domini específic d'Internet.[10]
Un cop arxivada una pàgina web, cap usuari d'Internet no la pot eliminar directament.[11]
Mentre es desa una llista dinàmica, la cerca a archive.today només mostra un resultat que enllaça la secció anterior i la següent de la llista (per exemple, 20 enllaços per a la pàgina).[12] La resta de pàgines web desades es filtren i, de vegades, es poden trobar per alguna de les seves ocurrències.
La funció de cerca està recolzada per Google CustomSearch. Si no proporciona resultats, archive.is intenta utilitzar Yandex Search.
Si ja s'ha arxivat una pàgina, archive.is demana a l'usuari que confirmeu l'arxiu d'una nova revisió, en lloc d'arxivar-la immediatament.
Mentre es carrega una pàgina, es mostra una llista d'URL a elements de pàgina individuals entre les mides de contingut, els estats HTTP i els tipus MIME. Aquesta llista només es pot visualitzar durant el procés de rastreig.
Es poden descarregar pàgines arxivades com a fitxer ZIP, excepte les pàgines arxivades des del 29 de novembre de 2019, quan Archive Today va canviar el motor del seu navegador de PhantomJS a Chromium.[13]
Des del juliol de 2013, archive.today admet la interfície de programació d'aplicacions (API) de Memento Project. [14][15]
Archive.today es va fundar el 2012. El lloc es va denominar originalment archive.today, però el maig del 2015 va canviar el mirall principal a archive.is.[16]
Al gener de 2019, va començar a depreciar el domini archive.is en favor del mirall archive.today.
El març del 2019, diversos proveïdors d'internet australians van bloquejar el lloc durant sis mesos després dels trets de la mesquita de Christchurch, en un intent de limitar la distribució de les imatges de l'atac.[17][18]
Segons GreatFire.org, archive.today està bloquejat a la Xina des del març del 2016,[19] archive.li des del setembre del 2017,[20] i archive.fo des del juliol del 2018.[21]
El 21 de juliol de 2015, els operadors van bloquejar l'accés al servei de totes les adreces IP finlandeses, afirmant a Twitter que ho van fer per evitar escalar una disputa que presumptament tenien amb el govern finès.[22]
A Rússia, només és possible l'accés HTTP; Les connexions HTTPS estan bloquejades.[23][24]
Archive.today bloqueja actualment les sol·licituds del resolutor DNS recursiu de Cloudflare , 1.1.1.1. Archive.today insisteix que els resolutors de DNS recursius inclouen la geolocalització de l'usuari que fa la cerca de DNS. Per motius de privadesa, Cloudflare no inclou específicament la geolocalització de l'usuari que fa la sol·licitud. Com a resultat, els servidors DNS archive.today retornen intencionadament respostes no vàlides quan el resoledor de DNS recursiu de Cloudflare ho consulta.[25]