Andmekorruptsioon

Korrumpeerunud andmetega pildifaili avamisel kuvatud pilt

Andmekorruptsioon ehk andmelaostus (ingl data corruption) viitab andmetervikluse sihilikule või juhuslikule rikkumisele [1]. Erinevate arvutiprotsesside (näiteks andmete kirjutamine, lugemine, talletamine, ülekandmine või protsessimine) töö jooksul võivad tekkida tõrked, mille tulemusel võib osa algandmetest muutuda kõlbmatuks. Arvuti-, ülekande- ja andmesüsteemide puhul kasutatakse erinevaid lahendusi, et piirata tõrgete teket või tagada nende tekkimise korral andmete puutumatust.

Andmekorruptsiooni tõttu võib failisüsteem korrumpeerunud andmeid sisaldavate failide lugemisel tagastada ootamatuid tulemusi. Rikutud andmete lugemine võib põhjustada nii väiksemaid probleeme andmete lugemisel kui ka ohtlikke süsteemi tõrkeid, mistõttu süsteem lõpetab töötamise. Näiteks, kui osa või kõik dokumendifaili andmetest on rikutud ja kasutaja proovib dokumenti avada, siis kuvatakse veateade, mille järel võib fail osalise korruptsiooni juhul avaneda vigadega või täieliku korruptsiooni juhul üldse mitte avaneda [2].

Andmete rikkumist võib esineda mitmetel erinevatel põhjustel alustades füüsilistest andmekandjate vigastustest ja lõpetades tarkvaras tekkinud tõrgetega. Sageli põhjustab andmete korruptsiooni ka pahaloomuline tarkvara. Arvutiviirused võivad algandmeid üle kirjutada, nende lähtekoodi modifitseerida või andmeid jäädavalt kustutada, mille tulemusel kogu süsteem võib muutuda töökõlbmatuks [3].

Kui andmed ei ole täielikult korrumpeerunud, siis on neid võimalik taastada käitades spetsiifilist tarkvara, mis võib fragmenteerunud faili osad andmekandja muudest sektoritest üles leida või üritada rikutud andmeid paarsuse abil asendada [4].

Andmelaostust jagatakse kahte erinevasse kategooriasse sõltuvalt sellest, kas tegu on tuvastatud või tuvastamata andmete rikkumisega [5]. Tuvastatud andmete korruptsiooni näol on tegu rikutud andmetega, millest kasutaja on teadlik ja mis enamasti ei tekita ohtu kogu süsteemile. Sellised probleemid avastatakse sageli enne kui need jõuavad süsteemile kahjulikku mõju avaldada ja on võimalus, et andmeid on võimalik taastada. Näiteks kuuluvad tuvastatud andmelaostuse kategooriasse pildifailid, mille avamisel kuvatakse kasutajale andmeid, mis ei ole õiged. Tuvastamata andmekorruptsioon (või ka vaikne andmekorruptsioon) tekitab süsteemile tõsisemaid probleeme, sest nii rikutud andmeid kui ka nende riknemise põhjust ei ole veel leitud, mistõttu on probleemile võimatu varakult lahendust leida. See võib tuua kaasa tõrkeid süsteemi töös ja muuta andmed igavesti kättesaamatuks. Selliseid tõrkeid põhjustavad näiteks vigane toiteallikas või tolmu sattumine andmekandjasse. Kui rikutud andmeid ei tuvastata õigeaegselt, siis võib laostumine mõjutada süsteemifaile või andmekandja draivereid ning andmekandja muutub ligipääsmatuks.

Üldjuhul on andmed ja informatsioon, mis on andmekandjale salvestatud, rahaliselt väärtuslikumad kui andmekandja ise, sest andmete väärtus kasvab aja jooksul ja nende asendamine andmelaostuse korral võib olla liiga kõrgehinnaline või lausa võimatu. Selle asemel, et pidevalt uusi andmekandjaid soetada, proovitakse olemasolevate andmekandjate vastupidavust ja tööaega maksimeerida, kuid see võib suurendada andmete kadumise ohtu [6]. Informatsioonikadu tuleneb andmeedastuse käigus tekkinud andmekorruptsioonist, mida põhjustavad ootamatud voolukatkestused, andmekandja füüsilised vigastused, vead tarkvara koodis [7] või erinevad välised keskkonnategurid, näiteks päikesepurse, mis takistab andmekandja dünaamilise muutmälu (DRAM) tööd [8] või mikrolaineahju kiirgus, mis mõjutab WiFi andmeedastust [9].

Vastumeetmed

[muuda | muuda lähteteksti]

Leidub mitmeid vastumeetmeid andmekorruptsiooni ärahoidmiseks või selle poolt tekitatud kahjude vähendamiseks.

Kõvaketastega töötamisel on võimalik luua sõltumatute ketaste liiasmassiiv (ingl Redundant Array of Independent Disks ehk RAID) [10]. RAID on mitmest kõvakettast või kõvaketta partitsioonist moodustatud loogiline plokkseade andmete salvestamiseks, kus samad andmed salvestatakse mitmele kõvakettale. See kaitseb andmeid laostuse eest, sest kui üks kõvaketas saab vigastada ja andmed rikutakse, saab andmed päästa teiste liiasmassiivis olevate kõvaketaste kaudu.

Osade keskseadmete ehk protsessorite (ingl central processing unit ehk CPU) arhitektuuris võimaldatakse erinevate taustakontrollide läbiviimist, et tuvastada andmekorruptsiooni protsessori vahemälus, puhvermälus või konveieris [11].

Andmeedastuse käigus tekkinud andmekorruptsiooni tuvastamiseks kasutatakse sageli veaparanduskoodi või tsükkelkoodkontrolli (ingl error correction code ja cyclic redundancy check ehk ECC ja CRC). Iga sektori kohta andmekandjal on salvestatud veaparandusloogika. Kui kõvaketas tuvastab andmete lugemisel tõrkeid konkreetses sektoris, siis tehakse andmetest koopia mõnda teise sektorisse, kujundades vanade andmete indeksid suunama ümber uuele sektorile ilma operatsioonisüsteemi tööd häirimata. Sellist taustakontrolli ja parandatud vigu andmete lugemisel on võimalik jälgida S.M.A.R.T. (ingl Self-Monitoring, Analysis and Reporting Technology) tehnoloogia vahendusel [12]. S.M.A.R.T. on enesejälgimis-, analüüsi- ja teatamistehnoloogia, mis võimaldab jälgida kõvaketta seisukorda ja kasutajat varakult andmekorruptsiooni tekkimise ohust teavitada [13].

  1. EKSS="Eesti keele seletav sõnaraamat" http://www.eki.ee/dict/its/index.cgi?F=num&C10=1&Q=193-203
  2. Open a document after a file corruption error. https://support.microsoft.com/en-us/office/open-a-document-after-a-file-corruption-error-47df9d48-2165-4411-a699-1786ac734bc3 (14.01.2021).
  3. Data Corruption (4.01.2017). https://www.techopedia.com/definition/14680/data-corruption (14.01.2021).
  4. Nuncik, Michael 2017. Find out how data gets corrupted and how it can be recovered. https://www.ontrack.com/en-gb/blog/find-out-how-data-gets-corrupted-and-how-it-can-be-recovered (14.01.2021).
  5. Detected and undetected corruption. http://www.datarecoveryspecialists.co.uk/blog/detected-and-undetected-corruption (14.01.2021).
  6. Hartness, Carl B. (1990). United States Patent No USRE34100E. "Data error correction system" Retrieved from https://patents.google.com/patent/USRE34100E/en (14.02.2021)
  7. Data corruptin and loss: causes and avoidance. https://web.archive.org/web/20201218060722/http://www.thexlab.com/faqs/datacorruption.html (14.01.2021)
  8. Scientific American (21.07.2008). "Solar Storms: Fast Facts". Nature Publishing Group. Originaali arhiivikoopia seisuga 26.12.2010. Vaadatud 14.01.2021.
  9. Ashish 2021. Do Microwaves Interfere With WiFi Signals? https://www.scienceabc.com/innovation/do-microwaves-interfere-with-wifi-signals.html (14.01.2021)
  10. Zolk, I. (2008). Riistvara ja tehniline dokumentatsioon. Tartu. lk 49-50.
  11. Steve Bostian (2012). "Rachet Up Reliability for Mission-Critical Applications: Intel Instruction Replay Technology" (PDF). Intel. Originaali arhiivikoopia (PDF) seisuga 02.02.2012. Vaadatud 14.01.2021.
  12. "Read Error Severities and Error Management Logic". Originaali arhiivikoopia seisuga 7.04.2012. Vaadatud 14.01.2021.
  13. Vallaste, S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) e-Teatmik