Качество на данните (на английски: data quality) е термин, с който се описва състоянието на даден набор от стойностите на качествени и количествени променливи величини. Съществуват много дефиниции на понятието „качество на данните“, но като цяло данните се смятат за качествени, ако „отговарят на целта, за която са предназначени за опериране, вземане на решения и планиране“.[1] Алтернативно, данните се смятат за качествени, ако коректно представят конструктите от реалния свят, за които се отнасят.
Наред с тенденцията обемите от данни да стават все по-големи, на преден план излиза и въпросът за вътрешната съгласуваност на данните (data consistency), без значение дали тези данни отговарят на нуждите на каквато и да е конкретна външна цел. Различните потребители могат да имат различни виждания за качеството на данните, дори когато става въпрос за един и същ набор от данни, използвани за една и съща цел. За осигуряване на качество на данните може да е необходима допълнителна процедура по пречистване на данните (data cleansing).[2]
Тази страница частично или изцяло представлява превод на страницата Data quality в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс – Признание – Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година – от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите.
ВАЖНО: Този шаблон се отнася единствено до авторските права върху съдържанието на статията. Добавянето му не отменя изискването да се посочват конкретни източници на твърденията, които да бъдат благонадеждни. |