এই তালিকাটি অনলাইন বই "ডেটা গুণমান: উচ্চ প্রভাব কৌশল" থেকে নেওয়া হয়েছে। [5] এছাড়াও ডেটা মানের পদ শব্দকোষ দেখুন। [6]
যদি ISO 9000 : 2015 মানের সংজ্ঞা প্রয়োগ করা হয় তবে ডেটা গুণমানটি ডিগ্রি হিসাবে সংজ্ঞায়িত করা যেতে পারে যা ডেটা বৈশিষ্ট্যগুলির একটি সেট প্রয়োজনীয়তা পূরণ করে। বৈশিষ্ট্য উদাহরণ হল: সম্পূর্ণতা, বৈধতা, সঠিকতা, সামঞ্জস্য, প্রাপ্যতা এবং সময়কাল। প্রয়োজনীয়তা সাধারণত বলা বা বাধ্যতামূলক, বলা প্রয়োজন বা প্রত্যাশা হিসাবে সংজ্ঞায়িত করা হয়। তবে, ডেটা মানের সাথে সম্পর্কিত অন্যান্য মান রয়েছে। উদাহরণস্বরূপ, ISO 25012তথ্যটির 15 গুণমানের মাত্রা সংজ্ঞায়িত করে। [11]
পরিমাণ এবং মানের মাত্রা (বৈশিষ্ট্য) এর নাম তথ্য উৎসের উপর নির্ভর করে। উদাহরণস্বরূপ, ওয়েব 2.0 ডকুমেন্টের তথ্যগুলির জন্য মাত্রাগুলি অনুসরণ করার জন্য সংজ্ঞা দেওয়া যেতে পারে :: অ্যাক্সেসিবিলিটি, সম্পূর্ণতা, বিশ্বাসযোগ্যতা, জড়িততা, বস্তুগততা, পঠনযোগ্যতা, প্রাসঙ্গিকতা, খ্যাতি, শৈলী, সময়কাল, স্বতন্ত্রতা, দরকারীতা।
সস্তা কম্পিউটার ডেটা স্টোরেজ বৃদ্ধির পূর্বে, প্রসবের পরিষেবাদিগুলির জন্য নাম এবং ঠিকানা ডেটা বজায় রাখার জন্য বৃহদায়তন মেইনফ্রেম কম্পিউটার ব্যবহার করা হয়েছিল। এটি এমন ছিল যাতে মেইলটি তার গন্তব্যে সঠিকভাবে রাউন্ড করা যেতে পারে। ম্যানফ্রেমগুলি সাধারণ ভুল বানান এবং নাম এবং ঠিকানা ডেটাতে টাইপোগ্রাফিকাল ত্রুটিগুলি সংশোধন করার পাশাপাশি স্থানান্তরিত, মৃত্যুবরণ, কারাগারে যাওয়া, বিবাহিত, তালাকপ্রাপ্ত, বা অভিজ্ঞ অন্যান্য জীবন পরিবর্তনকারী ইভেন্টগুলির ট্র্যাক করার জন্য ব্যবসার নিয়মগুলি ব্যবহার করে। সরকারী সংস্থাগুলি জাতীয় পরিষেবা পরিবর্তনের জাতীয় পরিবর্তন (এনসিওএ) সহ গ্রাহক ডেটা ক্রস-রেফারেন্স করতে কয়েকটি পরিষেবা সংস্থার ডাক ডেটা উপলব্ধ করতে শুরু করে।। এই প্রযুক্তি গ্রাহকের ডেটা ম্যানুয়াল সংশোধন তুলনায় মিলিয়ন ডলার বড় কোম্পানি সংরক্ষিত। বড় কোম্পানিগুলি পোস্টে সংরক্ষিত হয়েছিল, কারণ বিলগুলি এবং সরাসরি বিপণন সামগ্রীগুলি অভিযুক্ত গ্রাহকের কাছে আরো সঠিকভাবে তাদের পথ তৈরি করেছিল। প্রাথমিকভাবে একটি সেবা হিসাবে বিক্রি করা হয়েছে, ডেটা কোয়ালিটি কর্পোরেশনগুলির দেয়ালের অভ্যন্তরে স্থানান্তরিত হয়েছে, যেমন কম খরচে এবং শক্তিশালী সার্ভার প্রযুক্তি পাওয়া যায়। [ উদ্ধৃতি প্রয়োজন ]
বিপণনের উপর জোর দিয়ে সংস্থাগুলির নাম ও ঠিকানা তথ্যের উপর তাদের গুণমানের প্রচেষ্টাগুলি প্রায়শই দৃষ্টি নিবদ্ধ করে, তবে ডেটা মানের স্বীকৃত হয় [ কার দ্বারা? ] সব ধরনের তথ্য একটি গুরুত্বপূর্ণ সম্পত্তি হিসাবে। তথ্য মানের মূলনীতি চেইন তথ্য, লেনদেনের তথ্য, এবং পাওয়া প্রায় প্রতিটি অন্যান্য বিভাগের বিভাগে প্রয়োগ করা যেতে পারে। উদাহরণস্বরূপ, সরবরাহ শৃঙ্খলা ডেটা তৈরির নির্দিষ্ট মানের সাথে সঙ্গতিপূর্ণ একটি সংস্থার মান রয়েছে: 1) অনুরূপ কিন্তু সামান্য ভিন্ন স্টক ওভারস্টকিং এড়ানো; 2) মিথ্যা স্টক আউট এড়ানো; 3) ভলিউম ডিসকাউন্ট কমাতে বিক্রেতার ক্রয় বোঝার উন্নতি; এবং 4) একটি বড় প্রতিষ্ঠান জুড়ে স্টকিং এবং শিপিং অংশ সরবরাহ খরচ এড়ানো। [ উদ্ধৃতি প্রয়োজন ]
উল্লেখযোগ্য গবেষণা প্রচেষ্টায় কোম্পানীর জন্য, ডাটা মানের উন্নয়নশীল অন্তর্ভুক্ত করতে পারে প্রোটোকল গবেষণা পদ্ধতি জন্য, হ্রাস পরিমাপ ত্রুটি , সীমা পরীক্ষণ ডেটা, এর ক্রস সারণি , মডেলিং এবং Outlier শনাক্তকরণ, যাচাই তথ্য অখণ্ডতা , ইত্যাদি [ তথ্যসূত্র প্রয়োজন ]
তথ্য মানের বোঝার জন্য তাত্ত্বিক কাঠামোর একটি সংখ্যা আছে। আমেরিকান পদ্ধতিগততা দ্বারা প্রভাবিত একটি সিস্টেম-তাত্ত্বিক পদ্ধতির তথ্য মানের অন্তর্ভুক্ত করার জন্য ডেটা মানের সংজ্ঞা বিস্তৃত করে এবং বিজ্ঞান তত্ত্ব (ইভানভ, 197২) ভিত্তিতে নির্ভুলতা এবং নির্ভুলতার মৌলিক মাত্রার অন্তর্নিহিততাকে জোর দেয়। "জিরো ডিফেক্ট ডেটা" (হানসেন, 1991) ডাব্লেড একটি কাঠামো ডেটা গুণমানের পরিসংখ্যানগত প্রক্রিয়া নিয়ন্ত্রণের নীতিগুলি মেনে চলা। আরেকটি কাঠামো পণ্য দৃষ্টিকোণ (নির্দিষ্টকরণের সাথে সামঞ্জস্য) এবং পরিষেবা দৃষ্টিকোণ (গ্রাহকদের প্রত্যাশাগুলি পূরণ করা) (কান এট আল। 2002) সংহত করতে চায় । অন্য ফ্রেমওয়ার্ক semiotics ভিত্তি করেফর্ম, অর্থ এবং তথ্য ব্যবহার (মান এবং শঙ্কু, 2004) মানের মূল্যায়ন করা। একটি অত্যন্ত তাত্ত্বিক পদ্ধতির ডেটা কোয়ালিটি কঠোরভাবে (ওয়াণ্ড এবং ওয়াং, 1996) সংজ্ঞায়িত করার জন্য তথ্য সিস্টেমের স্বতন্ত্র প্রকৃতির বিশ্লেষণ করে ।
তথ্য মানের গবেষণার একটি উল্লেখযোগ্য পরিমাণে ডেটায়ের অনুকূল গুণাবলী (বা মাত্রা) এর বিভিন্ন বিভাগগুলির তদন্ত এবং বর্ণনা করা জড়িত। এই মাত্রা সাধারণত সঠিকতা, সম্পূর্ণতা, সামঞ্জস্য, timeliness, বৈধতা, এবং স্বতন্ত্রতা অন্তর্ভুক্ত। [12] প্রায় 200 ধরনের পদ চিহ্নিত করা হয়েছে এবং তাদের প্রকৃতিতে এই সামান্য চুক্তি (এই ধারণা, লক্ষ্য বা মানদণ্ড?), তাদের সংজ্ঞা বা পরিমাপ (ওয়াং এট আল।, 1993)। সফটওয়্যার ইঞ্জিনিয়ারদের "একটি অনুরূপ সমস্যা হিসেবে এই স্বীকৃতি জানাতে পারেন ilities "।
এমআইটির একটি মোট ডেটা কোয়ালিটি ম্যানেজমেন্ট প্রোগ্রাম রয়েছে, অধ্যাপক রিচার্ড ওয়াং এর নেতৃত্বে, যা প্রচুর সংখ্যক প্রকাশনা উৎপাদন করে এবং এই ক্ষেত্রে একটি উল্লেখযোগ্য আন্তর্জাতিক সম্মেলন আয়োজন করে (তথ্য মানের আন্তর্জাতিক সম্মেলন, আইসিআইকিউ)। এই প্রোগ্রামটি হেনসেনের "জিরো ডিফেক্ট ডেটা" ফ্রেমওয়ার্ক (হানসেন, 1991) এর কাজ থেকে বেড়ে উঠেছে।
বাস্তবে, তথ্য মানের একটি বিস্তৃত তথ্য সিস্টেমের সাথে জড়িত পেশাদারদের জন্য একটি উদ্বেগের বিষয়, তথ্য গুদাম এবং ব্যবসায়িক বুদ্ধিমত্তা থেকে গ্রাহক সম্পর্ক ব্যবস্থাপনা এবং সরবরাহ চেইন পরিচালনা থেকে । এক শিল্প গবেষণায় মার্কিন ডলার অর্থনীতির মোট মূল্য 600 বিলিয়ন মার্কিন ডলারেরও বেশি (ইকারসন, 2002) এ মূল্যের আনুমানিক হিসাব। ভুল তথ্য - যা অবৈধ এবং পুরানো তথ্য অন্তর্ভুক্ত করে - ডেটা এন্ট্রি, বা ডেটা মাইগ্রেশন এবং রূপান্তর প্রকল্পগুলির মাধ্যমে - বিভিন্ন ডেটা উৎস থেকে উদ্ভূত হতে পারে । [13]
২00২ সালে, ইউএসপিএস এবং প্রাইসওয়াটারহাউসকুপারস একটি রিপোর্ট প্রকাশ করে যে, মার্কিন যুক্তরাষ্ট্রের সকল মেইল পাঠানো 23.6 শতাংশ ভুলভাবে উল্লেখ করা হয়েছে। [14]
এক ডেটা যোগাযোগের তথ্যটি গড় ডাটাবেসের মধ্যে খুব দ্রুত পচা হয়ে যায় - 45 মিলিয়ন আমেরিকানরা প্রতি বছর তাদের ঠিকানা পরিবর্তন করে। [15]
প্রকৃতপক্ষে, সমস্যাটি এমন উদ্বেগের বিষয় যে কোম্পানিগুলি একটি ডেটা গভর্নেন্স টিম প্রতিষ্ঠা শুরু করে যা কর্পোরেশনের একমাত্র ভূমিকা ডেটা মানের জন্য দায়ী। কিছু [ কে? ] প্রতিষ্ঠানগুলি, এই ডেটা গভর্নেন্স ফাংশনটি একটি বৃহত্তর রেগুলেটরি সম্মতি ফাংশনের অংশ হিসাবে প্রতিষ্ঠিত হয়েছে - সংস্থার তথ্য / তথ্য গুণমানের গুরুত্বের স্বীকৃতি।
তথ্য মানের সমস্যা শুধুমাত্র ভুল তথ্য থেকে উদ্ভূত হয় না ; অসঙ্গতিপূর্ণ তথ্য পাশাপাশি একটি সমস্যা। দূর তথ্য ছায়া সিস্টেম এবং একটি গুদাম ডাটা centralizing উদ্যোগ একটি কোম্পানী তথ্য দৃঢ়তা নিশ্চিত করার সময় লাগতে পারে অন্যতম।
উদ্যোগ, বিজ্ঞানীরা, এবং গবেষকরা তাদের সাধারণ তথ্য মান উন্নত করতে ডেটা কার্যাশন সম্প্রদায়ের মধ্যে অংশগ্রহণ শুরু করছেন। [16]
বাজার ডেটা কোয়ালিটি আশ্বাস প্রদান করার কিছু উপায় যাচ্ছে। বিক্রেতারা বেশ কয়েকটি বিশ্লেষণ এবং নিম্ন মানের ডেটা মেরামত জন্য সরঞ্জাম করতে স্থানেই , পরিষেবা প্রদানকারীর একটি চুক্তি ভিত্তিতে তথ্য পরিষ্কার করতে পারেন এবং পরামর্শদাতা প্রসেস অথবা সিস্টেম স্থাপন প্রথম স্থানে তথ্য মানের সমস্যা এড়ানোর জন্য পরামর্শ করতে পারেন। বেশিরভাগ ডেটা মানের সরঞ্জামগুলি ডেটা উন্নত করার জন্য সরঞ্জামগুলির একটি সিরিজ অফার করে, এতে নিম্নলিখিত কিছু বা সমস্ত অন্তর্ভুক্ত থাকতে পারে:
অনেক সুপরিচিত লেখক এবং আত্মনির্ভরশীল বিশেষজ্ঞ আছেন, ল্যারি ইংলিশ সম্ভবত সবচেয়ে জনপ্রিয় গুরু । উপরন্তু, আইকিউ ইন্টারন্যাশনাল - এই ক্ষেত্রের পেশাদার ও গবেষকদের জন্য একটি ফোকাল পয়েন্ট প্রদানের জন্য 2004 সালে তথ্য ও তথ্য মানের আন্তর্জাতিক সমিতির প্রতিষ্ঠা করা হয়েছিল।
আইএসও 8000 ডাটা মানের জন্য একটি আন্তর্জাতিক মান। [17]
ডেটা গুণমান নিশ্চিত করা প্রক্রিয়া প্রোফাইলিং তথ্য তথ্য অসঙ্গতি এবং অন্যান্য ব্যতিক্রমসমূহ আবিষ্কার, পাশাপাশি করণ হিসাবে তথ্য শোধক [18] [19] ক্রিয়াকলাপ (সরানোর যেমন outliers , ডাটা ক্ষেপক অনুপস্থিত) ডেটা মান উন্নত করার জন্য।
এই কার্যক্রমগুলি তথ্য গুদামের অংশ হিসাবে বা অ্যাপ্লিকেশন সফটওয়্যারের বিদ্যমান টুকরাটির ডাটাবেস প্রশাসনের অংশ হিসাবে গ্রহণ করা যেতে পারে । [20]
ডেটা কোয়ালিটি কন্ট্রোল একটি অ্যাপ্লিকেশন বা প্রক্রিয়া জন্য ডেটা ব্যবহারের নিয়ন্ত্রণ প্রক্রিয়া। এই প্রক্রিয়াটি ডাটা গুণমান নিশ্চিতকরণ (QA) প্রক্রিয়ার আগে এবং পরে উভয় সঞ্চালিত হয় , যা ডেটা অসঙ্গতি এবং সংশোধন আবিষ্কার করে।
আগে:
QA প্রক্রিয়া অনুসরণের পর নিম্নোক্ত পরিসংখ্যান গুণমান নিয়ন্ত্রণ (QC) প্রক্রিয়া পরিচালনা করার জন্য সংগৃহীত হয় :
ডেটা QC প্রক্রিয়া বিশ্লেষণের জন্য বা অ্যাপ্লিকেশান বা ব্যবসায়িক প্রক্রিয়ার ডেটা ব্যবহার করার সিদ্ধান্ত নেওয়ার জন্য QA প্রক্রিয়া থেকে তথ্য ব্যবহার করে। সাধারণ উদাহরণঃ যদি কোন ডেটা QC প্রক্রিয়াটি শনাক্ত করে যে তথ্যটিতে অনেকগুলি ত্রুটি রয়েছে বা অসঙ্গতি রয়েছে, তবে এটি সেই ডেটাটিকে তার ইচ্ছাকৃত প্রক্রিয়ার জন্য ব্যবহার করা থেকে বাধা দেয় যা বাধা সৃষ্টি করতে পারে। নির্দিষ্ট উদাহরণ: একটি বিমানের স্বয়ংক্রিয় পাইলট বৈশিষ্ট্যতে বেশ কয়েকটি সেন্সর থেকে অবৈধ পরিমাপ প্রদান করলে এটি ক্র্যাশ হতে পারে। সুতরাং, একটি QC প্রক্রিয়া প্রতিষ্ঠার তথ্য ব্যবহার সুরক্ষা প্রদান করে।
ডেটা কোয়ালিটি (DQ) ডেটা ম্যানেজমেন্টের অখণ্ডতার জন্য ডেটা ইস্যুগুলি আচ্ছাদিত করে প্রয়োজনীয় একটি বিশেষ এলাকা। বর্তমান ডেটা ম্যানেজমেন্ট অপারেশনগুলি দ্বারা অনির্বাচিত ব্যতিক্রমগুলি খুঁজে পেতে ডেটা পর্যবেক্ষণ করে ডেটা গভর্নেন্সকে সহায়তা করে এমন একটি কী ক্রিয়াকলাপগুলির মধ্যে এটি একটি। ডেটা কোয়ালিটি চেকগুলি তার প্রতিকার পদক্ষেপগুলিতে পূর্ণ নিয়ন্ত্রণ করার জন্য গুণমান পর্যায়ে সংজ্ঞায়িত করা যেতে পারে। [ উদ্ধৃতি প্রয়োজন ]
একটি প্রতিষ্ঠান তার DQ সুযোগ সচেতন না হলে DQ চেক এবং ব্যবসা নিয়ম সহজেই ওভারল্যাপ করতে পারে। ওভারল্যাপ এড়াতে ব্যবসায়িক দলগুলি পুঙ্খানুপুঙ্খভাবে DQ সুযোগ বুঝতে হবে। ব্যবসায়ের যুক্তি একই কার্যকারিতা কভার করে এবং DQ হিসাবে একই উদ্দেশ্য পূরণ করে ডেটা মানের চেক অকার্যকর হয় । একটি প্রতিষ্ঠানের DQ সুযোগটি DQ কৌশল এবং ভালভাবে প্রয়োগ করা উচিত। অতীতের ব্যতিক্রমগুলির পুনরাবৃত্তি ঘটনার পরে কিছু ডেটা মানের চেক ব্যবসার নিয়মগুলিতে অনুবাদ করা যেতে পারে। [ উদ্ধৃতি প্রয়োজন ]
নিচে তথ্য প্রবাহের কয়েকটি ক্ষেত্র রয়েছে যা বার্ষিক DQ চেকগুলির প্রয়োজন হতে পারে:
সমস্ত তথ্য উপর সম্পূর্ণতা এবং নির্ভুলতা DQ চেক প্রতিটি উৎস সিস্টেম থেকে প্রতিটি বাধ্যতামূলক গুণাবলী জন্য এন্ট্রি পয়েন্টে সঞ্চালিত হতে পারে। লেনদেনের প্রাথমিক সৃষ্টি হওয়ার পরে কিছু বৈশিষ্ট্য মান তৈরি করা হয়; এই ক্ষেত্রে, এই চেকগুলি পরিচালনা করা চতুর হয়ে ওঠে এবং সেই বৈশিষ্ট্যটির উৎস সংজ্ঞায়িত ইভেন্টের পরে অবিলম্বে সম্পন্ন করা উচিত এবং লেনদেনের অন্যান্য মূল বৈশিষ্ট্য শর্ত পূরণ করা হয়।
উল্লেখ বৈশিষ্ট্যাবলী থাকার সমস্ত ডেটা রেফারেন্স তথ্য সংগঠনে মাধ্যমে নতুন বা বিরোধী মান আবিষ্কার রেফারেন্স ডাটা ভাল সংজ্ঞায়িত বৈধ মান সেট বিরুদ্ধে যাচাই করা যেতে পারে বৈধতা DQ চেক। ফলাফলগুলি মাস্টার ডেটা ম্যানেজমেন্ট (MDM) এর অধীনে পরিচালিত রেফারেন্স ডেটা আপডেট করতে ব্যবহার করা যেতে পারে ।
তৃতীয় পক্ষের পক্ষ থেকে সংস্থার অভ্যন্তরীণ দলগুলিতে সোর্স করা সমস্ত তথ্য তৃতীয় পক্ষের ডেটার বিরুদ্ধে সঠিকতা (DQ) চেক করতে পারে । এই ডেটা যাচাই ফলাফলগুলি যখন ডেটা এন্ট্রি পয়েন্টের পরে একাধিক হপ তৈরি করে এমন ডেটা প্রশাসিত হয় তখন মূল্যবান তবে এটির তথ্য অনুমোদিত হওয়ার আগে বা এন্টারপ্রাইজ বুদ্ধিমত্তাটির জন্য সংরক্ষিত হয়।
মাস্টার ডেটা উল্লেখ করে এমন সমস্ত ডেটা কলাম তার সামঞ্জস্য চেকের জন্য যাচাই করা যেতে পারে । এন্ট্রি পয়েন্টে ডেটাতে পরিচালিত একটি DQ চেক এমডিএম প্রক্রিয়ার জন্য নতুন তথ্য আবিষ্কার করে, তবে এন্ট্রি পয়েন্টের পরে প্রশাসিত একটি DQ চেক সংহততার ব্যর্থতা (ব্যতিক্রম নয়) আবিষ্কার করে।
ডেটা রূপান্তরিত হওয়ার সাথে সাথে, একাধিক টাইমস্ট্যাম্প এবং সেই টাইমস্ট্যাম্পগুলির অবস্থানগুলি ধরা হয় এবং এটি একটি নির্ধারিত SLA (পরিষেবা স্তরের চুক্তি) এর বিরুদ্ধে তার মান, ক্ষয়, কার্যক্ষম তাত্পর্য যাচাই করতে একে অপরকে এবং তার পথের সাথে তুলনা করা যেতে পারে। এই সময়কাল DQ চেক ডেটা মান ক্ষয় হার হ্রাস এবং তথ্য আন্দোলনের সময়রেখার নীতিগুলি সর্বোত্তম করতে ব্যবহার করা যেতে পারে।
একটি প্রতিষ্ঠানের জটিল লজিকটি সাধারণত একাধিক প্রসেস জুড়ে সহজ লজিকের মধ্যে ভাগ করা হয়। যুক্তিবাদিতাDQ যেমন জটিল লিকিকের উপর একটি লজিক্যাল ফলাফলের উপর নির্ভর করে মূল্যের নির্দিষ্ট পরিসর বা স্থিতিশীল আন্তঃসংযোগগুলির (সমষ্টিগত ব্যবসায়িক নিয়ম) জটিল বা অত্যন্ত গুরুত্বপূর্ণ ব্যবসায়িক প্রক্রিয়া এবং তথ্য বহির্ভূতদের আবিষ্কার করতে যাচাই করা যেতে পারে, এটি BAU (স্বাভাবিক হিসাবে ব্যবসা) প্রত্যাশা, এবং অবশেষে তথ্য সমস্যা ফলে সম্ভাব্য ব্যতিক্রম প্রদান করতে পারে। এই চেকটি একটি সাধারণ জেনেরিক একগ্রিগেশন রুল হতে পারে যা তথ্যটির বৃহৎ অংশ দ্বারা আবদ্ধ হয় অথবা প্রতিষ্ঠানের মূল ব্যবসায় সম্পর্কিত একটি লেনদেনের গুণাবলীর একটি জটিল যুক্তি হতে পারে। এই ডিকিউ পরীক্ষা ব্যবসা জ্ঞান এবং acumen উচ্চ ডিগ্রী প্রয়োজন। যুক্তিযুক্ত সমস্যাগুলির আবিষ্কারগুলি ব্যবসা বা ডেটা গভর্নেন্স বা উভয় দ্বারা নীতি এবং কৌশল পরিবর্তনের জন্য সহায়তা করতে পারে।
কনফার্মিটি চেক এবং অখণ্ডতা চেকগুলি সমস্ত ব্যবসায়িক চাহিদাগুলিতে আচ্ছাদিত নয়, এটি কঠোরভাবে ডাটাবেস আর্কিটেকচারের বিবেচনার অধীনে।
ডেটা চলাচলের অনেক জায়গা রয়েছে যেখানে ডিকিউ চেকগুলি প্রয়োজন হতে পারে না। উদাহরণস্বরূপ, ডকুমেন্ট থেকে ডেটা সোর্স করা তথ্যের জন্য নোট-কলামগুলির সম্পূর্ণতা এবং নির্ভুলতার জন্য নির্ভুলতা যাচাই করা হয়। অনুরূপভাবে, ডেটা সমান উৎস জুড়ে ডেটা সেলাই করা সময় সময় সাপেক্ষে তার সঠিকতার জন্য যাচাই করা উচিত। যাইহোক, এটি একটি ব্যবসায়িক নিয়ম এবং DQ সুযোগ থাকা উচিত নয়। [ উদ্ধৃতি প্রয়োজন ]
দুঃখজনকভাবে, একটি সফটওয়্যার ডেভেলপমেন্ট দৃষ্টিকোণ থেকে, DQ প্রায়ই একটি কার্যকারিতা হিসাবে দেখা হয়। এবং যেমন, কী ডেটা কোয়ালিটি চেক / প্রসেসগুলি চূড়ান্ত সফটওয়্যার সমাধানগুলিতে ফ্যাক্টরি হয় না। হেলথকেয়ারের মধ্যে, পরিধানযোগ্য প্রযুক্তি বা শারীরিক এলাকা নেটওয়ার্কগুলি , প্রচুর পরিমাণে ডেটা তৈরি করে। [21] ডেটা মানের অত্যন্ত উচ্চ এবং নিশ্চিতভাবে অবমূল্যায়ন নিশ্চিত করার জন্য প্রয়োজনীয় স্তর স্তর। এই বিশাল সংখ্যক জন্য সত্য mHealth অ্যাপ্লিকেশান, EHRs এবং অন্যান্য স্বাস্থ্য সম্পর্কিত সফ্টওয়্যার সমাধান। যাইহোক, কিছু ওপেন সোর্স সরঞ্জাম ডেটা মানের পরীক্ষা করে থাকে। [22] এর প্রাথমিক কারণ, জড়িত অতিরিক্ত খরচ থেকে উৎপাদিত সফ্টওয়্যার আর্কিটেকচারের মধ্যে উচ্চমানের কঠোরতা যোগ করা হয়।
স্বাস্থ্য, বা এমএইচথলে মোবাইল ডিভাইসগুলির ব্যবহার স্বাস্থ্য তথ্য নিরাপত্তা এবং গোপনীয়তার ক্ষেত্রে নতুন চ্যালেঞ্জ সৃষ্টি করে, যা সরাসরি ডেটা মানের প্রভাবিত করে। [2] এমএইচথ হেলথ এবং মধ্যম আয়ের দেশে স্বাস্থ্যসেবা সরবরাহের জন্য ক্রমবর্ধমান গুরুত্বপূর্ণ কৌশল। [23] মোবাইল ফোন এবং ট্যাবলেটগুলি সংগ্রহ, রিপোর্টিং এবং কাছাকাছি রিয়েল টাইমে ডেটা বিশ্লেষণের জন্য ব্যবহৃত হয়। তবে, এই মোবাইল ডিভাইসগুলি সাধারণত ব্যক্তিগত ক্রিয়াকলাপগুলির জন্য ব্যবহার করা হয়, পাশাপাশি, তাদের নিরাপত্তা ঝুঁকিগুলি আরও বেশি ঝুঁকিপূর্ণ যা ডেটা লঙ্ঘনের দিকে পরিচালিত করতে পারে। সঠিক নিরাপত্তা রক্ষাকর্তা ছাড়া, এই ব্যক্তিগত ব্যবহার স্বাস্থ্যের গুণমান, নিরাপত্তা এবং গোপনীয়তাকে ঝুঁকিপূর্ণ করে তুলতে পারে ।
সাম্প্রতিক বছরগুলিতে ডেটা কোয়ালিটি জনস্বাস্থ্য কর্মসূচিগুলির একটি প্রধান ফোকাস হয়ে উঠেছে, বিশেষ করে জবাবদিহিতা বৃদ্ধির দাবিতে। [25] এডস, টিউবারকুলোসিস এবং ম্যালেরিয়া রোগের বিরুদ্ধে লড়াইয়ের সাথে উচ্চাকাঙ্ক্ষী লক্ষ্যগুলির দিকে কাজ করা দৃঢ় নজরদারি এবং মূল্যায়ন সিস্টেমের উপর পূর্বনির্ধারিত হওয়া উচিত যা প্রোগ্রাম বাস্তবায়নের সাথে সম্পর্কিত মানের তথ্য উৎপাদন করে। [26] এই প্রোগ্রামগুলি এবং প্রোগ্রাম অডিটরগুলি ডেটা মানের মান নির্ধারণের প্রক্রিয়াটিকে মানানসই এবং স্ট্রিমলাইন করতে ক্রমবর্ধমান সরঞ্জামগুলি সন্ধান করে, [27] তথ্য প্রাপ্ত তথ্যের মান যাচাই করে [28] এবং সূচকগুলির জন্য অন্তর্নিহিত ডেটা ম্যানেজমেন্ট এবং রিপোর্টিং সিস্টেমগুলি মূল্যায়ন করে । [২9] একটি উদাহরণ হিউএইচও এবং পরিমাপ মূল্যায়ন এর ডেটা কোয়ালিটি রিভিউ টুল[30] ডাব্লুএইচও, গ্লোবাল ফান্ড, GAVI, এবং পরিমাপ মূল্যায়ন বিভিন্ন রোগ ও প্রোগ্রামগুলির মধ্যে ডেটা কোয়ালিটি আশ্বাসে একটি সুসংগত পদ্ধতির জন্য সহযোগিতা করেছে। [31]
উইকিপিডিয়া , উইকিপিডিয়া , ডিবিপিডিয়া এবং অন্যান্যের মতো খোলা তথ্য উৎসগুলিতে ডেটা মানের বিশ্লেষণে নিয়োজিত অসংখ্য বৈজ্ঞানিক কাজ রয়েছে । উইকিপিডিয়া ক্ষেত্রে, গুণমান বিশ্লেষণ সমগ্র নিবন্ধ [32] বা তার পৃথক অংশগুলি (যেমন ইনফোবক্স [33] ) সম্পর্কিত হতে পারে। বিভিন্ন মডেলের মাধ্যমে মানের মডেলিং করা হয়। তাদের মধ্যে কয়েকটি ডেটা মাইনিং অ্যালগরিদম ব্যবহার করে , র্যান্ডম বন , [34] [35] সাপোর্ট ভেক্টর মেশিন [36] এবং অন্যান্য। বৈজ্ঞানিক কাজও রয়েছে [37] [38] ব্যবহার করে বিভিন্ন ভাষায় উইকিপিডিয়া নিবন্ধের মান নির্ধারণের জন্য কৃত্রিম পরিমাপ ।
উইকিউপাত্তের, DBpedia এবং অন্যান্য ডাটা মানের নির্ধারণে জন্য পদ্ধতি LOD সূত্র পৃথক।
আইকিউ ইন্টারন্যাশনাল একটি অ-লাভজনক, বিক্রেতার নিরপেক্ষ, 2004 সালে প্রতিষ্ঠিত পেশাদারী সমিতি, তথ্য ও তথ্য মানের পেশার নির্মাণের জন্য উৎসর্গীকৃত।
ইলেকট্রনিক কমার্স কোড ম্যানেজমেন্ট অ্যাসোসিয়েশন (ইসিসিএমএ), একটি সদস্য ভিত্তিক, আন্তর্জাতিক মানদণ্ড বাস্তবায়নের মাধ্যমে তথ্য মানের উন্নতির জন্য আন্তর্জাতিক অলাভজনক সংস্থা। ইসিসিএমএ ISO 8000 এবং আইএসও 22745 এর উন্নয়নের জন্য বর্তমান প্রকল্প নেতা, যা ডাটা মানের জন্য আন্তর্জাতিক মান এবং উপাদান এবং পরিষেবা মাস্টার ডেটা বিনিময়য়ের জন্য আদর্শ।
ECCMA বিশ্বব্যাপী ডেটা কোয়ালিটি এবং ডেটা গভর্নেন্সের বিষয় বিশেষজ্ঞদের মধ্যে সহযোগিতার জন্য একটি প্ল্যাটফর্ম সরবরাহ করে যা বিশ্বব্যাপী, খোলা মানক অভিধানগুলি তৈরি ও বজায় রাখার জন্য যা অবিলম্বে লেবেল তথ্য ব্যবহার করে। লেবেলগুলির এই অভিধানগুলির অস্তিত্ব অর্থ হারানো ছাড়া কম্পিউটার কম্পিউটার থেকে অন্যের কাছে তথ্য প্রেরণ করতে দেয়।