صيغة التحويل الموحد-8 (بالإنجليزية: UTF-8) هي اختصار للمصطلح (8-bit Unicode Transformation Format) الذي يترجم إلى صيغة تحويل نظام الحروف الدولي الموحد بقوة 8 بت. هذا الترميز وضع من قبل كل من روب بايك وكين تومسن[2] لتمثيل معيار نظام الحروف الدولي الموحد للحروف الأبجدية لأغلب لغات العالم، ويتم تشفير الرموز فيه في حجم يتراوح بين بايت واحد وأربعة بايت للرمز الواحد.[3][4][5]
مجموعات الأحرف في ISO-8859-1 كانت محدودة الحجم وغير متوافقة مع البيئات متعددة اللغات. لهذا السبب، قام مجمع يونيكود بتطوير معيار يونيكود. يغطي معيار يونيكود (تقريباً) جميع الأحرف وعلامات الترقيم والرموز في العالم. يُمكن يونيكود من معالجة وتخزين ونقل النص بغض النظر عن المنصة أواللغة المستخدمة.
صيغة التحويل الموحد-8 هي ترميز الأحرف الافتراضية في HTML-5. أما إذا كانت صفحة ويب HTML5 تستخدم مجموعة أحرف مختلفة عن صيغة التحويل الموحد-8، فيجب تحديدها في وسم <meta>.
المنظمة الدولية للمعايير (ISO) نصت على تشكيل مجموعة أحرف عالمية متعددة البايتات في عام 1989. يحتوي معيار ISO 10646 على ملحق غير مطلوب يسمى UTF-1 الذي يوفر ترميز لتيار البايت لنقاط التعليمات البرمجية 32 بت. من بين عدة مشاكل، لم يكن أداء هذا الترميز مرضيا. وربما كانت المشكلة الكبرى عدم وجود فصل واضح بين أسكي وغير أسكي. أدوات UTF - 1 الجديدة متوافقة مع النص المرمز بأسكي، ولكن قد تخلط النص المرمز بـ UTF-1 بين التعليمات البرمجية الموجودة التي تتوقع أسكي (أو أسكي الموسع)، لأنها قد تحتوي على وحدات البايت المستمرة في النطاق 0x21-0x7E والتي تعني شيئا آخر في أسكي، على سبيل المثال، 0x2F لـ '/'، وفاصل المسارات في نظام يونكس.
يتم تحديد طول تشفير الرمز بحسب الشكل الآتي:
يونيكود هو قائمة من الأحرف مع أرقام عشرية مميزة لكل حرف. على سبيل المثال C = 67 وB = 66 وA = 65. القائمة التالية من الأرقام العشرية 104 101 108 108 111 تمثل كلمة "hello".
صيغة التحويل الموحد-8 هو ترميز يوضح كيفية ترجمة هذه الأرقام إلى أرقام ثنائية ليتم تخزينها في جهاز الحاسب.بحسب نظام صيغة التحويل الموحد-8.
صيغة التحويل الموحد-8 هي تنسيق موجه للبايت ولذلك لا يوجد مشاكل مع الشبكات أو الملفات الموجهة للبايت. صيغة التحويل الموحد-16، من ناحية أخرى، غير موجهة للبايت وتحتاج إلى تأسيس ترتيب بايت من أجل العمل مع الشبكات الموجهة للبايت. صيغة التحويل الموحد-8 هي أيضا أفضل في الاسترداد من الأخطاء التي تتلف أجزاء من الملف أو الدفق بسبب أنه لا يزال بالإمكان فك البايت غير الفاسد التالي. صيغة التحويل الموحد-16 تفعل الشيء نفسه إذا كانت بعض وحدات البايت معطوبة ولكن المشكلة تكمن عند فقدان بعض وحدات البايت. يمكن خلط البايت المفقودة مع وحدات البايت التالية مما يتسبب في تشويه النتيجة النهائية.
هناك العديد من التعريفات الحالية لصيغة التحويل الموحد-8 في عدة وثائق للمعايير. وتتشابه جميعها في الميكانيكا العامة، مع كون الاختلافات الرئيسية في بعض القضايا مثل النطاق المسموح به من قيم الرمز النقطي والتصرف الآمن للإدخال غير الصالح.
وهي تحل محل التعاريف الواردة في الوثائق التالية:
تختلف التطبيقات التالية اختلافات طفيفة عن مواصفات صيغة التحويل الموحد-8. وهي غير متوافقة مع مواصفات صيغة التحويل الموحد-8 ويمكن أن يتم رفضها من قبل التطبيقات المستخدمة لصيغة التحويل الموحد-8.