تفاضل البيانات

في علوم الحاسب و نظرية المعلومات، ينتج اختلاف البيانات أو الضغط التفاضلي وصفًا تقنيًا للفرق بين مجموعتين من البيانات - كمصدر و هدف. بشكل عام، تأخذ الخوارزمية بيانات، كبياناتٍ من مصدر و بيانات هدف، وتنتج الاختلاف بينهم. وبذلك يمكن للمرء إعادة بناء البيانات المستهدفة («تصحيح» المصدر باستعمال الاختلاف لإنتاج الهدف).

أمثلة

عدل

أحد أفضل الأمثلة المعروفة لتمييز البيانات هو الأداة المساعدة diff، والتي تنتج اختلافات سطحية للملفات النصية (وفي بعض التطبيقات، ملفات ثنائية، وبالتالي فهي أداة تمييز عامة). تباين الملفات الثنائية العامة يندرج تحت عنوان ترميز دلتا، و أشهر مثال اللذي يستخدم على نطاق واسع هي الخوارزمية المستخدمة في rsync. كمثال جيد على برنامج تفاضل ذو كفاءة العالية هو bsdiff، والذي يعتمد على ضغط bzip2، مما يوضح العلاقة الوثيقة بين التمييز والضغط.

مراجع

عدل