Abdulaziz Alkhars
Abdulaziz Alkhars

@azizbk

7 تغريدة 2 قراءة May 21, 2022
من المشاكل الي واجهتنا اثناء تنفيذ احد الأنظمة مشكلة استخدام بيانات مخزنة على قواعد البيانات بتشفير EBCDIC.
في تشفير الEBCDIC أغلب الحروف العربية لها اكثر من شكل على حسب مكان الحرف في الكلمة عكس تشفير الUTF-8 يوجد شكل واحد للحرف ويتغير رسمه على حسب مكانه بالكلمة.
مثلاً، حرف "ع" في الEBCDIC:




والنتيجة هي ظهور الكلمات العربية بشكل غير صحيح أو بشكل مقطع في أفضل الحالات:
" ﻉﺏﺩﺍﻝﻉﺯﻱﺯ" أو "ﻋﺒﺩﺍﻟﻊﺰﻳﺰ" أو "ﻋﺒﺩﺍﻟﻌﺰﻳﺰ"
بالاضافة الى وجود بعض الاحرف عبارة عن حرف واحد في الEBCDIC بينما هي حرفين في الUTF-8:
ﻻ - EBCDIC حرف واحد عند الكتابة
لا - UTF-8 حرفين عند الكتابة
وكذلك وجود بعض الرموز في الEBCDIC التي لا يوجد لها أي مقابل في الUTF-8 لانها خاصة بالنظام التي تم استخدامه لإدخال وحفظ البيانات مما يضيف مسافات بشكل عشوائي او اشكال غريبة للكلمة: ؝.
وبالتالي عند تصدير البيانات إلى ملف excel مثلاً او تطبيق عليها خط من الخطوط في المتصفحات، النتيجة تكون كارثية بمعنى الكلمة.
الحل كان بسيط جداً، لكن التحدي كان في اكتشاف السبب. المشكلة لم يكن لها نمط ثابت يمكننا من خلاله تتبع الخلل بالرغم من أن التشفير كان احد المتهمين في القائمة.
اليوم وبعد متابعة النتائج لفترة تقارب 6 شهور، أقدر اقول فلترقد البيانات العربية بسلام، وتباً للشركة التي انتجت الEBCDIC لانها مصدر من مصادر الشر التقني المطلق على كافة الأصعدة.
وشﻙﺮﺍ؝...

جاري تحميل الاقتراحات...