من المشاكل الي واجهتنا اثناء تنفيذ احد الأنظمة مشكلة استخدام بيانات مخزنة على قواعد البيانات بتشفير EBCDIC.
في تشفير الEBCDIC أغلب الحروف العربية لها اكثر من شكل على حسب مكان الحرف في الكلمة عكس تشفير الUTF-8 يوجد شكل واحد للحرف ويتغير رسمه على حسب مكانه بالكلمة.
في تشفير الEBCDIC أغلب الحروف العربية لها اكثر من شكل على حسب مكان الحرف في الكلمة عكس تشفير الUTF-8 يوجد شكل واحد للحرف ويتغير رسمه على حسب مكانه بالكلمة.
مثلاً، حرف "ع" في الEBCDIC:
ﻋ
ﻌ
ﻊ
ﻉ
والنتيجة هي ظهور الكلمات العربية بشكل غير صحيح أو بشكل مقطع في أفضل الحالات:
" ﻉﺏﺩﺍﻝﻉﺯﻱﺯ" أو "ﻋﺒﺩﺍﻟﻊﺰﻳﺰ" أو "ﻋﺒﺩﺍﻟﻌﺰﻳﺰ"
ﻋ
ﻌ
ﻊ
ﻉ
والنتيجة هي ظهور الكلمات العربية بشكل غير صحيح أو بشكل مقطع في أفضل الحالات:
" ﻉﺏﺩﺍﻝﻉﺯﻱﺯ" أو "ﻋﺒﺩﺍﻟﻊﺰﻳﺰ" أو "ﻋﺒﺩﺍﻟﻌﺰﻳﺰ"
وكذلك وجود بعض الرموز في الEBCDIC التي لا يوجد لها أي مقابل في الUTF-8 لانها خاصة بالنظام التي تم استخدامه لإدخال وحفظ البيانات مما يضيف مسافات بشكل عشوائي او اشكال غريبة للكلمة: ؝.
الحل كان بسيط جداً، لكن التحدي كان في اكتشاف السبب. المشكلة لم يكن لها نمط ثابت يمكننا من خلاله تتبع الخلل بالرغم من أن التشفير كان احد المتهمين في القائمة.
اليوم وبعد متابعة النتائج لفترة تقارب 6 شهور، أقدر اقول فلترقد البيانات العربية بسلام، وتباً للشركة التي انتجت الEBCDIC لانها مصدر من مصادر الشر التقني المطلق على كافة الأصعدة.
وشﻙﺮﺍ؝...
وشﻙﺮﺍ؝...
جاري تحميل الاقتراحات...