مــريــم الفلاسي
مــريــم الفلاسي

@MrmMhd

28 تغريدة 6 قراءة Aug 23, 2021
ما هو تعدين البيانات ؟
تعدين البيانات هو مصطلح دارج من التسعينات معناه التنبيش (بحث) في البيانات للحصول على معلومات قيمة - اي إستخراج المعلومات.
استخدم مصطلح تعدين البيانات صار قليلًا واصبح مصطلح اكتشاف المعلومات هو الاكثر استخداماً لدقته
تعدين البيانات هو تعريب كلمتي data mining
والمصطلح البديل والأدق هو اكتشاف المعلومات knowledge discovery
واختصاراً KD
الفكرة من تعدين البيانات هي ان البيانات موجودة بكثرة في حالة خام، مثل النفط او الذهب في الكهوف.
قيمة التعدين تأتي عند اكتشاف علاقة أو رابط بين البيانات، وبالتالي إستخراج معلومة مهمة!
من هذا نعرف ان البيانات هي حالة أولية او بدائية بينما المعلومة هي نتاج تزاوج بيانين أو أكثر!
كيف؟ لنفترض أن قائمة
مدن العالم هي مجموعة بيانات خام
وأن درجات حرارة المناطق
هي قائمة بيانات أخرى
اذا ربطنا القائمة الاولى بالقائمة الثانية سيصبح لدينا قائمة المدن التي يمكن ان نسافر اليها في الصيف
والمدن التي لا يمكن الاستمتاع بأجوائها!
كل هذه المعلومات اكتشفناها من خلال ربط قوائم البيانات
إذًا بيان + بيان = معلومة
أهم كلمة ستجدها في علم اكتشاف المعلومات هي كلمة pattern
وهي كلمة معناها الحرفي رسمة مكررة
وتعني أنه هناك أيضا أشكال مكررة في البيانات او patterns
هذه الأشكال (الظواهر) المكررة هي التي تبنى على اساسها المعلومات الاولية
يعني في قوائم بيانات المدن ودرجات الحرارة ، ممكن استخراج ظواهر متكررة patterns
عن المدن الساحلية
أو المدن الجبلية
او المدن الأوروبية
يقوم علم التعدين على ٦ مهام أساسية
ألا وهي
اولاً تحري العيوب
يعني اذا تضمنت قائمة المدن اسم شخص مثلا او فندق. هذا عيب من العيوب في البيانات… أو أخطاء املائية..
ثانياً إيجاد علاقات شرطية
ما هو الشرط الذي يجعل الحرارة متشابهة
مثلا مدينة + ساحل يؤدي الى حرارة معينة
ثالثاً التكديس
وهو ايجاد مجموعات في البيانات بدون وجود ما يميزها وصفاً … مثلًا ملاحظة مجموعة متشابهة لمدن مناسبة للسفر صيفاً ونسميها مصايف بعد الاكتشاف أو المشاتي والخ… لم تكن هذه التكدسات واضحة ومعرفة في القوائم الأولية
رابعًا التصنيف
وهو محاولة تصنيف البيانات بشكل جديد لم يكن موجودا في المرحلة الأولية .. مثلا مدن باردة ومدن ساخنة
خامسًا تحليل الانحدار
هي معادلة رياضية فيها اهم مواصفات البيانات .. تساعد المعادلة في البحث والاستنتاج والتوقعات
سادسًا اختصار البيانات
وهو عرض البيانات بشكل مختصر كصورة مثلا او رسم بياني
اذا إطلعت على المصطلح تعدين البيانات ستكتشف انه أيضا هناك مصطلح قديم اسمه صيد البيانات data fishing
وهو إستخراج معلومات خطأ بسبب عملية بناء المعلومة الخاطئ من بيانات صحيحة!
مثلا اذا كانت مبيعات العلك تزداد في الصيف - هذا لا يعني أن الصيف هو سبب ازدياد بيع العلك!
وقدمت لكم قبل شهرين هذا المثال لاصطياد البيانات باستخدام معلومات مبنية بشكل غير مكتمل
في العام الماضي استعرضت معكم اساليب صيد المعلومات الذي حصل في انتخابات الرئاسة العام الماضي والتي أستخدمتها وسائل الاعلام المختلفة بشكل مقصود لخلق قصص وسرد معين على مرأى المراقبين!
هذه الثريد تحتوي على معظم الملاحظات عن عمليات اصطياد البيانات في انتخابات امريكا🎣
يعرف العلماء والباحثين عمليات صيد البيانات
ولذلك يقومون دائمًا بالتجربة
ويقومون أيضاً بتكرار الدراسات
وذلك لتفنيد المعلومات الخطأ وتمحيصها
صيد البيانات تجده يستخدم
كثيرًا في المعلومات الإخبارية
وأيضًا في التسويق والاعلان
وفي الاشاعات
وفي نظريات المؤامرات
ورأيناه في الانتخابات وفي جائحة كورونا
اذا اعجبكم الموضوع واتضحت لكم الأمور ريتويت ولايك والمرة القادمة سأتناول موضوع تحليل البيانات

جاري تحميل الاقتراحات...