Talal Almutiri
Talal Almutiri

@TALALSQL

17 Tweets 15 reads Aug 18, 2022
استكمالاً للفروق المذكورة في الثريد السابق.
سأحاول توضيح الفروق بين هذه الأدوار
Data Engineer
Data Architect
Data Analyst
Data Scientist
#علم_البيانات
تواجد الأدوار في شركة واحدة يعتمد على عدة عوامل: الميزانية - حجم البيانات وإمكانية الاستفادة منها- تبني مثل هذه العلوم. بعض الشركات تجد فيها عالم بيانات واحد فقط يقوم بكل الأدوار. والبعض الأخر يوجد فريق كامل لكل دور من هذه الأربعة بل أيضاً يوجد فريق للباحثين في هذه التقنيات
أيضاً لا يوجد لكل دور مهام محددة بشكل لا يمكن تجاوزها. لكن الموضوع يعتمد. فعالم البيانات إذا كان واحد في المنظمة فهو يقوم بكل عمليات التحليل تقريبا.
الفرق بين الأدوار والمهام يتضح في الشركات الكبيرة التي تكون فُرق من هذه الأدوار.
يمكن وضع Data Engineer and Architect في جهة حيث تكون مسؤليتهم تجهيز البيانات من عدة مصادر وتسهيل عملية الوصول كما سأفصل لاحقاً
أما من حيث من يقوم بالتحليل يكون Data analyst و Scientist في الجهة الأخرى.
ال Data Enginee
مسؤول عن بناء واختبار و صيانة معمارية ومصادر البيانات. حيث يعمل على جمع البيانات من عدة مصادر ووضعها في data warehouse أو تطبيق hadoop للبيانات الضخمة. حيث تكون البيانات قبل التحليل في مكان واحد يكون الوصول إليه والاسترجاع من بسرعة وسهولة.
ال Data Enginee
يطبق ETL - Extract, Transform, Load. ويكون لديه خلفية في تقنيات البيانات الضخمة وقواعد البيانات. وكذلك في البرمجة وهندسة البرمجيات لانه قد يبني APIs لجلب البيانات
الData Architect
هو مهندس بيانات لكن بخبرة أكبر.حيث يكون مسؤول عن وضع المخطط blueprint ويحدد معمارية البيانات هل تكون على hadoop أو data warehouse
يحدد التقنيات المناسبة والتصميم أو المعمارية الأفضل بناء على خبرته وتقييم الوضع الحالي واتباع بعض القواعد منها مثلاً حوكمة البيانات
حتى نفهم الفرق بينهم فالوضع مشابه ل developer و software architeist
المطور أو المبرمج ومهندس البيانات يتبعون الخطة الموضوعة من قبل ال architeist
وال architeist هو المسؤول عن اختيار التصميم الصحيح والطريقة الأفضل لبناء البرامج أو معمارية البيانات.
ال Data Analyst
محلل البيانات يركز غالباً - ومن الناحية النظرية- على تطبيق تقنيات التحليل خصوصاً ال Descriptive analytic
يعالج البيانات ويتأكد من جودتها وينشىء dashboards.
لا يقوم بالتنبؤ أو بناء نماذج معقدة.
دوره اشبه بمساعد عالم البيانات أو هو عالم بيانات مبتدئ.
ال Data Analyst
بعض المصادر تذكر أن محلل البيانات لا يقوم بالتنبؤ أو بناء نماذج معقدة . لكن وجهة نظري المتواضعة أن تحليل البيانات ليس نماذج وتطبيق تقنيات وليس تطبق النماذج المعقدة تعني أنك عالم بيانات. التحليل فيه شيء من الفن والاستنباط وربط الحقائق ببعضها لدعم القرار بشكل صحيح
ال Data Scientist
هو محلل بيانات خبير و الذي يملك معرفة جيدة في الاحصاء والرياضيات ومفاهيم علم البيانات. يكون لديه القدرة على اختيار الاسئلة الصحيحة وبناء المقايس KPIs التي فعلا تعكس ما وراء البيانات.
لقب عالم بيانات يتطلب الكثير من الدراسة والجهد والخبرة العملية.
ال Data Scientist
يجب أن يعرف ماذا يريد من البيانات ما الهدف من التحليل. هذا هو لب الموضوع. قد يضع عالم البيانات الأسس الصحيح ويتأكد من جودة البيانات للتحليل ويحدد الاسئلة المناسبة ثم يقوم بالتحليل بنفسه أو يقوم به محلل البيانات. المهم هو الخطوات والتفسير الصحيح
بعض الاسئلة
هل يقوم عالم البيانات بجمع البيانات والتأكد من جودتها.
نعم. خصوصا اذا كان وحيداً في الشركة. ففي كل الحالات لابد أن يستطيع أن يقوم بدور مهندس البيانات ومحلل البيانات خصوصا في عدم وجود تعقيدات في بنية ومصادر البيانات.
هل وجود عالم البيانات يغني عن الاحصاء؟
أبداً لا. المقولة المشهورة عالم البيانات أحصائي أكثر من مهندس برمجيات ومهندس برمجيات أكثر من أحصائي.
الأحصاء علم مستقل وكبير وإذا وُجد احصائي يعمل مع عالم البيانات بالتأكيد النتائج أفضل.
هل يجب أن يعرف عالم البيانات تقنيات البيانات الضخمة مثل hadoop و spark وغيرها؟
لا. لكن يفضل أن يكون عنده خبرة ولو بسيطة بهذه التقنيات.
لكن بالتأكيد يمكن تحليل البيانات بدون تقنيات البيانات الضخمة
هل يمكن تحليل البيانات بالاتصال بمصدر البيانات بشكل مباشر؟
نعم ولكن لا يفضل ذلك. حتى ما يكون هناك عبء عن أداء النظام الأصلي المتصل بقاعدة البيانات.

Loading suggestions...