استكمالاً للفروق المذكورة في الثريد السابق.
سأحاول توضيح الفروق بين هذه الأدوار
Data Engineer
Data Architect
Data Analyst
Data Scientist
#علم_البيانات
سأحاول توضيح الفروق بين هذه الأدوار
Data Engineer
Data Architect
Data Analyst
Data Scientist
#علم_البيانات
تواجد الأدوار في شركة واحدة يعتمد على عدة عوامل: الميزانية - حجم البيانات وإمكانية الاستفادة منها- تبني مثل هذه العلوم. بعض الشركات تجد فيها عالم بيانات واحد فقط يقوم بكل الأدوار. والبعض الأخر يوجد فريق كامل لكل دور من هذه الأربعة بل أيضاً يوجد فريق للباحثين في هذه التقنيات
يمكن وضع Data Engineer and Architect في جهة حيث تكون مسؤليتهم تجهيز البيانات من عدة مصادر وتسهيل عملية الوصول كما سأفصل لاحقاً
أما من حيث من يقوم بالتحليل يكون Data analyst و Scientist في الجهة الأخرى.
أما من حيث من يقوم بالتحليل يكون Data analyst و Scientist في الجهة الأخرى.
ال Data Enginee
مسؤول عن بناء واختبار و صيانة معمارية ومصادر البيانات. حيث يعمل على جمع البيانات من عدة مصادر ووضعها في data warehouse أو تطبيق hadoop للبيانات الضخمة. حيث تكون البيانات قبل التحليل في مكان واحد يكون الوصول إليه والاسترجاع من بسرعة وسهولة.
مسؤول عن بناء واختبار و صيانة معمارية ومصادر البيانات. حيث يعمل على جمع البيانات من عدة مصادر ووضعها في data warehouse أو تطبيق hadoop للبيانات الضخمة. حيث تكون البيانات قبل التحليل في مكان واحد يكون الوصول إليه والاسترجاع من بسرعة وسهولة.
ال Data Enginee
يطبق ETL - Extract, Transform, Load. ويكون لديه خلفية في تقنيات البيانات الضخمة وقواعد البيانات. وكذلك في البرمجة وهندسة البرمجيات لانه قد يبني APIs لجلب البيانات
يطبق ETL - Extract, Transform, Load. ويكون لديه خلفية في تقنيات البيانات الضخمة وقواعد البيانات. وكذلك في البرمجة وهندسة البرمجيات لانه قد يبني APIs لجلب البيانات
الData Architect
هو مهندس بيانات لكن بخبرة أكبر.حيث يكون مسؤول عن وضع المخطط blueprint ويحدد معمارية البيانات هل تكون على hadoop أو data warehouse
يحدد التقنيات المناسبة والتصميم أو المعمارية الأفضل بناء على خبرته وتقييم الوضع الحالي واتباع بعض القواعد منها مثلاً حوكمة البيانات
هو مهندس بيانات لكن بخبرة أكبر.حيث يكون مسؤول عن وضع المخطط blueprint ويحدد معمارية البيانات هل تكون على hadoop أو data warehouse
يحدد التقنيات المناسبة والتصميم أو المعمارية الأفضل بناء على خبرته وتقييم الوضع الحالي واتباع بعض القواعد منها مثلاً حوكمة البيانات
حتى نفهم الفرق بينهم فالوضع مشابه ل developer و software architeist
المطور أو المبرمج ومهندس البيانات يتبعون الخطة الموضوعة من قبل ال architeist
وال architeist هو المسؤول عن اختيار التصميم الصحيح والطريقة الأفضل لبناء البرامج أو معمارية البيانات.
المطور أو المبرمج ومهندس البيانات يتبعون الخطة الموضوعة من قبل ال architeist
وال architeist هو المسؤول عن اختيار التصميم الصحيح والطريقة الأفضل لبناء البرامج أو معمارية البيانات.
ال Data Analyst
محلل البيانات يركز غالباً - ومن الناحية النظرية- على تطبيق تقنيات التحليل خصوصاً ال Descriptive analytic
يعالج البيانات ويتأكد من جودتها وينشىء dashboards.
لا يقوم بالتنبؤ أو بناء نماذج معقدة.
دوره اشبه بمساعد عالم البيانات أو هو عالم بيانات مبتدئ.
محلل البيانات يركز غالباً - ومن الناحية النظرية- على تطبيق تقنيات التحليل خصوصاً ال Descriptive analytic
يعالج البيانات ويتأكد من جودتها وينشىء dashboards.
لا يقوم بالتنبؤ أو بناء نماذج معقدة.
دوره اشبه بمساعد عالم البيانات أو هو عالم بيانات مبتدئ.
ال Data Analyst
بعض المصادر تذكر أن محلل البيانات لا يقوم بالتنبؤ أو بناء نماذج معقدة . لكن وجهة نظري المتواضعة أن تحليل البيانات ليس نماذج وتطبيق تقنيات وليس تطبق النماذج المعقدة تعني أنك عالم بيانات. التحليل فيه شيء من الفن والاستنباط وربط الحقائق ببعضها لدعم القرار بشكل صحيح
بعض المصادر تذكر أن محلل البيانات لا يقوم بالتنبؤ أو بناء نماذج معقدة . لكن وجهة نظري المتواضعة أن تحليل البيانات ليس نماذج وتطبيق تقنيات وليس تطبق النماذج المعقدة تعني أنك عالم بيانات. التحليل فيه شيء من الفن والاستنباط وربط الحقائق ببعضها لدعم القرار بشكل صحيح
ال Data Scientist
يجب أن يعرف ماذا يريد من البيانات ما الهدف من التحليل. هذا هو لب الموضوع. قد يضع عالم البيانات الأسس الصحيح ويتأكد من جودة البيانات للتحليل ويحدد الاسئلة المناسبة ثم يقوم بالتحليل بنفسه أو يقوم به محلل البيانات. المهم هو الخطوات والتفسير الصحيح
يجب أن يعرف ماذا يريد من البيانات ما الهدف من التحليل. هذا هو لب الموضوع. قد يضع عالم البيانات الأسس الصحيح ويتأكد من جودة البيانات للتحليل ويحدد الاسئلة المناسبة ثم يقوم بالتحليل بنفسه أو يقوم به محلل البيانات. المهم هو الخطوات والتفسير الصحيح
بعض الاسئلة
هل يقوم عالم البيانات بجمع البيانات والتأكد من جودتها.
نعم. خصوصا اذا كان وحيداً في الشركة. ففي كل الحالات لابد أن يستطيع أن يقوم بدور مهندس البيانات ومحلل البيانات خصوصا في عدم وجود تعقيدات في بنية ومصادر البيانات.
هل يقوم عالم البيانات بجمع البيانات والتأكد من جودتها.
نعم. خصوصا اذا كان وحيداً في الشركة. ففي كل الحالات لابد أن يستطيع أن يقوم بدور مهندس البيانات ومحلل البيانات خصوصا في عدم وجود تعقيدات في بنية ومصادر البيانات.
هل وجود عالم البيانات يغني عن الاحصاء؟
أبداً لا. المقولة المشهورة عالم البيانات أحصائي أكثر من مهندس برمجيات ومهندس برمجيات أكثر من أحصائي.
الأحصاء علم مستقل وكبير وإذا وُجد احصائي يعمل مع عالم البيانات بالتأكيد النتائج أفضل.
أبداً لا. المقولة المشهورة عالم البيانات أحصائي أكثر من مهندس برمجيات ومهندس برمجيات أكثر من أحصائي.
الأحصاء علم مستقل وكبير وإذا وُجد احصائي يعمل مع عالم البيانات بالتأكيد النتائج أفضل.
هل يجب أن يعرف عالم البيانات تقنيات البيانات الضخمة مثل hadoop و spark وغيرها؟
لا. لكن يفضل أن يكون عنده خبرة ولو بسيطة بهذه التقنيات.
لكن بالتأكيد يمكن تحليل البيانات بدون تقنيات البيانات الضخمة
لا. لكن يفضل أن يكون عنده خبرة ولو بسيطة بهذه التقنيات.
لكن بالتأكيد يمكن تحليل البيانات بدون تقنيات البيانات الضخمة
هل يمكن تحليل البيانات بالاتصال بمصدر البيانات بشكل مباشر؟
نعم ولكن لا يفضل ذلك. حتى ما يكون هناك عبء عن أداء النظام الأصلي المتصل بقاعدة البيانات.
نعم ولكن لا يفضل ذلك. حتى ما يكون هناك عبء عن أداء النظام الأصلي المتصل بقاعدة البيانات.
Loading suggestions...