تكنولوجيا

البيانات الضخمة (Big Data): تعريف، حقائق وخرافات

 تم كتابة هذا المقال ضمن مساق التوجهات الحديثة في تكنولوجيا المعلومات في جامعة بوليتكنك فلسطين، من أجل مناقشة موضوع البيانات الضخمة (Big Data)، واستخداماتها العلمية والاجتماعية، وبيان الحقائق عنها ونفي الخرافات المتداولة حولها.

في الوقت الحاضر ، أصبح مفهوم “البيانات الضخمة” مهمًا جدًا في جوانب الحياة المختلفة ، بما في ذلك مجال الأعمال والحكومة والبحث. وبسبب هذه الأهمية كونها مهمة من الناحية الاقتصادية ، حاول الكثير من الأشخاص تعريف هذا المفهوم والكثير من هؤلاء ليس لديهم الكثير من المعرفة في الكمبيوتر والتكنولوجيا مما أدى إلى أخطاء في التفسيرات ويميل الكثير من الناس إلى استخدام مصطلح البيانات الضخمة بطريقة غير مناسبة ولكنها تخدم ذواتهم ومصالحهم. وفي هذا المقال نناقش بعض هذه الخرافات حول البيانات الضخمة.

تاريخ موجز لتطور تعريف البيانات الضخمة:

عرّف Gantz and Reinsel (٢٠١١) البيانات الضخمة على أنها “جيل جديد من التقنيات والبنى المصممة لاستخراج قيمة اقتصادية من كميات كبيرة جدًا من مجموعة متنوعة من البيانات ، من خلال تمكين سرعة عالية في الالتقاط والاكتشاف و التحليل.” تصف البيانات الضخمة أيضًا تخزين مجموعات البيانات الكبيرة و المعقدة وتحليلها باستخدام سلسلة من التقنيات ،منها NoSQL و MapReduce وتعلم الآلة (Blascheck، Burch، Raschke، Weiskopf، ٢٠١٥؛ Ward Barker، ٢٠١٣) [١].

بعد ذلك قامت مجموعة Gartner بتغيير تعريف البيانات الضخمة من اعتمادها على البيانات الضخمة لمفهوم 3V’s للبيانات الضخمة وهي: الحجم ، السرعة ، التنوع (Volume, Velocity and Variety) [٢]، وتساهم هذه الورقة بشكل كبير في تحديد ما إن كانت البيانات الموجودة لدي تصنف ضمن البيانات وبالتالي ينصح باستخدام تقنيات البيانات الضخمة لتوظيف هذه البيانات ضمن مشاريع أكبر، وقد تم تفصيل هذه المعايير بشكل مفصل في الورقة العلمية وتأثير كل منها على الإستفادة من هذه البيانات.

وقد أوضح كتاب Frontiers in Massive Data Analysis حل المشكلة التي قد تحدث بسبب استخدام جداول البيانات وحتى قواعد البيانات في أعمال البيانات الضخمة وشرح أدوات أكثر ملاءمة للتعامل مع البيانات الضخمة [٣] والتي ذكرناها سابقاً.

كما نشرت ورقة علمية بعنوان: Challenges and opportunities with Big Data (التحديات والفرص مع البيانات الضخمة) ، حول تقنيات تحليل البيانات الضخمة لتجنب المشاكل مثل عدم التجانس ، والافتقار إلى البنية ، والتعامل مع الأخطاء ، والخصوصية ، وحسن التوقيت ، والمصدر ، والتمثيل المرئي للبيانات [٤].

وقد ساهمت ورقة علمية بعنوان Advancing discovery in science and engineering نشرت عام ٢٠١١ في توضيح الفروقات بين مجالات متشابكة مثل: البيانات الضخمة (Big Data)، تعلم الآلة (Machine Learning) وعلم البيانات (Data Science)[٥].

وبإيجاز فإن الفروقات تكمن في وظيفة كل علم من هذه العلوم، حيث انها جميعاً تعمل معاً بشكل متكامل من أجل تحقيق الفائدة الاقتصادية أو المساهمة المجتمعية المنشودة، إلا أنها تختلف في دور كل منها لتحقيق هذا الهدف، فتعلم الآلة يكمن دوره في إيجاد إجابات أوضح لمليء النقص الموجود في البيانات التي لدينا وتوقع نتائج مستقبلية في مجال العمل، لكنه لا يستطيع العمل بمنعزل عن البيانات الضخمة التي من شأنها توفير البيانات اللازمة له من أجل تطوير الخوارزميات التي يقدم الحلول من خلالها، وكذلك علم البيانات الذي يهتم بشكل أكبر في تخزين هذه البيانات بشكل ملائم للوصول إليها والاستفادة منها بأقصى درجة ممكنة.

وفي الختام يمكننا الاستنتاج بأن البيانات الضخمة هو علم واسع، حديث وشائك كونه يتعامل مباشرة مع عدد من العلوم الأخرى، إلا أن النتائج التي نستقيدها منه تمكننا من عمل نقلة نوعية في المجال الذي نعمل عليه، وعليه يجب علينا الحذر عند التعامل مع هذا الموضوع، ومعرفة كيفية إدارة العمل دون الوقوع في فخ التضليل من قبل بعض الشركات التي تعمل في هذا المجال.

المصادر:

[١] T. Blascheck, M. Burch, M. Raschke, and D. Weiskopf, “Challenges and per spectives in big eye-movement data visual analytics,” in 2015 Big Data Visual Analytics (BDVA), pp. 1-8, IEEE, 2015.

[٢] Y. Genovese and S. Prentice, “Pattern-based strategy: getting value from big data,” Gartner Special Report G, vol. 214032, p. 2011, 2011.

[٣] N. R. Council et al., Frontiers in massive data analysis. National Academies Press, 2013

[٤] A. Labrinidis and H. V. Jagadish, “Challenges and opportunities with big data,” Proceedings of the VLDB Endowment, vol. 5, no. 12, pp. 2032 2033, 2012

[٥] C.C. Consortium et al., “Advancing discovery in science and engineering,” 201

المؤلفون: جبريل النتشه، محمد بلل

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

هذا الموقع يستخدم Akismet للحدّ من التعليقات المزعجة والغير مرغوبة. تعرّف على كيفية معالجة بيانات تعليقك.

زر الذهاب إلى الأعلى