القائمة الرئيسية

الصفحات

أخبار الاخبار

بنسمع كتير عن مصطلح "Big Data"، فكرت تسأل نفسك طيب قبل كده ايه هو أصلًا الـ "Big Data"؟! 🤔
أنا هشرح لك يعني ايه "Big Data" ، بس قبل ما أشرحها، لازم الأول تعرف يعني ايه "Data"...

- ما هي الـ Data؟

هي مجموعة من الحروف أو الكلمات أو الأرقام أو الرموز أو الصور المتعلقة بموضوع معين.
و ممكن كمان تقسم الـ Data لـ ثلاثة أنواع كالتالي:

بيانات مهيكلة

وهي البيانات المنظمة في جداول أو قواعد بيانات.

بيانات غير مهيكلة

دي بتشكل النسبة الأكبر من البيانات، وبتكون البيانات اللي بينتج ها الأشخاص يوميًا من كتابات نصية وصور وفيديوهات ورسائل ونقرات على مواقع الإنترنت... إلخ.

بيانات شبه مهيكلة

تُعتبر نوع من البيانات المهيكلة بس البيانات مش بتكون في صورة جداول أو قواعد بيانات.
كدا عرفنا ايه هي الـ Data بشكل عام، دلوقتي جه الوقت إننا نتعرف على الـ  Big Data..

- ما هي الـ Big Data

هي مجموعة من البيانات لها خصائصها الفريدة (مثل الحجم، السرعة، التنوع، التباين، صحة البيانات... إلخ) و لا يمكن معالجتها بكفاءة باستخدام التكنولوجيا الحالية والتقليدية لتحقيق الاستفادة منها.



لزيادة معلوماتك:
- تمت اضافة كلمة Big Data إلى قاموس Oxford كـ كلمة إنجليزية مستحدثة.

كتير مننا بيفكر إن الـ Big Data تصنف وفقًا للحجم فقط، بس هي تصنف وفقاً لمبدأ (3V's) و يتكون من:

- الحجم Volume

هو حجم البيانات اللي بتخرج من مصدر ما ودا اللي بيحدد قيمة وإمكانية البيانات عشان تصنف من ضمن الـ Big Data و ممكن تكون الخاصية الأكثر أهمية في تحليل الـ Big Data.
و وصفها بالضخمة لا يحدد كمية معينة و الحجم يقاس عادةً "بالبيتا بايت" أو "بالإكسا بايت"، و في العام الحالي "2020" سيحتوي الفضاء الإلكتروني على ما يقرب من "40.000 ميتا بايت" تتمثل في البيانات الجاهزة للتحليل واستخلاص المعلومات و %90 من البيانات الموجودة في العالم اليوم قد استحدثت خلال السنتين الأخيرتين بواسطة أجهزة وعلى أيدي بشر ساهم كلاهما في تزايد البيانات.

- التنوع Variety

المقصود بيه هو تنوع البيانات المستخرجة واللي بتساعد المستخدمين سواء كانوا باحثين أو محللين على اختيار البيانات المناسبة لمجال بحثهم و تتضمن بيانات مهيكلة في قواعد بيانات و بيانات غير مهيكلة تأتي من طابعها غير الممنهج مثل: الصور ومقاطع وتسجيلات الصوت وأشرطة الفيديو والرسائل القصيرة وسجلات المكالمات وبيانات الخرائط (GPS)...
وغيرها الكثير وتتطلب وقتاً وجهداً لتهيئتها في شكل مناسب.

- السرعة Velocity

 و المقصود بيها سرعة إنتاج واستخراج البيانات لتغطية الطلب عليها و تعتبر السرعة عنصراً حاسماً في اتخاذ القرار بناء على هذه البيانات وده الوقت الذي بنستغرقه من لحظة وصول هذه البيانات إلى لحظة الخروج بالقرار بناء عليها قبل كده كانت الشركات تستخدم لمعالجة مجموعة صغيرة من البيانات المخزنة في صورة بيانات مهيكلة في قواعد بيانات عملية تسمى بالـ "Batch Process" ودا كان بيحصل تحليل كل مجموعة بيانات واحدة تلو الأخرى في انتظار وصول النتائج مع الزيادة الضخمة في حجم البيانات وسرعة تواترها أصبحت الحاجة أكثر إلحاحا الى نظام يضمن سرعة فائقة في تحليل الـ Big Data في الوقت اللحظي أو سرعة تقارب الوقت اللحظي أدت الحاجة دي إلى ابتكار تقنيات وحلول مثل Apache و SAP HANA و Hadoop وغيرها الكثير.


- أهمية الـ Big Data

بتقدم ميزة تنافسية عالية للشركات لو قدرت تستفاد منها وتعالجها لأن هي بتقدم فهم أعمق لعملائها ومتطلباتهم وده ييساعد على اتخاذ القرارات المناسبة والملائمة داخل الشركة بطريقة أكثر فعالية و دا بناء على المعلومات المستخرجة من قواعد بيانات العملاء وبالتالي زيادة الكفاءة والربح وتقليل الخسائر و باستخدام تقنيات و أدوات تحليل البيانات الضخمة.
استطاعت (وول مارت) تحسين نتائج البحث عن منتجاتها عبر الإنترنت بنسبة 10-15% بينما في تقرير (لماكينزي) "وهي شركة رائدة في مجال استشارات الأعمال" إن القطاع الصحي بالولايات المتحدة لو كان بيستخدم  تقنيات تحليل الـ Big Data بفاعلية وكفاءة لكان قد أنتج "أكثر من 300 مليون دولار أمريكي كفائض سنوي" من ميزانية الصحة بسبب خفض تكاليف الانفاق بنسبة 8% و بحسب استطلاع رأي سابق أجرته مؤسسة (جارتنر) إن 64% من الشركات والمنظمات استثمرت في تبنى استخدام التقنيات الجديدة للتعاطي مع الـ Big Data. 
في عام 2013 ولا تتوقف الاستفادة من البيانات الضخمة على المؤسسات والمشاريع التجارية بس، بل تمتد إلى مجالات عديدة منها الطاقة والتعليم والصحة والمشاريع العلمية الضخمة أبرزها مشروع الجينوم البشرى (دراسة كاملة للمادة الوراثية للبشر) واللي يحتوى على 25 ألف جين، حيث تحتوى على 3 مليار زوج من القواعد الكيميائية المكونة للـ DNA.

- إزاي أبدأ في مجال الـ Big Data؟

لغات البرمجة المهمة لبداية مجال الـ Big Data

1- Python
 من اللغات القوية التي يتم استعمالها في العديد من الأشياء سواء برمجة تطبيقات مكتبية او برمجة مواقع و غيرها و تعلمها هيفيدك كتير جدًا في مجال الـ Big Data خصوصًا إن لغة الـ Python مستقبلها مبهر جدًا في مجالات التكنولوجيا الحديثة. 
2- SQL 
 طبعا في الـ Big Data احنا بنتعامل مع قواعد البيانات والـ SQL  من أشهر و أقوى لغات إنشاء و إدارة قواعد البيانات.
3- Scala
 ودي لغة بتعتمد على الجافا وقائمة على مبدأ الـ Scalability  بمعني إن هي  بتعتمد على المرونة و التحليل قبل أي حاجة.   
4- MATLAB  
ودي لغة من لغات البرمجة عبارة عن بيئة تفاعلية يُعتمد عليها في تطوير الخوارزميات والقيام بتحليل البيانات و التي يجب عليك أن تتقنها.
5- دي بعض الحاجات اللي ممكن تفيدك برضه في دخول الـ Big Data، زي:
HiveQL-Pig Latin-SAS-Julia.


بقلم: محمد كيادي عضو تيم سوشيال التراس حاسبات ومعلومات.

هل اعجبك الموضوع :