تعریف بیگ دیتا یا داده های بزرگ، انواع، ویژگی ها و فواید آنها

منظور از بیگ دیتا یا داده های بزرگ چیست ؟ داده ها، اعداد، کاراکترها یا علائمی هستند که توسط یک کامپیوتر پردازش می شوند و می توانند به شکل سیگنال های الکتریکی ذخیره و انتقال داده شود. بر این اساس بیگ دیتا یا داده های بزرگ در واقع همین داده ها هستند اما با اندازه خیلی بزرگتر.  داده های بزرگ را می توان در سه شکل یافت:

۱- ساختاریافته

۲- غیر ساختاریافته

۳-  نیمه ساختاریافته

داده های بزرگBig Data
بیگ دیتا

تعریف بیگ دیتا

تعریف بیگ دیتا یا داده های بزرگ، انواع، ویژگی ها و فواید آنها

در این مقاله می خواهیم شما را با بیگ دیتا یا داده های بزرگ آشنا کنیم. برای آشنایی با بیگ دیتا (big data) یا داده های بزرگ ، ابتدا باید بدانیم که “داده” چیست؟

داده چیست ؟

داده ها، اعداد، کاراکترها یا علائمی هستند که توسط یک کامپیوتر پردازش می شوند و می توانند به شکل سیگنال های الکتریکی ذخیره و انتقال داده شود و بر روی رسانه های مغناطیسی، نوری و یا مکانیکی ثبت شوند. براین اساس بیگ دیتا یا داده های بزرگ در واقع همین داده ها هستند اما با اندازه خیلی بزرگتر.  بیگ دیتا یک اصطلاح برای توصیف مجموعه ای از اطلاعات در اندازه بزرگ است که در عین حال به طور تصاعدی با زمان بزرگتر هم می شوند.  به طور خلاصه، چنین داده هایی آنقدر بزرگ و پیچیده هستند که هیچ یک از ابزارهای مدیریت داده های مرسوم، قادر به ذخیره یا پردازش آن بصورت موثر نیستند.

big data

big data

نمونه هایی از بیگ دیتا یا داده های بزرگ

  • بازار بورس نیویورک در حدود یک ترابایت داده تجاری جدید در هر روز تولید می کند.
  • آمار و ارقام نشان می دهد که روزانه ۵۰۰ ترابایت داده جدید به رسانه های اجتماعی مانند Facebook وارد می شود. این داده ها عمدتا بصورت عکس و ویدئو، تبادل پیام، بیان نظرات و غیره ایجاد می شوند.
  • موتور جت می تواند ۱۰ ترابایت داده را در ۳۰ دقیقه پرواز تولید کند. با هزاران پرواز در روز، تولید اطلاعات به پتابایت ها داده می رسد.

مقاله بازاریابی پیشنهادی

تکامل بازاریابی هوش مصنوعی

دسته های بیگ دیتا یا داده های بزرگ

داده های بزرگ یا big data را می توان در سه شکل یافت:

۱- ساختاریافته
۲- غیر ساختاریافته
۳-  نیمه ساختاریافته

بیگ دیتا یا داده های بزرگ

بیگ دیتا یا داده های بزرگ

کلان داده های ساختار یافته

هر داده ای که می تواند به شکل یک فرمت ثابت و مشخص ذخیره شود و قابل دسترسی و پردازش باشد، به اصطلاح به عنوان داده ساختار یافته نامیده می شود. در طول زمان، با گسترش علوم کامپیوتر، تکنیک هایی برای کار با چنین داده هایی با فرمت مشخص به موفقیت بیشتری دست یافت. با این وجود پیش بینی می شود که اندازه این داده ها تا حد زیادی در رنج چندین زتابایت افزایش یابد. (یک زتابایت برابر با ۱۰۲۱ بایت است) با این ارقام به راحتی می توان درک کرد که چرا نام بیگ دیتا یا داده های بزرگ به آنها داده شده است و می توان تصور کرد که چه چالش هایی در ذخیره و پردازش این اطلاعات وجود دارد. به عنوان مثال داده های ذخیره شده در سیستم مدیریت پایگاه داده یک نمونه از داده های ساختاریافته هستند.

جدول مربوط به کارمندان یک شرکت در یک پایگاه داده نمونه ای از داده های ساختاریافته است.

کد شناسایی کارمنداننام کارمندانجنسیتبخشمیزان حقوق
۲۳۶۵علی محبیمردحسابداری۲٫۵۰۰٫۰۰۰
۳۳۹۸مریم فاطمیزنمدیریت۵٫۰۰۰٫۰۰۰
۴۶۱۲زهرا انصاریزنحسابداری۲٫۷۰۰٫۰۰۰
۹۰۲۱محمد باباییمردمدیریت۴٫۸۰۰٫۰۰۰
۸۷۶۴محسن رنجبرمردمدیریت۵٫۵۰۰٫۰۰۰

کلان داده های غیر ساختاریافته

هر داده ای با فرم یا ساختار ناشناخته به عنوان داده های غیر ساختاریافته طبقه بندی می شود. بیگ دیتای غیر ساختار یافته علاوه بر اندازه بزرگ، چالش های متعددی را از لحاظ پردازش به همراه دارد. نمونه ای از داده های بدون ساختار، یک منبع داده ناهمگن شامل ترکیبی از فایل های متنی ساده، تصاویر، ویدئوها و غیره است. امروزه سازمان های مختلف، اطلاعات زیادی را به صورت داده های بزرگ بدون ساختار یا غیرساختاریافته دارند اما نمی توانند مقدار ارزش آنها را در اختیار داشته باشند. چون این داده ها در قالب خام یا فرمت بدون ساختار هستند.

داده های بزرگ غیر ساختار یافته بصورت تکراری و غیر تکراری هستند. داده های غیرساختاریافته تکراری شامل پردازش آنالوگ، اندازه گیری، داده های هواشناسی و داده های غیرساختاریافته غیر تکراری شامل ایمیل ها، داده های تماس و… هستند.

کلان داده های نیمه ساختاریافته

داده نیمه ساختاریافته می تواند شامل هر دو شکل داده ها باشد. ما می توانیم داده های نیمه ساختاریافته را به عنوان ساختاریافته در نظر بگیریم اما این داده ها با ساختار رسمی از جداول و مدل های داده ای وابسته به پایگاه داده رابطه ای مطابقت نمی کنند. داده هایی که در فایل XML نمایش داده می شود، داده های نیمه ساختاریافته هستند.

رشد داده در طول سال ها

داده های کاربردی برنامه وب که غیر ساختاریافته است متشکل از فایل های لاگ، فایل های تاریخچه تراکنش و غیره است. سیستم OLTP برای کار با داده های ساختاریافته ساخته شده است که در آن داده ها در روابط (جداول) ذخیره می شوند.

مقاله بازاریابی پیشنهادی

اینترنت اشیاء

مشخصات بیگ دیتا یا داده های بزرگ

حجم

نام بیگ دیتا (Big Data) خود نشان دهنده ی بزرگ بودن اندازه داده است. اندازه داده ها نقش بسیار مهمی در تعیین ارزش اطلاعات ایفا می کند. همچنین، اینکه داده های خاص می توانند در واقع به عنوان یک بیگ دیتا یا داده بزرگ محسوب شوند یا نه، به حجم داده بستگی دارد. از این رو حجم، یکی از ویژگی هایی است که باید در هنگام برخورد با بیگ دیتا مورد توجه قرار گیرد.

تنوع

ویژگی بعدی بیگ دیتا یا داده های بزرگ یا big data تنوع آنهاست. تنوع، به منابع ناهمگون و ماهیت داده ها، هم ساختار یافته و هم غیر ساختاریافته اشاره دارد. در گذشته، صفحات گسترده و پایگاه های اطلاعاتی تنها منابع اطلاعاتی بودند که توسط بسیاری از نرم افزارها در نظر گرفته می شد. در حال حاضر، داده ها در قالب ایمیل، عکس، ویدئو، دستگاه های مانیتورینگ، فایل های PDF، فایل های صوتی و غیره نیز در برنامه های تجزیه و تحلیل مورد توجه قرار گرفته است. این تنوع داده های ساختار یافته، مسایل خاصی را برای ذخیره سازی، استخراج و تجزیه و تحلیل داده ها نشان می دهد.

سرعت

این ویژگی به سرعت تولید داده ها اشاره دارد. این که داده ها چقدر سریع تولید و پردازش می شوند تا نیازها را برآورده کنند، پتانسیل واقعی داده ها را تعیین می کند. سرعت داده های بزرگ با سرعت جریان داده ها از منابع مانند فرآیندهای کسب و کار، log های کاربرد، شبکه ها و سایت های اجتماعی، حسگرها، دستگاه های تلفن همراه و غیره سرو کار دارد. جریان داده ها گسترده و پیوسته است.

تغییرپذیری

این به ناهماهنگی که می تواند توسط داده ها در زمان نشان داده شود اشاره می کند، در نتیجه مانع از پردازش و مدیریت موثر داده ها می شود.

کلان داده ها

کلان داده ها

مزایای پردازش بیگ دیتا یا داده های بزرگ

در تجارت و کسب وکار می توان از اطلاعات خارجی در حین تصمیم گیری استفاده کرد. دسترسی به داده های اجتماعی از موتورهای جستجو و سایت هایی مانند فیس بوک، توییتر و… سازمان ها را قادر می سازد تا راهکارهای کسب و کار خود را به خوبی تنظیم کنند.

بهبود خدمات مشتری

سیستم های بازخورد مشتری مرسوم با سیستم های طراحی شده جدید با فن آوری های بیگ دیتا جایگزین می شوند. در این سیستم های جدید، داده های بزرگ و تکنولوژی پردازش زبان طبیعی مورد استفاده قرار می گیرند تا پاسخ های مصرف کنندگان را بخوانند و ارزیابی کنند.

تشخیص زودهنگام خطر در صورت وجود برای محصول، خدمات و…

کارایی عملیاتی بهتر

فن آوری داده های بزرگ را می توان در ایجاد قسمت نمایش یا قسمت ورود برای داده های جدید قبل از شناسایی داده ها مورد استفاده قرار داد. علاوه بر این، یکپارچه سازی فن آوری بیگ دیتا یا داده های بزرگ و انبار داده ها، به سازمان کمک می کند تا به ندرت اطلاعات قابل دسترس را منتقل و یا حذف کند.

منبع : guru99