دپارتمان مه داده

 

کلان داده یا طبق مصوبه سال ۱۳۹۴ فرهنگستان “مه داده” دارایی‌های داده‌ای‌اند بسیار انبوه، پرشتاب و/یا گوناگون که نیاز به روش‌های پردازشی تازه‌ای دارند تا تصمیم‌گیری، بینش تازه و بهینگی پردازش پیشرفته را فراهم آورند.  مه داده‌ مسیر حرکت کسب و کار و فرآیند چرخش کار در سازمان‌ها را مشخص می‌کند. در مه داده با داده‌های متمایز و بزرگ که دائماً از لحاظ حجم، نرخ تولید داده و تنوع در حال تغییر هستند سروکار داریم.

 

تعریف مه داده از دیدگاه موسسه ی گارتنر و دوگ لینی

برای بزرگ داده ها تعاریف مختلفی وجود دارد. یکی از تعاریف اولیه در این باره را آقای دوگ لینی یکی از تحلیل گران موسسه ی گارتنر در سال ۲۰۰۱ ارائه داد: «مجموعه داده هایی با حجم[۲]، تنوع[۳] و سرعت[۴] بالا که ذخیره سازی و پردازش آن ها نیازمند ابزارهای جدید و مقرون به صرفه است».

تعریف بزرگ داده ها از دیدگاه شرکت IBM

چند سال بعد شرکت IBM یک بُعد دیگر به سه بعد نام برده شده در تعریف گارتنر تحت عنوان صحت (Veracity) اضافه کرد (برای مشاهده ی اینفوگرافیک تهیه شده توسط IBM کلیک کنید). در برخی موارد از معکوس صحت یعنی عدم قطعیت (Uncertainty) به جای صحت استفاده می شود. واضح است که هرچه صحت داده ها بیشتر باشد عدم قطعیت کمتر است.  علاوه بر این چهار بعد، ابعاد دیگری هم به مرور زمان توسط افراد مختلف ارائه شد. بعد پنجم را ارزش (Value) نام گذاری کرده اند. دلیل استفاده از این بعد هم این است که معتقدند مه داده ها تا وقتی که نتوانیم از آن ها بهره ای ببریم ارزشی ندارند و مفید نیستند. حتی برنارد مار از متخصصین شرکت IBM معتقد است تنها بعدِ «ارزش» است که در بین ۵ بعد معرفی شده اهمیت دارد.