کلان داده یا طبق مصوبه سال ۱۳۹۴ فرهنگستان “مه داده” داراییهای دادهایاند بسیار انبوه، پرشتاب و/یا گوناگون که نیاز به روشهای پردازشی تازهای دارند تا تصمیمگیری، بینش تازه و بهینگی پردازش پیشرفته را فراهم آورند. مه داده مسیر حرکت کسب و کار و فرآیند چرخش کار در سازمانها را مشخص میکند. در مه داده با دادههای متمایز و بزرگ که دائماً از لحاظ حجم، نرخ تولید داده و تنوع در حال تغییر هستند سروکار داریم.
تعریف مه داده از دیدگاه موسسه ی گارتنر و دوگ لینی
برای بزرگ داده ها تعاریف مختلفی وجود دارد. یکی از تعاریف اولیه در این باره را آقای دوگ لینی یکی از تحلیل گران موسسه ی گارتنر در سال ۲۰۰۱ ارائه داد: «مجموعه داده هایی با حجم[۲]، تنوع[۳] و سرعت[۴] بالا که ذخیره سازی و پردازش آن ها نیازمند ابزارهای جدید و مقرون به صرفه است».
تعریف بزرگ داده ها از دیدگاه شرکت IBM
چند سال بعد شرکت IBM یک بُعد دیگر به سه بعد نام برده شده در تعریف گارتنر تحت عنوان صحت (Veracity) اضافه کرد (برای مشاهده ی اینفوگرافیک تهیه شده توسط IBM کلیک کنید). در برخی موارد از معکوس صحت یعنی عدم قطعیت (Uncertainty) به جای صحت استفاده می شود. واضح است که هرچه صحت داده ها بیشتر باشد عدم قطعیت کمتر است. علاوه بر این چهار بعد، ابعاد دیگری هم به مرور زمان توسط افراد مختلف ارائه شد. بعد پنجم را ارزش (Value) نام گذاری کرده اند. دلیل استفاده از این بعد هم این است که معتقدند مه داده ها تا وقتی که نتوانیم از آن ها بهره ای ببریم ارزشی ندارند و مفید نیستند. حتی برنارد مار از متخصصین شرکت IBM معتقد است تنها بعدِ «ارزش» است که در بین ۵ بعد معرفی شده اهمیت دارد.