دادههای عظیم اصطلاحی است که به مجموعهٔ دادههایی اطلاق میشود که مدیریت، کنترل و پردازش آنها فراتر از توانایی ابزارهای نرمافزاری در یک زمان قابل تحمل و مورد انتظار است. مقیاس بزرگداده، به طور مداوم در حال رشد از محدودهٔ چند ۱۰ ترابایت به چندین پتابایت، در یک مجموعهٔ داده واحد است. نـمونههایی از بزرگداده، شبکههای حسگر، شبکههای اجتماعی و نمایههای جستجوهای اینترنتی هستند.
برای ذخیره سازی و انجام عملیات بر روی داده های عظیم سیستم هایی مطرح و کارهای بسیاری انجام شده و می شود که یکی از انها Hadoop است که در دانشنامه های بعدی درباره ی ان توضیح خواهیم داد.