Data Mining umfasst das Analysieren großer Datenmengen (Big Data) in einer cloudbasierten Umgebung unter systematischer Anwendung von statistischen Methoden, um Muster und Auffälligkeiten herauszusuchen. Nicht immer ist zwangsläufig ein festes oder konkretes Ziel damit verbunden. Der Prozess umfasst auch eine vorherige Datenbereinigung und -aufbereitung.
Typische Aufgaben beim Data Mining sind das Auffinden von Ausreißern, das Finden von Clustern und/oder Kategorien, sowie das Auffinden von Abhängigkeiten und Zusammenhängen zwischen Datensätzen.