गोनपा वसुधा
डेटा माइनिंग बड़े डेटा सेट में पैटर्न की खोज करने की एक प्रक्रिया है जिसमें मशीन लर्निंग, सांख्यिकी और डेटाबेस सिस्टम के चौराहे पर विधियां शामिल हैं। डेटा माइनिंग कंप्यूटर विज्ञान और सांख्यिकी का एक अंतःविषय उपक्षेत्र है जिसका एक समग्र लक्ष्य डेटा सेट से जानकारी (बुद्धिमान तरीकों से) निकालना और जानकारी को आगे के उपयोग के लिए एक समझने योग्य संरचना में बदलना है। डेटा माइनिंग "डेटाबेस में ज्ञान की खोज" प्रक्रिया, या KDD का विश्लेषण चरण है। कच्चे विश्लेषण चरण के अलावा, इसमें डेटाबेस और डेटा प्रबंधन पहलू, डेटा प्री-प्रोसेसिंग, मॉडल और अनुमान विचार, रोचकता मीट्रिक, जटिलता विचार, खोजी गई संरचनाओं की पोस्ट-प्रोसेसिंग, विज़ुअलाइज़ेशन और ऑनलाइन अपडेटिंग भी शामिल है।