大概在1999年,SIG(CRISP-DM Special Interest Group)組織開發並提煉出CRISP-DM,同時在Mercedes-Benz和OHRA(保險領域)企業進行了大規模數據挖掘項目的實際試用。SIG還將CRISP-DM和商業數據挖掘工具集成起來。SIG組織目前在倫敦、紐約、布魯塞爾已經發展到200多個成員。2000年,CRISP-DM 1.0版正式推出,應該說CRISP-DM是實際項目的經驗總結和理論抽象。 CRISP-DM強調,DM不單是數據的組織或者呈現,也不僅是數據分析和統計建模,而是一個從理解業務需求、尋求解決方案到接受實踐檢驗的完整過程。
CRISP-DM過程描述
CRISP-DM 模型爲一個KDD工程提供了一個完整的過程描述。一個數據挖掘項目的生命週期包含六個階段。這六個階段的順序是不固定的,我們經常需要前後調整這些階段。這依賴每個階段或是階段中特定任務的產出物是否是下一個階段必須的輸入。上圖中箭頭指出了最重要的和依賴度高的階段關係。上圖的外圈象徵數據挖掘自身的循環本質――在一個解決方案發布之後一個數據挖掘的過程纔可以繼續。在這個過程中得到的知識可以觸發新的,經常是更聚焦的商業問題。後續的過程可以從前一個過程得到益處。