什麼是數據挖掘?
數據挖掘通常被定義為搜索,分析和篩選,通過大量的數據,以找到關係,模式,或任何重大的統計相關性。 隨著計算機,大型數據庫和互聯網,這是比以往更容易收集幾百萬,幾十億,甚至數萬億件的數據,就可以系統地分析,以幫助尋找關係,並尋求解決困難的問題。 除了政府使用,許多營銷商利用數據挖掘找到強勁的消費模式和關係。 大型組織和教育機構也找到地雷數據顯著相關性,可以提高我們的社會。
而數據挖掘是不道德的事實,即它只能尋找很強的統計相關性或關係,它可以用於任何好或不好的目的。 例如,許多政府組織依賴於數據挖掘,幫助它們制訂解決方案,為許多社會問題。 商家利用數據挖掘技術來幫助他們引腳點和注意力集中在某些階層的市場銷售,並在某些情況下,黑帽黑客可以利用數據挖掘盜竊和詐騙數千人。
數據挖掘是如何工作的? 以及快速的回答是,大量的數據收集。 最通常的實體進行數據挖掘的大公司和政府機構。 他們已經收集數據,他們幾十年來,有很多的數據篩選。 如果你是一個相當新的企業或個人,可以購買某些類型的數據,以便為您的煤礦自己的目的。 此外,數據也可以從大型託管被盜黑客的黑客進入一個大型數據庫或只是偷竊的筆記本電腦,生病的保護。
如果你有興趣的一個小案例研究,數據挖掘是如何收集,使用和受益關閉的,你可以看看你當地的超市。 您的超市通常是一個非常精幹和有組織的實體,依賴於數據挖掘,以確保它是有利可圖的。 通常您的超市員工的POS (銷售點)系統 ,收集數據,每個項目購買。 POS系統收集的數據,該項目的品牌名稱,類別,規模,時間和日期,購買和以什麼價格購買了該項目上。 此外,超市通常有一個客戶獎勵計劃,其中還輸入到POS系統。 這些信息可以直接聯繫購買產品的個人。 所有這些數據都購買了多年都存儲在計算機數據庫中的超市。
現在,你有一個數據庫,數以百萬計的數據字段和記錄,你會怎樣做呢? 嗯,你的數據排雷它。 知識就是力量,並有這麼多的數據就可以發現趨勢,統計相關性,關係和模式,可幫助您的企業變得更有效率,有效和精簡。
超市現在可以計算出該品牌的銷售最大,什麼時間,週,月或年是最繁忙的,什麼產品消費者購買某些物品。 例如,如果一個人買白麵包,還有什麼其他項目的,他們傾向於購買? 通常情況下我們可以找到它的花生醬和果凍。 有如此多的好資料,超市可以使用剛才的數據挖掘自己的數據,他們已經收集。
|

