99国产精品99久久久久久,国产婷婷色一区二区三区在线,√在线天堂中文最新版网,噜噜色综合天天综合网mp3,国产精品亚洲综合一区二区三区

域名綜合信息查詢...
  • 綜合
  • Whois
×
歷史記錄
首頁 > 常見問題 > 正文

什么是數(shù)據(jù)挖掘?數(shù)字挖掘有哪些流程?

發(fā)布時間:2023-02-17 14:19:11 來源:互聯(lián)網(wǎng) 作者:ty 點擊量:1664

什么是數(shù)據(jù)挖掘?數(shù)字挖掘的概念是什么?數(shù)據(jù)挖掘一般要經(jīng)歷哪些流程?下面是有關(guān)數(shù)字挖掘的介紹。

據(jù)了解,數(shù)據(jù)挖掘理論涉及到的面很廣,它實際上起源于多個學科,可以簡單的理解為從大量數(shù)據(jù)中提取或挖掘知識或者說是知識發(fā)現(xiàn)。

數(shù)據(jù)挖掘應(yīng)用了眾多領(lǐng)域的思想,包括來自統(tǒng)計學的抽樣、估計和假設(shè)檢驗;來自人工智能、模式識別和機器學習的搜索算法、建模技術(shù)和學習理論等。

數(shù)據(jù)挖掘一般經(jīng)歷以下幾個流程:

1. 解讀需求

絕大多數(shù)的數(shù)據(jù)挖掘工程都是針對具體領(lǐng)域的,因此數(shù)據(jù)挖掘工作人員不應(yīng)該沉浸在自己的世界里YY算法模型,而應(yīng)該多和具體領(lǐng)域的專家交流合作以正確的解讀出項目需求。這種合作應(yīng)當貫穿整個項目生命周期。

2. 搜集數(shù)據(jù)

在大型公司,數(shù)據(jù)搜集大都是從其他業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫提取。很多時候我們是對數(shù)據(jù)進行抽樣,在這種情況下必須理解數(shù)據(jù)的抽樣過程是如何影響取樣分布,以確保評估模型環(huán)節(jié)中用于訓練(train)和檢驗(test)模型的數(shù)據(jù)來自同一個分布。

3. 預(yù)處理數(shù)據(jù)

預(yù)處理數(shù)據(jù)可主要分為數(shù)據(jù)準備和數(shù)據(jù)歸約兩部分。其中前者包含了缺失值處理、異常值處理、歸一化、平整化、時間序列加權(quán)等;而后者主要包含維度歸約、值歸約、以及案例歸約。后面兩篇博文將分別講解數(shù)據(jù)準備和數(shù)據(jù)歸約。

4. 評估模型

確切來說,這一步就是在不同的模型之間做出選擇,找到最優(yōu)模型。很多人認為這一步是數(shù)據(jù)挖掘的全部,但顯然這是以偏概全的,甚至絕大多數(shù)情況下這一步耗費的時間和精力在整個流程里是最少的。

5. 解釋模型

數(shù)據(jù)挖掘模型在大多數(shù)情況下是用來輔助決策的,人們顯然不會根據(jù)"黑箱模型"來制定決策。如何針對具體環(huán)境對模型做出合理解釋也是一項非常重要的任務(wù)。

以上就是有關(guān)什么是數(shù)據(jù)挖掘?數(shù)字挖掘有哪些流程的介紹。

域名注冊價格:http://www.lenghan.cn/regym.htm?t=seo_adzcw
域名一口價交易:http://www.lenghan.cn/ykj/?t=seo_admm
過期域名查詢:http://www.lenghan.cn/gq/?t=seo_adqz
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享網(wǎng)絡(luò)內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:400-997-2996;郵箱:service@Juming.com。本站原創(chuàng)內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明出處:聚名網(wǎng) 什么是數(shù)據(jù)挖掘?數(shù)字挖掘有哪些流程?
關(guān)鍵詞: 數(shù)據(jù)挖掘
熱門競價 更多>
推薦一口價 更多>
常見問題相關(guān)文章

登錄聚名,您可以享受以下權(quán)益:

立即登錄/注冊