大香蕉综合在线观看视频-日本在线观看免费福利-欧美激情一级欧美精品性-综合激情丁香久久狠狠

好房網(wǎng)

網(wǎng)站首頁(yè)百科全書(shū) >正文

數(shù)據(jù)預(yù)處理的工具有哪些(數(shù)據(jù)預(yù)處理技術(shù)有哪些)

2022-07-04 12:15:13 百科全書(shū)來(lái)源:
導(dǎo)讀1、數(shù)據(jù)預(yù)處理技術(shù)有哪些2、有四種數(shù)據(jù)預(yù)處理技術(shù):3、1.數(shù)據(jù)清理??杖敝堤幚怼⒏袷綐?biāo)準(zhǔn)化、異常數(shù)據(jù)消除、錯(cuò)誤校正和重復(fù)數(shù)據(jù)消除。4、2....

1、數(shù)據(jù)預(yù)處理技術(shù)有哪些

2、有四種數(shù)據(jù)預(yù)處理技術(shù):

3、1.數(shù)據(jù)清理??杖敝堤幚怼⒏袷綐?biāo)準(zhǔn)化、異常數(shù)據(jù)消除、錯(cuò)誤校正和重復(fù)數(shù)據(jù)消除。

4、2.數(shù)據(jù)整合。將來(lái)自多個(gè)數(shù)據(jù)源的數(shù)據(jù)組合起來(lái),以統(tǒng)一的方式存儲(chǔ),構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程實(shí)際上就是數(shù)據(jù)集成。

5、3.數(shù)據(jù)轉(zhuǎn)換。平滑、聚合、歸一化、最小-最大歸一化等。

6、4.數(shù)據(jù)簡(jiǎn)化。降維(刪除無(wú)關(guān)屬性(維度))、數(shù)據(jù)壓縮(PCA、LDA、SVD、小波變換)、數(shù)值降維(回歸和對(duì)數(shù)線(xiàn)性模型、線(xiàn)性回歸、對(duì)數(shù)線(xiàn)性模型、直方圖)。

7、現(xiàn)實(shí)中,世界上的數(shù)據(jù)一般都是不完整、不一致的臟數(shù)據(jù),無(wú)法直接挖掘,或者挖掘結(jié)果不盡如人意。為了提高數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)預(yù)處理技術(shù)得到了發(fā)展。數(shù)據(jù)預(yù)處理的方法有很多:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸約等。這些數(shù)據(jù)處理技術(shù)是在數(shù)據(jù)挖掘之前使用的,大大提高了數(shù)據(jù)挖掘模式的質(zhì)量,減少了實(shí)際挖掘所需的時(shí)間。數(shù)據(jù)清理例程通過(guò)填充缺失值、平滑噪聲數(shù)據(jù)、識(shí)別或刪除異常值以及解決不一致來(lái)“清理”數(shù)據(jù)。主要實(shí)現(xiàn)了以下目標(biāo):格式標(biāo)準(zhǔn)化、異常數(shù)據(jù)剔除、糾錯(cuò)和重復(fù)數(shù)據(jù)剔除。在挖掘數(shù)據(jù)的時(shí)候,數(shù)據(jù)量非常大,少量的數(shù)據(jù)挖掘和分析需要很長(zhǎng)的時(shí)間。利用數(shù)據(jù)約簡(jiǎn)技術(shù)可以得到數(shù)據(jù)集的約簡(jiǎn)表示,約簡(jiǎn)表示要小得多,但仍接近保持原始數(shù)據(jù)的完整性,結(jié)果與約簡(jiǎn)前相同或幾乎相同。

本文到此結(jié)束,希望對(duì)大家有所幫助。


版權(quán)說(shuō)明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!


標(biāo)簽:

熱點(diǎn)推薦
熱評(píng)文章
隨機(jī)文章