亚洲国产成人久久77-亚洲国产成人久久99精品-亚洲国产成人久久精品hezyo-亚洲国产成人久久精品动漫-人妖hd-人妖ts在线,一本道高清DVD在线视频,2020亚洲永久精品导航,国产久久视频在线视频观看

當(dāng)前位置: 首頁(yè) 精選范文 數(shù)據(jù)分析方法范文

數(shù)據(jù)分析方法精選(五篇)

發(fā)布時(shí)間:2023-11-10 11:02:46

序言:作為思想的載體和知識(shí)的探索者,寫作是一種獨(dú)特的藝術(shù),我們?yōu)槟鷾?zhǔn)備了不同風(fēng)格的5篇數(shù)據(jù)分析方法,期待它們能激發(fā)您的靈感。

數(shù)據(jù)分析方法

篇1

1、將收集到的數(shù)據(jù)通過(guò)加工、整理和分析的過(guò)程,使其轉(zhuǎn)化為信息,通常來(lái)說(shuō),數(shù)據(jù)分析常用的方法有列表法和作圖法,所謂列表法,就是將數(shù)據(jù)按一定規(guī)律用列表方式表達(dá)出來(lái),是記錄和處理數(shù)據(jù)最常用的一種方法。

2、表格設(shè)計(jì)應(yīng)清楚表明對(duì)應(yīng)關(guān)系,簡(jiǎn)潔明了,有利于發(fā)現(xiàn)要相關(guān)量之間的關(guān)系,并且在標(biāo)題欄中還要注明各個(gè)量的名稱、符號(hào)、數(shù)量級(jí)和單位等。

3、而作圖法則能夠醒目地表達(dá)各個(gè)物理量間的變化關(guān)系,從圖線上可以簡(jiǎn)便求出實(shí)驗(yàn)需要的某些結(jié)果,一些復(fù)雜的函數(shù)關(guān)系也可以通過(guò)一定的變化用圖形來(lái)表現(xiàn)。

(來(lái)源:文章屋網(wǎng) )

篇2

關(guān)鍵詞:大數(shù)據(jù);分析模型;房?jī)r(jià)

中圖分類號(hào):TP399 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)03-0137-02

1 引言

大數(shù)據(jù)分析首先要建立一個(gè)分析模型,分析模型是大數(shù)據(jù)分析的基石,只有先建立了模型才能對(duì)大數(shù)據(jù)進(jìn)行分析。構(gòu)建大數(shù)據(jù)分析模型傳統(tǒng)的方法很難實(shí)現(xiàn),大數(shù)據(jù)非結(jié)構(gòu)化、屬性很難預(yù)知,通過(guò)數(shù)學(xué)、統(tǒng)計(jì)學(xué)等方法構(gòu)建大數(shù)據(jù)分析模型都比較困難,機(jī)器學(xué)習(xí)是構(gòu)建大數(shù)據(jù)分析模型最有效的方法之一。機(jī)器學(xué)習(xí)通過(guò)不斷地學(xué)習(xí)優(yōu)化、不斷地迭代逼近所要的模型。

2 訓(xùn)練數(shù)據(jù)準(zhǔn)備

機(jī)器學(xué)習(xí)構(gòu)建大數(shù)據(jù)分析模型的方法是通過(guò)訓(xùn)練數(shù)據(jù)將模型訓(xùn)練出來(lái)。從要研究的大數(shù)據(jù)對(duì)象中找出訓(xùn)練集。機(jī)器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)需要教師,監(jiān)督機(jī)器學(xué)習(xí)的結(jié)果,事先設(shè)定好學(xué)習(xí)目標(biāo),期望的結(jié)果。非監(jiān)督學(xué)習(xí)的數(shù)據(jù)一般都無(wú)標(biāo)簽,學(xué)習(xí)結(jié)果事先也無(wú)法預(yù)知,通過(guò)數(shù)據(jù)可視化等方法觀察學(xué)習(xí)結(jié)果。

房?jī)r(jià)大數(shù)據(jù)分析模型機(jī)器學(xué)習(xí)屬于監(jiān)督學(xué)習(xí),期望預(yù)測(cè)值極大地逼近真實(shí)值。首先需要采集房?jī)r(jià)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),然后設(shè)計(jì)房?jī)r(jià)大數(shù)據(jù)分析模型機(jī)器學(xué)習(xí)算法,計(jì)算機(jī)通過(guò)機(jī)器學(xué)習(xí)算法和學(xué)習(xí)路徑學(xué)習(xí)訓(xùn)練數(shù)據(jù),學(xué)習(xí)目標(biāo)是預(yù)測(cè)的結(jié)果極大地逼近真實(shí)數(shù)據(jù),通過(guò)反復(fù)迭代,不斷地接近目標(biāo),訓(xùn)練出所希望的模型。

3 數(shù)據(jù)清洗

清洗后的訓(xùn)練數(shù)據(jù)如下:

間數(shù)(x1) x1 2 x1 2 x1 3 x1 3 x1 3 x1 3 x1 2 x1 2 x1 2 x1 3 x1 3 x1 3 x1 2 x1 2 x1 1 x1 3 x1 3 x1 3 x1 3 x1 1 x1 2 x1 2 x1 2 x1 2 x1 2 x1 3 x1 2 x1 3 x1 2 x1 2 x1 3 x1 2 x1 2 x1 3 x1 3 x1 3 x1 2 x1 3 x1 2 x1 1 x1 2 x1 2 x1 2 x1 2

面e(x2) x2 126 x2 99 x2 134 x2 137 x2 135 x2 138 x2 104 x2 99 x2 105 x2 126 x2 112 x2 116 x2 88 x2 90 x2 79 x2 120 x2 155 x2 158 x2 161 x2 66 x2 108 x2 88 x2 111 x2 103 x2 104 x2 131 x2 105 x2 130 x2 102 x2 105 x2 148 x2 98 x2 100 x2 128 x2 110 x2 101 x2 121 x2 127 x2 103 x2 67 x2 78 x2 71 x2 81 x2 77

價(jià)格(y1) y1 460 y1 425 y1 515 y1 580 y1 630 y1 600 y1 425 y1 439 y1 435 y1 608 y1 460 y1 460 y1 410 y1 380 y1 340 y1 520 y1 685 y1 680 y1 630 y1 328 y1 532 y1 405 y1 495 y1 470 y1 480 y1 690 y1 480 y1 690 y1 462 y1 495 y1 540 y1 440 y1 510 y1 599 y1 395 y1 450 y1 455 y1 595 y1 403 y1 295 y1 315 y1 345 y1 355 y1 335

4 房?jī)r(jià)大數(shù)據(jù)分析模型機(jī)器學(xué)習(xí)算法

機(jī)器學(xué)習(xí)首先要設(shè)計(jì)機(jī)器學(xué)習(xí)學(xué)習(xí)算法,設(shè)計(jì)機(jī)器學(xué)習(xí)學(xué)習(xí)路徑,機(jī)器學(xué)習(xí)解決的問(wèn)題通常可分為預(yù)測(cè)和分類兩類問(wèn)題。首先我們分析一下要解決的問(wèn)題是屬于預(yù)測(cè)問(wèn)題還是分類問(wèn)題,然后選擇相應(yīng)的學(xué)習(xí)算法,設(shè)計(jì)學(xué)習(xí)路徑,通過(guò)訓(xùn)練數(shù)據(jù)訓(xùn)練和機(jī)器學(xué)習(xí)構(gòu)建大數(shù)據(jù)分析模型。模型通過(guò)訓(xùn)練數(shù)據(jù)訓(xùn)練出來(lái)以后,對(duì)模型進(jìn)行檢驗(yàn),然后不斷進(jìn)行優(yōu)化,以達(dá)到我們所期望的精度。

以下是梯度下降機(jī)器學(xué)習(xí)算法和學(xué)習(xí)路徑:

首先建立一個(gè)估值函數(shù)(模型)如下:

x為自變量(特征參數(shù)),h(x)為應(yīng)變量(房?jī)r(jià)的估值),希望求出此函數(shù)的系數(shù)θ0、θ1,構(gòu)成一個(gè)完整的函數(shù),此函數(shù)就是我們要構(gòu)建的大數(shù)據(jù)分析模型。

我們建立一個(gè)成本函數(shù),希望預(yù)測(cè)值與真實(shí)值的差趨近于0,也就是成本函數(shù)值趨近于0。

J(0, 1)=

其中:

X(I)表示向量X中的第i個(gè)元素;

Y(I)表示向量Y中的第i個(gè)元素;

表示已知的假設(shè)函數(shù);

m為訓(xùn)練集的數(shù)量;

Gradient Descent梯度下降方法機(jī)器學(xué)習(xí)步驟:

(1)先隨機(jī)選定一個(gè)初始點(diǎn);

(2)確定梯度下降方向;

(3)通過(guò)實(shí)驗(yàn)確定下降步伐,學(xué)習(xí)率Learning rate;

(4)通過(guò)不斷地遞歸,收斂到極小值;

通過(guò)梯度下降法使成本函數(shù)趨于0,在此條件下求得自變量的系數(shù)θ0和θ1,將此θ0和θ1帶入到函數(shù)中得到我們要的模型。

下面是介紹如何運(yùn)用梯度下降法,經(jīng)過(guò)反復(fù)迭代求出θ0和θ1:

梯度下降是通過(guò)不停的迭代,最后沿梯度下降到最低點(diǎn),收斂到一個(gè)我們滿意的數(shù)據(jù),誤差趨近于0時(shí)迭代結(jié)束,此時(shí)的θ0和θ1正是我們要求的函數(shù)自變量的系數(shù),有了θ0和θ1,這個(gè)假設(shè)的函數(shù)就建立起來(lái)了,這個(gè)函數(shù)就是我們要建的大數(shù)據(jù)分析模型。

梯度下降法分為批量梯度下降法和隨機(jī)梯度下降法,批量梯度下降法速度較慢,每次迭代都要所有訓(xùn)練數(shù)據(jù)參與;隨機(jī)梯度下降精度差一些,容易在極值周圍震蕩;房?jī)r(jià)大數(shù)據(jù)分析模型采用的是實(shí)時(shí)數(shù)據(jù)梯度下降法(Real Time Online Gradient Descent),可以隨著房?jī)r(jià)的變化隨時(shí)修正模型的參數(shù)。

5 構(gòu)建房?jī)r(jià)大數(shù)據(jù)分析模型

通過(guò)數(shù)據(jù)可視化,我們可以看到房?jī)r(jià)數(shù)據(jù)趨于線性,所以我們采用線性回歸構(gòu)建房?jī)r(jià)大數(shù)據(jù)分析模型。采用監(jiān)督學(xué)習(xí),先給定一個(gè)訓(xùn)練集,根據(jù)這個(gè)訓(xùn)練集學(xué)習(xí)出一個(gè)線性函數(shù),然后檢驗(yàn)這個(gè)函數(shù)訓(xùn)練的好壞,即此函數(shù)是否足夠擬合訓(xùn)練集數(shù)據(jù),不斷優(yōu)化模型減少殘差,最大限度地接近真實(shí)值。

假設(shè)房?jī)r(jià)大數(shù)據(jù)分析模型:

y=aX1+bX2

通過(guò)梯度下降法,不斷遞歸,最后使假設(shè)值與實(shí)際值之差趨近于0,求得此時(shí)的模型變量系數(shù)a、b,構(gòu)建線性函數(shù)(房?jī)r(jià)大數(shù)據(jù)分析模型)。模型通過(guò)回歸診斷、交叉驗(yàn)證不斷進(jìn)行優(yōu)化,直到誤差達(dá)到要求。

以下是采用機(jī)器學(xué)習(xí)算法構(gòu)建的房?jī)r(jià)大數(shù)據(jù)分析模型,用R語(yǔ)言編寫房?jī)r(jià)大數(shù)據(jù)分析模型程序如下:

令:a=q1;b=q2;

將訓(xùn)練數(shù)據(jù)以數(shù)據(jù)框的形式存儲(chǔ)。

pricedata

x1

x2

y

造梯度下降算法函數(shù),初始點(diǎn)q1=0、q2=0;下降速率d=0.0001。

grd2

q1=0;

q2=0;

d=0.0001;

i=0;

m=9;

plot(y~x1+x2,data=pricedata,pch=16,col='red');

通過(guò)反復(fù)迭代得出估值函數(shù)系數(shù)q1、q2。

while (i

{

i=i+1;

q1=q1-d/m*(q1*x1+q2*x2-y)*x1;

q2=q2-d/m*(q1*x1+q2*x2-y)*x2;

}

return(q1);

return(q2);

}

grd2();

model2

summary(model2);

通過(guò)summary(model2)匯總出模型變量系數(shù)。

篇3

關(guān)鍵詞:數(shù)據(jù)分析應(yīng)用率;分析應(yīng)用點(diǎn);四個(gè)層次;數(shù)據(jù)中心;儀表盤

中圖分類號(hào):N37 文獻(xiàn)標(biāo)識(shí)碼:B 文章編號(hào):1009-9166(2009)02(c)-0063-02

現(xiàn)代企業(yè)的決策往往是在整合大量信息資料的基礎(chǔ)上制定出來(lái)的,對(duì)數(shù)據(jù)的理解和應(yīng)用將是企業(yè)決策的基石。與傳統(tǒng)的操作型應(yīng)用相比,數(shù)據(jù)利用的應(yīng)用建設(shè)難度更大,它是隨著管理水平而發(fā)展,同時(shí)又取決于業(yè)務(wù)人員的主觀意識(shí),這就決定了以數(shù)據(jù)利用為核心的應(yīng)用建設(shè)不可能一蹴而就,而是一個(gè)長(zhǎng)期迭展的建設(shè)過(guò)程。從2003年起工廠開始全面推進(jìn)數(shù)據(jù)分析應(yīng)用工作,經(jīng)歷過(guò)曲折,同時(shí)也有收獲。經(jīng)過(guò)多年的努力,工廠的數(shù)據(jù)分析應(yīng)用工作開始進(jìn)入良性發(fā)展階段,筆者認(rèn)為有必要對(duì)工廠目前數(shù)據(jù)分析應(yīng)用工作作一總結(jié)和思考。

一、工廠數(shù)據(jù)分析應(yīng)用工作開展現(xiàn)狀

工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)至今已有四五年的時(shí)間,從最初全面調(diào)研工廠數(shù)據(jù)量和數(shù)據(jù)分析應(yīng)用狀況,將數(shù)據(jù)分析應(yīng)用率指標(biāo)作為方針目標(biāo)定量指標(biāo)來(lái)考核,到后來(lái)將數(shù)據(jù)分析應(yīng)用工作的推進(jìn)重心從量向質(zhì)轉(zhuǎn)移,采用以項(xiàng)目為載體進(jìn)行管理,著重體現(xiàn)數(shù)據(jù)分析應(yīng)用的實(shí)效性,再到目前以分析應(yīng)用的需求為導(dǎo)向,以分析應(yīng)用點(diǎn)為載體,分層次進(jìn)行策劃。經(jīng)過(guò)上述三個(gè)階段,工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)機(jī)制得到了逐步的完善,形成了廣度深度協(xié)同發(fā)展的信息資源利用管理框架。截止到目前,工廠數(shù)據(jù)分析應(yīng)用率達(dá)到96%,四個(gè)層次的分析應(yīng)用點(diǎn)共計(jì)100多個(gè),數(shù)據(jù)分析應(yīng)用工作在生產(chǎn)、質(zhì)量、成本、物耗、能源等條線得到廣泛開展,有效推動(dòng)了工廠管理數(shù)字化和精細(xì)化。2007年,工廠開始探索細(xì)化四個(gè)應(yīng)用層次的推進(jìn)脈絡(luò),進(jìn)一步豐富工廠信息資源利用框架,形成層次清晰、脈絡(luò)鮮明、職責(zé)分明的信息資源利用立體化的推進(jìn)思路。

1、第一層次現(xiàn)場(chǎng)監(jiān)控層。第一層次現(xiàn)場(chǎng)監(jiān)控層,應(yīng)用主體是一線工人和三班管理干部,應(yīng)用對(duì)象是生產(chǎn)過(guò)程實(shí)時(shí)數(shù)據(jù),應(yīng)用目標(biāo)是通過(guò)加強(qiáng)生產(chǎn)過(guò)程控制,輔助一線及時(shí)發(fā)現(xiàn)生產(chǎn)過(guò)程中的異常情況,提高生產(chǎn)穩(wěn)定性。例如制絲車間摻配工段的生產(chǎn)報(bào)警,通過(guò)對(duì)生產(chǎn)過(guò)程中葉絲配比、膨絲配比、梗絲配比、薄片配比、加香配比等信息進(jìn)行判異操作,對(duì)異常情況通過(guò)語(yǔ)音報(bào)警方式提醒擋車工進(jìn)行異常處理;例如卷包車間通過(guò)在機(jī)臺(tái)電腦上對(duì)各生產(chǎn)機(jī)組的工藝、設(shè)備參數(shù)、實(shí)時(shí)產(chǎn)量、質(zhì)量、損耗數(shù)據(jù)的監(jiān)控,提高對(duì)產(chǎn)品質(zhì)量的過(guò)程控制能力。第一層次應(yīng)用以上位機(jī)和機(jī)臺(tái)電腦上固化的監(jiān)控模型為主,制絲車間每個(gè)工序、卷包車間每種機(jī)型的應(yīng)用點(diǎn)都有所不同,為此我們建立了制絲車間以工序?yàn)槊}絡(luò),卷包車間以機(jī)種為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對(duì)第一層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第一層次應(yīng)用的規(guī)范化模板。制絲車間第一層次應(yīng)用點(diǎn)模板包括工序名稱、應(yīng)用點(diǎn)名稱、應(yīng)用模型描述、應(yīng)用對(duì)象、應(yīng)用平臺(tái)、異常處置路徑等基本要素。卷包車間應(yīng)用點(diǎn)模板橫向根據(jù)機(jī)種分,縱向按上班及交接班、上班生產(chǎn)過(guò)程中、下班及交接班三個(gè)時(shí)間段分,通過(guò)調(diào)研分別列出擋車工針對(duì)每個(gè)機(jī)種在三個(gè)時(shí)間段分別要查看的數(shù)據(jù)和進(jìn)行的操作。隨著模板的擴(kuò)充和完善,一線職工的知識(shí)、經(jīng)驗(yàn)不斷充實(shí)其中,第一層次應(yīng)用點(diǎn)模板將成為一線工人和三班管理干部日常應(yīng)用監(jiān)控的標(biāo)準(zhǔn),同時(shí)可以規(guī)避人員退休或調(diào)動(dòng)帶來(lái)的經(jīng)驗(yàn)、知識(shí)流失的風(fēng)險(xiǎn)。2、第二層次日常管理分析層。第二層次日常管理分析層,應(yīng)用主體是一般管理干部,應(yīng)用對(duì)象是產(chǎn)質(zhì)損、設(shè)備、動(dòng)能等指標(biāo),應(yīng)用目標(biāo)是通過(guò)加強(qiáng)對(duì)各類考核指標(biāo)的監(jiān)控和分析,提高工廠整體的關(guān)鍵績(jī)效指標(biāo)水平。例如制絲車間的劣質(zhì)成本數(shù)據(jù)匯總和分析,通過(guò)對(duì)車間內(nèi)各類廢物料、劣質(zhì)成本的數(shù)據(jù)進(jìn)行匯總、對(duì)比和分析,尋找其中規(guī)律及薄弱環(huán)節(jié),并尋根溯源,采取措施,降低劣質(zhì)成本。例如卷包車間的產(chǎn)量分析,通過(guò)對(duì)產(chǎn)量數(shù)據(jù)、工作日安排、計(jì)劃產(chǎn)量進(jìn)行統(tǒng)計(jì)和匯總,結(jié)合車間定額計(jì)劃、作業(yè)計(jì)劃和實(shí)際產(chǎn)量進(jìn)行分析,尋找實(shí)際生產(chǎn)情況與計(jì)劃間的差異,并分析原因。第二層次應(yīng)用以管理人員個(gè)性化的分析為主,呈現(xiàn)出分析方法多樣化、應(yīng)用工具多樣化的特點(diǎn)。但是萬(wàn)變不離其中的是每個(gè)管理崗位的管理目標(biāo)以及圍繞管理目標(biāo)開展的分析應(yīng)用是相對(duì)固定的,至少在短期內(nèi)不會(huì)有太大的變化。為此我們建立了一份以重點(diǎn)崗位為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對(duì)第二層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第二層次應(yīng)用的規(guī)范化模板。模板包括崗位名稱、管理目標(biāo)、應(yīng)用點(diǎn)名稱、應(yīng)用描述、涉及主要考核指標(biāo)、應(yīng)用平臺(tái)、應(yīng)用頻次、分析去向等基本要素。通過(guò)構(gòu)建第二層次應(yīng)用點(diǎn)模板,明確了每個(gè)管理崗位應(yīng)用信息資源支撐管理目標(biāo)的內(nèi)容和職責(zé)。隨著新的管理目標(biāo)的不斷提出以及應(yīng)用的逐步深入,模板每年都會(huì)有更新和擴(kuò)充。3、第三層次針對(duì)性分析應(yīng)用層。第三層次針對(duì)性分析應(yīng)用層,應(yīng)用主體是項(xiàng)目實(shí)施者,應(yīng)用對(duì)象是各類項(xiàng)目的實(shí)施過(guò)程,例如QC項(xiàng)目、六西格瑪項(xiàng)目、質(zhì)量改進(jìn)項(xiàng)目,或針對(duì)生產(chǎn)中的特定事件進(jìn)行的分析和研究。應(yīng)用目標(biāo)是通過(guò)應(yīng)用數(shù)據(jù)資源和統(tǒng)計(jì)方法開展現(xiàn)狀調(diào)查、因果分析、效果驗(yàn)證等工作,提高各類項(xiàng)目實(shí)施的嚴(yán)密性和科學(xué)性。第三層次的應(yīng)用工具在使用初級(jí)統(tǒng)計(jì)方法的基礎(chǔ)上會(huì)大量應(yīng)用包括方差分析、回歸分析、正交試驗(yàn)、假設(shè)檢驗(yàn)、流程圖等在內(nèi)的中級(jí)統(tǒng)計(jì)方法。以QC活動(dòng)為例,我們可以看出其實(shí)施過(guò)程無(wú)一不與數(shù)據(jù)應(yīng)用之間有密切的聯(lián)系[1]。近年來(lái),在質(zhì)量改進(jìn)項(xiàng)目和QC項(xiàng)目的評(píng)審工作中已逐步將“應(yīng)用數(shù)據(jù)說(shuō)話、運(yùn)用用正確合理的統(tǒng)計(jì)方法,提高解決問(wèn)題的科學(xué)性”作為項(xiàng)目質(zhì)量考核標(biāo)準(zhǔn)之一。而六西格瑪項(xiàng)目實(shí)施的核心思想更是強(qiáng)調(diào)“以數(shù)據(jù)和事實(shí)驅(qū)動(dòng)管理”,其五個(gè)階段[2]D(定義)、M(測(cè)量)、A(分析)、I(改善)、C(控制),每個(gè)階段都要求結(jié)合如FMEA(失效模式后果分析),SPC(統(tǒng)計(jì)流程控制),MSA(測(cè)量系統(tǒng)分析),ANOVE(方差分析),DOE(實(shí)驗(yàn)設(shè)計(jì))等統(tǒng)計(jì)方法和統(tǒng)計(jì)工具的應(yīng)用。4、第四層次主題性應(yīng)用層。第四層次主題性應(yīng)用層,應(yīng)用主體是中層管理者,應(yīng)用對(duì)象是專業(yè)性或綜合性的分析主題,應(yīng)用目標(biāo)是通過(guò)專業(yè)科室設(shè)計(jì)的專題性分析模型或綜合性分析模型,為中層管理層提供決策依據(jù)。工廠在實(shí)施了業(yè)務(wù)流程“自動(dòng)化”之后,產(chǎn)生了大量的數(shù)據(jù)和報(bào)表。如何將工廠的業(yè)務(wù)信息及時(shí)、精煉、明確地陳述給中層管理層,以此來(lái)正確地判斷工廠的生產(chǎn)經(jīng)營(yíng)狀況,是擺在我們眼前的一個(gè)突出問(wèn)題。大家都有開車的經(jīng)驗(yàn),司機(jī)在駕駛車輛的時(shí)候,他所掌握的車況基本上是來(lái)自汽車的儀表盤,在車輛行使的過(guò)程中,儀表盤指針的變化,告知汽車的車速、油料、水溫等的狀況,駕駛員只要有效地控制這些指標(biāo)在安全范圍之內(nèi),車子就能正常地運(yùn)行。我們不妨將儀表盤的理念移植于工廠,建立工廠關(guān)鍵指標(biāo)及運(yùn)行管理儀表盤,將工廠的關(guān)鍵信息直觀地列在上面,及時(shí)提醒各級(jí)管理人員工廠生產(chǎn)運(yùn)營(yíng)是否正常。

⑴關(guān)鍵績(jī)效指標(biāo)監(jiān)控系統(tǒng)。對(duì)分布在各處的當(dāng)前及歷史數(shù)據(jù)進(jìn)行統(tǒng)一展示,以工廠關(guān)鍵績(jī)效指標(biāo)為中心,支持統(tǒng)計(jì)分析和挖掘,可為中層管理者提供工廠關(guān)鍵績(jī)效指標(biāo)一門式的查詢服務(wù),使各業(yè)務(wù)部門尋找、闡釋問(wèn)題產(chǎn)生的原因,以有效監(jiān)控各類關(guān)鍵績(jī)效指標(biāo),及時(shí)采取改進(jìn)措施,提高生產(chǎn)經(jīng)營(yíng)目標(biāo)完成質(zhì)量。⑵系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng)。通過(guò)數(shù)據(jù)采集、手工錄入等各種渠道收集各類系統(tǒng)的運(yùn)行狀態(tài),及時(shí)掌握故障情況,采取措施加以閉環(huán),將因系統(tǒng)故障造成對(duì)用戶的影響減至最小,確保各類系統(tǒng)的穩(wěn)定運(yùn)行和有效應(yīng)用。通過(guò)建立系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng),中層管理人員上班一打開電腦進(jìn)入系統(tǒng),就能了解到當(dāng)天及上一天各類系統(tǒng)的運(yùn)轉(zhuǎn)情況,發(fā)生了什么異常,哪些故障已經(jīng)得到解決,哪些故障還未解決。⑶第四層次主題性分析應(yīng)用。在展示關(guān)鍵績(jī)效指標(biāo)和系統(tǒng)運(yùn)行狀態(tài)的基礎(chǔ)上,由各專業(yè)科室思考專業(yè)條線上的分析主題,采用先進(jìn)科學(xué)的理念和方法對(duì)數(shù)據(jù)進(jìn)行分析和挖掘。近兩年來(lái),工廠充分發(fā)揮專業(yè)科室的優(yōu)勢(shì)和力量,相繼設(shè)計(jì)和開發(fā)了工藝質(zhì)量條線的六西格瑪測(cè)評(píng)系統(tǒng),設(shè)備條線的設(shè)備效能分析系統(tǒng),還有質(zhì)量成本核算與分析系統(tǒng)。通過(guò)這些分析主題的支持,工廠管理人員可以更方便快捷地了解質(zhì)量、設(shè)備、成本等條線上的關(guān)鍵信息,及時(shí)采取相應(yīng)措施,從而提升管理效率。

二、數(shù)據(jù)分析應(yīng)用工作存在的不足及思考

工廠數(shù)據(jù)分析應(yīng)用工作的推進(jìn)方法從最初的采用數(shù)據(jù)分析應(yīng)用率單個(gè)指標(biāo)進(jìn)行推進(jìn)發(fā)展到目前按上文所述的四個(gè)層次進(jìn)行推進(jìn),每個(gè)層次的推進(jìn)脈絡(luò)已經(jīng)逐步清晰和明朗,但事物發(fā)展到一定的階段總會(huì)達(dá)到一個(gè)瓶頸口,目前工廠數(shù)據(jù)分析應(yīng)用工作存在的問(wèn)題及措施思考如下:

1、從推進(jìn)手段上要突破信息條線,充分發(fā)揮專業(yè)條線的力量。信息條線作為推進(jìn)工廠數(shù)據(jù)分析應(yīng)用的主管條線,其作用往往局限在技術(shù)層面上的支撐。雖然信息條線每年都會(huì)規(guī)劃形成工廠數(shù)據(jù)分析應(yīng)用整體的工作思路和具體的實(shí)施計(jì)劃,但是無(wú)論從工廠層面還是從車間層面來(lái)講,單純依靠信息條線從側(cè)面加以引導(dǎo)和推進(jìn),使得數(shù)據(jù)分析應(yīng)用工作始終在業(yè)務(wù)條線的邊緣徘徊,與產(chǎn)量、質(zhì)量、設(shè)備、消耗、成本、動(dòng)能等各個(gè)條線本身工作的結(jié)合度有一定的距離。所以工廠要進(jìn)一步推進(jìn)數(shù)據(jù)分析應(yīng)用工作,調(diào)動(dòng)起業(yè)務(wù)人員的積極性和主動(dòng)性,突破現(xiàn)有的瓶頸,應(yīng)該考慮如何調(diào)動(dòng)起專業(yè)條線的力量。一是可以在年初策劃應(yīng)用點(diǎn)的時(shí)候要加強(qiáng)專業(yè)條線對(duì)車間業(yè)務(wù)自上而下的指導(dǎo),引導(dǎo)管理人員加強(qiáng)對(duì)缺少數(shù)據(jù)分析支撐的工序、崗位/管理目標(biāo)的思考;二是建立平臺(tái)加強(qiáng)各車間同性質(zhì)崗位之間的溝通與交流,均衡各個(gè)車間的數(shù)據(jù)分析應(yīng)用水平和能力;三是對(duì)車間提交的分析報(bào)告給出專業(yè)性的指導(dǎo)意見(jiàn)。2、要加強(qiáng)對(duì)數(shù)據(jù)中心的應(yīng)用。數(shù)據(jù)中心的建立可以使業(yè)務(wù)系統(tǒng)從報(bào)表制作、數(shù)據(jù)導(dǎo)出等功能中解放出來(lái),專注于事務(wù)處理,將數(shù)據(jù)應(yīng)用方面的功能完全交給數(shù)據(jù)中心來(lái)解決。目前,數(shù)據(jù)中心已建立了涉及產(chǎn)量、質(zhì)量、消耗等各個(gè)條線的Universe模型,并對(duì)全廠管理干部進(jìn)行了普及性的培訓(xùn)。但是從目前應(yīng)用情況來(lái)看,還比較局限于個(gè)別管理人員,追尋原因如下:一是業(yè)務(wù)系統(tǒng)開發(fā)根據(jù)用戶需求定制開發(fā)報(bào)表,業(yè)務(wù)人員通常習(xí)慣于從現(xiàn)成的報(bào)表中獲取信息。如果要求業(yè)務(wù)人員使用數(shù)據(jù)中心工具自行制作報(bào)表模板,甚至可能需要將其導(dǎo)出再作二次處理,那么業(yè)務(wù)人員一定更傾向于選擇第一種方式。二是近幾年來(lái)人員更替較多,新進(jìn)管理人員不熟悉數(shù)據(jù)中心應(yīng)用,導(dǎo)致數(shù)據(jù)中心應(yīng)用面受到限制。隨著今后MES的建設(shè),業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)、報(bào)表、臺(tái)帳和分析功能將有可能由業(yè)務(wù)用戶自行通過(guò)集成在MES中的數(shù)據(jù)中心前端開發(fā)工具來(lái)訪問(wèn)和靈活定制。因此,要盡快培養(yǎng)工廠業(yè)務(wù)人員數(shù)據(jù)中心的應(yīng)用能力,包括數(shù)據(jù)獲取以及報(bào)表定制方面的技能。筆者認(rèn)為應(yīng)對(duì)方法如下:一是對(duì)于崗位人員變更做好新老人員之間一傳一的交接和培訓(xùn);二是適時(shí)針對(duì)新進(jìn)管理人員開展集中培訓(xùn);三是通過(guò)采用一定的考核方法。3、提高新增應(yīng)用點(diǎn)的質(zhì)量。工廠每年都會(huì)組織各部門審視第一、第二層次應(yīng)用點(diǎn)列表,圍繞重點(diǎn)工序和重點(diǎn)管理崗位調(diào)研有哪些應(yīng)用上的空白點(diǎn)是需要重點(diǎn)思考的,以新增分析應(yīng)用點(diǎn)的方式進(jìn)行申報(bào)和實(shí)施。同時(shí)針對(duì)第三層次針對(duì)性分析應(yīng)用,工廠也會(huì)要求部門以新增分析應(yīng)用點(diǎn)的方式將需要數(shù)據(jù)支撐的項(xiàng)目進(jìn)行申報(bào)。作為一項(xiàng)常規(guī)性工作,工廠每年都會(huì)組織部門進(jìn)行應(yīng)用點(diǎn)的申報(bào),并按項(xiàng)目管理的思想和方法實(shí)施,事先確立各個(gè)應(yīng)用點(diǎn)的應(yīng)用層次、數(shù)據(jù)獲取方式、實(shí)現(xiàn)平臺(tái),并對(duì)其實(shí)施計(jì)劃進(jìn)行事先的思考和分解,確定每一個(gè)階段的活動(dòng)目標(biāo)、時(shí)間節(jié)點(diǎn)以及負(fù)責(zé)人員,每個(gè)季度對(duì)實(shí)施情況予以總結(jié),并動(dòng)態(tài)更新下一階段的實(shí)施計(jì)劃。該項(xiàng)工作從2005年起已經(jīng)連續(xù)開展了三年,部門可供挖掘的應(yīng)用點(diǎn)越來(lái)越少,如何調(diào)動(dòng)部門的積極性,保持并提高應(yīng)用點(diǎn)的實(shí)效性,我們有必要對(duì)新增分析應(yīng)用點(diǎn)的質(zhì)量和實(shí)施情況進(jìn)行考評(píng),考評(píng)標(biāo)準(zhǔn)為:一是新增分析應(yīng)用點(diǎn)是否能體現(xiàn)數(shù)據(jù)應(yīng)用開展的進(jìn)取性、開拓性和創(chuàng)新性;二是新增分析應(yīng)用點(diǎn)是否能切實(shí)提高管理的精細(xì)化和科學(xué)化水平;三是新增分析應(yīng)用點(diǎn)是否能采用項(xiàng)目管理的思想和方法實(shí)施,按時(shí)間節(jié)點(diǎn)完成各項(xiàng)預(yù)定計(jì)劃。

三、結(jié)束語(yǔ)。隨著近幾年來(lái)技術(shù)平臺(tái)的相繼成熟以及管理手段的逐步推進(jìn),工廠業(yè)務(wù)人員用數(shù)據(jù)說(shuō)話的意識(shí)已經(jīng)越來(lái)越強(qiáng),但是要真正使工廠管理達(dá)到“三分技術(shù)、七分管理、十二分?jǐn)?shù)據(jù)”的水平,還有很長(zhǎng)的路要走,這既需要我們的業(yè)務(wù)人員從自身出發(fā)提高應(yīng)用數(shù)據(jù)的水平和能力,同時(shí)也需要工廠從管理手段和管理方法上不斷拓寬思路、創(chuàng)新手段,真正實(shí)現(xiàn)數(shù)據(jù)分析應(yīng)用成為工廠管理的重要支撐手段。

作者單位:上海卷煙廠

參考文獻(xiàn):

篇4

【關(guān)鍵詞】土工實(shí)驗(yàn);實(shí)驗(yàn)數(shù)據(jù);數(shù)據(jù)分析;分析方法

一、引言

在進(jìn)行實(shí)驗(yàn)過(guò)程中,由于土體本身所具有的復(fù)雜性,土質(zhì)質(zhì)檢所存在的物理學(xué)特性以及采樣、運(yùn)輸、存儲(chǔ)等等方面所表現(xiàn)出來(lái)的特點(diǎn),都容易對(duì)數(shù)據(jù)造成一定程度的干擾,致使實(shí)驗(yàn)的結(jié)果出現(xiàn)誤差。另外,因?yàn)閷?shí)驗(yàn)本身受到很多因素的干擾,也同樣容易發(fā)生數(shù)據(jù)偏差的問(wèn)題。因此,本文著重從實(shí)驗(yàn)數(shù)據(jù)所涉及的內(nèi)容,影響實(shí)驗(yàn)數(shù)據(jù)的因素,以及提升實(shí)驗(yàn)準(zhǔn)確率的角度出發(fā),對(duì)土工實(shí)驗(yàn)數(shù)據(jù)分析方法進(jìn)行探討。

二、土工試驗(yàn)數(shù)據(jù)所涉及內(nèi)容

(一)土的比重實(shí)驗(yàn)。土工試驗(yàn)過(guò)程中,土的比重實(shí)驗(yàn)是非常重要的。一般來(lái)說(shuō),地域相同或者相近,那么土的比重也將會(huì)比較相近。但是,因?yàn)樵趯?shí)際操作中,其整個(gè)的操作流程比較復(fù)雜,所以不同的單位會(huì)采用本地所出具的或者考察的相關(guān)數(shù)據(jù)直接進(jìn)行比重實(shí)驗(yàn),這樣容易導(dǎo)致實(shí)驗(yàn)數(shù)據(jù)的誤差存在。

(二)土的密度實(shí)驗(yàn)。通過(guò)土的密度實(shí)驗(yàn)可以詳細(xì)的了解土的組成,可以了解其組成成分的性質(zhì),能夠?yàn)橹蟮氖┕ぬ峁└嗟膮⒖肌M恋拿芏扰c土粒的重量、孔隙體積、孔隙大小、孔隙水重等等內(nèi)容息息相關(guān),能夠反映土的組成和基本結(jié)構(gòu)特征。在進(jìn)行實(shí)驗(yàn)的過(guò)程中,要注意盡量避免對(duì)取樣即時(shí)進(jìn)行實(shí)驗(yàn),最好能夠等待土樣達(dá)到日常狀態(tài)之后再進(jìn)行試驗(yàn),這樣可以讓土密度實(shí)驗(yàn)的結(jié)果更加準(zhǔn)確。

(三)土的含水量實(shí)驗(yàn)。土的含水量實(shí)驗(yàn)可以說(shuō)是土工實(shí)驗(yàn)中的核心內(nèi)容,其實(shí)驗(yàn)的情況將會(huì)影響到工程地基建設(shè),還會(huì)影響到后續(xù)工程的穩(wěn)定性。不同地區(qū)的土樣其含水量不同,并存在很大程度上的差異性。實(shí)驗(yàn)人員在進(jìn)行取樣的過(guò)程中,要保證其樣品的均勻性,或者具有代表性,否則進(jìn)行試驗(yàn)所獲得的數(shù)據(jù)就沒(méi)有任何指導(dǎo)意義,其數(shù)據(jù)在實(shí)踐應(yīng)用中的效率和質(zhì)量也將會(huì)呈現(xiàn)大幅度的下降。

三、土性參數(shù)實(shí)驗(yàn)結(jié)果誤差性的原因

(一)土體本身性質(zhì)導(dǎo)致。依照相關(guān)的物理力學(xué)和力學(xué)性質(zhì),我們可以了解到土體的分層具有不均勻性,加上其所處環(huán)境的變化,可能發(fā)生的雨水沖擊、水文變化、其后影響等等語(yǔ)速怒,都會(huì)讓土體的性質(zhì)發(fā)生改變。這樣在進(jìn)行土工試驗(yàn)的時(shí)候就非常容易造成實(shí)驗(yàn)結(jié)果的差異性,甚至有可能會(huì)成為差異產(chǎn)生的主要影響因素。

(二)系統(tǒng)誤差。系統(tǒng)誤差是由于儀器的某些不完善、測(cè)量技術(shù)上受到限制或?qū)嶒?yàn)方法不夠完善沒(méi)有保證正確的實(shí)驗(yàn)條件等原因產(chǎn)生。不同的單位所使用的儀器往往不盡相同,所使用的試驗(yàn)方法也有一定的出入,加上不同的試驗(yàn)方法讓土工參數(shù)出現(xiàn)離散性,其所實(shí)驗(yàn)的數(shù)據(jù)也就會(huì)有所不同。系統(tǒng)誤差的存在可以予以避免,其與偶然誤差不同,這就需要實(shí)驗(yàn)室對(duì)設(shè)備和系統(tǒng)進(jìn)行改進(jìn)。

(三)偶然誤差。偶然誤差的特點(diǎn)是它的隨機(jī)性。如果實(shí)驗(yàn)人員對(duì)某物理量只進(jìn)行一次測(cè)量,其值可能比真值大也可能比真值小,這完全是偶然的,產(chǎn)生偶然誤差的原因無(wú)法控制,所以偶然誤差總是存在,通過(guò)多次測(cè)量取平均值可以減小偶然誤差,但無(wú)法消除。偶然誤差的存在屬于客觀存在的現(xiàn)象,其與人為原因所造成的誤差有很大的差別,對(duì)于兩者應(yīng)當(dāng)予以區(qū)分。

四、土工實(shí)驗(yàn)數(shù)據(jù)分析方法的應(yīng)用

(一)進(jìn)行數(shù)據(jù)檢查,果斷進(jìn)行取舍。在進(jìn)行實(shí)驗(yàn)的過(guò)程中,如果有明顯不符合物理力學(xué)性質(zhì)的值的范圍點(diǎn),則可以通過(guò)觀察予以了解,實(shí)驗(yàn)人員要對(duì)其進(jìn)行細(xì)致觀察,一旦發(fā)現(xiàn)異常立刻予以放棄。一般判斷的標(biāo)準(zhǔn)是大部分?jǐn)?shù)值為范圍內(nèi)波動(dòng),但是有一點(diǎn)超出正常值或者距離正常值較遠(yuǎn),則可以被認(rèn)定為不合理。在實(shí)驗(yàn)數(shù)據(jù)較多的情況下可以運(yùn)用3σ法則進(jìn)行數(shù)據(jù)之間取舍的考量。在進(jìn)行實(shí)驗(yàn)過(guò)程中,存在于之外數(shù)值所占比例較少,因此,大于和小于之間數(shù)值作為異常處理。

(二)土工實(shí)驗(yàn)數(shù)據(jù)中最小樣本數(shù)問(wèn)題。在土工試驗(yàn)過(guò)程中,最小樣本數(shù)問(wèn)題需要引起人們的重視。實(shí)驗(yàn)中的樣本數(shù)要選取適當(dāng),如果樣本數(shù)過(guò)小就會(huì)影響實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。但是,樣本數(shù)的數(shù)量并不是隨意定制的,其受到多種因素的影響,比如工程規(guī)模、工程精度要求、現(xiàn)場(chǎng)勘查情況等等。

(三)土體性質(zhì)指標(biāo)的自相關(guān)性的問(wèn)題。根據(jù)以往數(shù)據(jù)實(shí)驗(yàn)的關(guān)聯(lián)性,求的往往是其之間的線性相關(guān)系數(shù),但是對(duì)于其自相關(guān)函數(shù)通常并沒(méi)有表現(xiàn)出線性相關(guān),而是指數(shù)相關(guān)。因此,不能簡(jiǎn)單依照求相關(guān)系數(shù)的方法判斷其相關(guān)性。在進(jìn)行土工實(shí)踐過(guò)程中,往往可以通過(guò)δ對(duì)其獨(dú)立性進(jìn)行判斷。在相關(guān)距離 范圍內(nèi),圖形指標(biāo)基本相關(guān);在此范圍外,圖形指標(biāo)基本不相關(guān)。但是對(duì)于δ事先未知,因此其需要根據(jù)樣本測(cè)值進(jìn)行求算,一般使用遞推平均法對(duì)相關(guān)距離δ進(jìn)行計(jì)算,并使用間距Z對(duì)δ的影響進(jìn)行綜合考量。一般來(lái)說(shuō),Z /δ的數(shù)值越大,其各抽樣點(diǎn)的土性越接近相互獨(dú)立,抽樣誤差也就越小。

五、結(jié)束語(yǔ)

土工試驗(yàn)對(duì)于土工建設(shè)來(lái)說(shuō)影響較大,其影響因素包括土體本身性質(zhì)、取樣儀器情況、人為因素等,需要對(duì)此方面予以重視。對(duì)其不合理點(diǎn)來(lái)說(shuō),可以通過(guò)3 原則進(jìn)行剔除。對(duì)于其數(shù)據(jù)相關(guān)性來(lái)說(shuō),其可以通過(guò)迭代求解土性指標(biāo)相關(guān)距離予以解決,通過(guò)樣本的加權(quán)平均來(lái)對(duì)該區(qū)域的平均性指標(biāo)進(jìn)行估算。為了讓樣本能夠滿足實(shí)驗(yàn)需要,可以利用Bayes方法對(duì)其土性指標(biāo)與因確認(rèn),從而彌補(bǔ)數(shù)目不準(zhǔn)確的情況。通過(guò)此三個(gè)方面對(duì)其進(jìn)行方法的應(yīng)用,則可以有效提升實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)確性、可靠性,可以讓實(shí)驗(yàn)的結(jié)果更加符合實(shí)際需要。

參考文獻(xiàn)

[1]余海龍,張利宇. 土工實(shí)驗(yàn)數(shù)據(jù)分析方法探討[J].中國(guó)新技術(shù)新產(chǎn)品,2015,21:132-133.

[2]劉松玉,蔡正銀. 土工測(cè)試技術(shù)發(fā)展綜述[J].土木工程學(xué)報(bào),2012,03:151-165.

篇5

關(guān)鍵詞:大數(shù)據(jù);分析模型;檢驗(yàn)方法

中圖分類號(hào):G712 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2017)17-0082-02

一、引言

房?jī)r(jià)大數(shù)據(jù)分析模型通過(guò)機(jī)器學(xué)習(xí)方法構(gòu)建,模型建立完成后需要對(duì)模型進(jìn)行檢驗(yàn),房?jī)r(jià)大數(shù)據(jù)模型需要檢驗(yàn)擬合的情況,欠擬合說(shuō)明模型對(duì)數(shù)據(jù)的覆蓋程度不夠,過(guò)擬合無(wú)法反應(yīng)模型的通用性。通過(guò)回歸診斷,診斷殘差情況,殘差是反映真實(shí)值與假設(shè)值之間的差,希望模型殘差盡量小,假設(shè)值極大地逼近真實(shí)值。通過(guò)檢驗(yàn)可以剔除奇異數(shù),剔除一些干擾項(xiàng)。

二、回歸診斷

1.房?jī)r(jià)大數(shù)據(jù)分析模型。price1

Residuals:

Min 1Q Median 3Q Max

-7.5556 -2.6667 -0.2222 3.5556 8.6667

殘差最小是-7.5556,最大是8.6667,中值是-0.2222。估計(jì)的值與真實(shí)值存在一定的誤差,通過(guò)求極值算法使之最小。

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 43.7778 5.7061 7.672 0.000256 ***

size 1.5111 0.2461 6.140 0.000855 ***

room 15.7778 10.7282 1.471 0.191782

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’‘ ’ 1

Residual standard error: 5.837 on 6 degrees of freedom

Multiple R-squared: 0.9949,Adjusted R-squared: 0.9932

F-statistic:582.3 on 2 and 6 DF, p-value: 1.346e-07

2.模型參數(shù)。采用最小二乘法算法,經(jīng)過(guò)機(jī)器學(xué)習(xí),訓(xùn)練出模型參數(shù),構(gòu)成房?jī)r(jià)大數(shù)據(jù)分析模型:房?jī)r(jià)大數(shù)據(jù)分析模型為y=aX1+bX2+C,其中:X1=size(面積),X2=room(間數(shù)),y(總價(jià))。經(jīng)過(guò)機(jī)器學(xué)習(xí)得到模型以下參數(shù):Size=1.5111;Room=15.7778;截距=

43.7778;y=1.5111*X1+15.7778*X2+43.7778,此函數(shù)為房?jī)r(jià)大數(shù)據(jù)分析模型。

3.顯著性檢驗(yàn)。

Estimate Std. Error t value Pr(>|t|)

(Intercept) 43.7778 5.7061 7.672 0.000256 ***

size 1.5111 0.2461 6.140 0.000855 ***

room 15.7778 10.7282 1.471 0.191782

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’‘ ’ 1

殘差自由度為6的殘差標(biāo)準(zhǔn)誤差為5.837,p-value:1.346e-07,P值很小說(shuō)明無(wú)自相關(guān)性,殘差項(xiàng)之間獨(dú)立。自變量與應(yīng)變量相關(guān)性,截距和size顯著性均為三顆星***,說(shuō)明截距和size與Y相關(guān)性顯著;room沒(méi)有星,說(shuō)明room與Y房?jī)r(jià)相關(guān)性不顯著。

4.擬合情況分析。

通過(guò)數(shù)據(jù)可視化,觀察房?jī)r(jià)大數(shù)據(jù)散點(diǎn)圖,可以看出房?jī)r(jià)大數(shù)據(jù)訓(xùn)練樣本呈直線分布。可以用線性回歸進(jìn)行房?jī)r(jià)大數(shù)據(jù)分析模型的構(gòu)建。

通過(guò)殘差與擬合圖,觀察和分析模型對(duì)訓(xùn)練數(shù)據(jù)集擬合程度,從上圖擬合線(紅線)對(duì)數(shù)據(jù)的擬合情況看,基本上擬合了大多數(shù)數(shù)據(jù)。沒(méi)有發(fā)生欠擬合或過(guò)擬合。Multiple R-squared: 0.9949,Adjusted R-squared: 0.9932,從這兩個(gè)數(shù)據(jù)可以看出擬合達(dá)到99%以上,擬合程度很高。

5.假設(shè)性檢驗(yàn)。從正態(tài)Q-Q圖上可以看出,數(shù)據(jù)分布在45°直線周圍,標(biāo)準(zhǔn)殘差成正態(tài)分布,滿足正態(tài)性假設(shè)。

6.方差檢驗(yàn)。同方差性,若滿足不變方差假設(shè),位置―尺度圖縱坐標(biāo)為標(biāo)準(zhǔn)化殘差的平方根,殘差越大,點(diǎn)的位置越高。從圖中可以看出經(jīng)過(guò)對(duì)殘差處理為標(biāo)準(zhǔn)化殘差的平方根,擬合的總體趨勢(shì)還可以,個(gè)別點(diǎn)可以看出遠(yuǎn)離擬合線如“點(diǎn)5”、“點(diǎn)7”,奇異點(diǎn)已經(jīng)顯露。

7.奇異數(shù)檢驗(yàn)。從殘差與杠桿圖中可以看出離群點(diǎn)和影響強(qiáng)度。Cook's distance值衡量強(qiáng)影響點(diǎn)的強(qiáng)度,從圖中可以看出“點(diǎn)7”這個(gè)點(diǎn)Cook's distance值超過(guò)0.5是所有數(shù)據(jù)中Cook's distance值最高的數(shù)據(jù),它是目前的強(qiáng)影響點(diǎn)。杠桿值高的數(shù)據(jù)是離群點(diǎn),目前“點(diǎn)4”杠桿值也較高,它也是離群點(diǎn)。