Yahoo 知識+ 將於 2021 年 5 月 4 日 (美國東岸時間) 停止服務,而 Yahoo 知識+ 網站現已轉為僅限瀏覽模式。其他 Yahoo 資產或服務,或你的 Yahoo 帳戶將不會有任何變更。你可以在此服務中心網頁進一步了解 Yahoo 知識+ 停止服務的事宜,以及了解如何下載你的資料。
請教統計學複迴歸的原理
近來初使用統計軟體 有以下問題: (抱歉我不太有相關基礎)
因做複迴歸分析時 自變數彼此間常互有相關
所以某個自變數是否具統計意義(如 p<0.05)
常受選取自變數集合的影響
例如 納入A,B,C為自變數時 A,B,C皆具統計意義 (來決定應變數Y)
而一旦加入D為自變數 則A就不是獨立因子
因A, D彼此間可能相關 所以A的獨立性被D取代
結果成了B,C,D是獨立因子(p<0.05) A則顯示 p>0.05
我的問題是 既然A, D彼此相關
統計學上 (或電腦運算時)怎麼決定是A擠掉D 還是D擠掉A
謝謝
1 個解答
- ?Lv 71 十年前最愛解答
在複迴歸(mutiple regression,或稱多元迴歸)裡,
有幾種選入變數的方法,
較常用的是逐步(stepwise),
會依各自變項對依變項的獨立貢獻來決定,
用圖來說明,矩形代表自變項,圓形代表依變項Y:
1、A、B、C三自變項對依變項Y的獨立貢獻量以顏色表示,
可見各變項對Y都有獨立貢獻,全部進入迴歸模型。
圖片參考:http://i133.photobucket.com/albums/q46/crikyre/reg...
2、當D加入後,可看出A與D的圖形有重覆一半以上的部分,表示A與D有中至高相關,加入D之後,只要變項間的相關不等於0,A、B、C的獨立貢獻都會改變,。
圖片參考:http://i133.photobucket.com/albums/q46/crikyre/reg...
3、此時再看A~D對Y的獨立貢獻,可發現A的獨立貢獻大部分已被D「吃掉」了,故A被排除,在迴歸中稱為變項間的「共線性」。
圖片參考:http://i133.photobucket.com/albums/q46/crikyre/reg...
決定進入迴歸模型的變數後,會依獨立貢獻量的大小,依序進入迴歸模型。
資料來源: 統計概念