Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

SEM結構方程模型與Amos-潛在成長模型-三星統計張偉豪

2.644 visualizaciones

Publicado el

三星統計張偉豪
版本:20150918
www.tutortrstar.com

Publicado en: Educación
  • Sé el primero en comentar

SEM結構方程模型與Amos-潛在成長模型-三星統計張偉豪

  1. 1. 1 Latent Growth Models AMOS LGM 細說從頭 張偉豪 三星統計服務有限公司執行長 Amos 亞洲一哥 版本:20150918 三星課程網 www.tutortristar.com
  2. 2. 2 參考用書
  3. 3. 3 大綱 • Something you need to know about LGM • Estimation of the Basic LGM • Non-linear LGM • Conditional LGM • Multivariate LGM • Q & A
  4. 4. 4 Introduction • 潛在成長曲線模型分析 – 一種解釋 “改變”的方法 – 至少需要三個時間點 – 兩點連成一直線,形成完美配適,將無任何事物 可以測試 • 自由度為0,將無任何證據可以反證不是直線 • 研究改變的統計方法 – SEM的潛在成長模型(our focus!) – Multilevel modeling (hierarchical modeling)
  5. 5. When to use LGM • LGM測量變數跨時間的改變的情形 – 特別是平均數跨時間的改變 – 斜率估計模式可以是線性,二次式或指數形態等 平均數改變 5 Time 1 Time 2 Time 3 大華 1 2 5 小明 3 4 8 小莉 2 4 5 大同 4 4 6 平均數 2.5 4.5 6
  6. 6. 重複量數ANOVA的限制 • 需要平衡的設計 – 不能有遺漏值 • 測量時間的距離必需要等距 • 需要樣本獨立的假設 – 這點在緃斷面資料下很難成立 • 同質性要成立 – 測量變數的變異數要一致 6
  7. 7. LGM克服這些限制 • 採用FIML的估計方式克服遺漏值的問題 • 測量時間的距離不需要等距 – 可以有不同的時間點;(e.g. 1,2,5,10) • 不需要樣本獨立的假設 – 分析時可以設殘差之間有相關 • 即使違反同質性假設其結果仍然是有效的 7
  8. 8. Introduction • Latent Growth Curve – 緃斷面資料分析上常見而且簡單的分析策略 – Aka. Latent Trajectory Models or Mixed Effects Models • 提供緃斷面資料分析何種訊息? – 跨時間的改變(mean)是否存在? – 每一個人之間的差異為何? (Unconditional) – 是否有其它的變數可以解釋差異的存在? (Conditional) 8
  9. 9. Introduction • Change – 線性(linear) – 往上或往下呈現一直線 – 非線性(non-linear) – 往上之後可能又往下 年 齡 回嘴 12 18 年 齡 回嘴 12 2418
  10. 10. 兩個參數決定一直線 • 截距 (Intercept) – 改變過程的啟始值 – 又稱為常數 (Constant),它是測量的起點,也是 改變的開始 – 如果樣本截距為10, 表示平均每週回嘴10次 – 接下來隨著年齡的增加 回嘴的次數也會增加 10 年 齡 回嘴 12 18
  11. 11. 兩個參數決定一直線 • 斜率 (Slope) – 隨著年齡增加改變的過程 – 12歲~18歲回嘴的次數可能從每周平均10次 增加到每週40次 – 斜率平均每年增加 5次 11 年 齡 回嘴 12 18
  12. 12. Linear Growth Curve Models • 每一個人至少需重複測量三次 • 每一個人都會有一條成長斜率(線性) • 估計參數來自所有人的斜率的整合 12 大華 小明 小莉 大同
  13. 13. Estimate Parameter of LGM • Slope: the rate of change – 斜率較大表示改變較多 – 某些人改善或成長 (positive slopes). – 某些人變差或衰退 (negative slopes). – 某些人沒有改變 (zero slopes). • Intercept: 每個人的起始值 • Error: 不可解釋變異 13
  14. 14. Random (Varying) Intercept Random (Varying) Slope 14
  15. 15. Random (Varying) Intercept Fixed (Constant) Slope 15
  16. 16. Fixed (Constant) Intercept Random (Varying) Slope 16
  17. 17. 隨機效果視為潛在變數 • LGM分析是估計重複量數的斜率改變的另 一種方法 • 潛在變數的平均數視為固定效果 – 表示為整體截距或斜率的平均值 • 潛在變數的變異數視為隨機效果 – 代表每個樣本圍繞在平均數周圍的差異性 – 或者是每個人(inter-individual)在自己之間 (intra-individual)改變的差異性
  18. 18. 18 IS model潛在變數設定 • Intercept factor (I) and Slope factor (S) • Slope and Intercept factors are correlated. • Error variances – Intercept set to 0, mean set to 0 and variance are the same. • Intercept factor – free mean and variance – all measures have loadings set to one • Slope Factor – free mean and variance – loadings define the meaning of time
  19. 19. 19 Unconditional LGM 4 Time Points
  20. 20. 時間點0的設定 • Slope有一負荷量設為0時間點 (基準點) • Intercept設定為 “0時間點”的起始值 • 時間點0的位置 – 0設在時間點1 (以時間點1為參考點) • 標準設定方式 – 0設在最後時間點 (以最後時間點為參考點) • 有介入效果影響的時候 – 0設在中間時間點 (以中間時間點為參考點) • 截距為觀察值的平均 20
  21. 21. Growth rate 斜率設定 • Linear: – Factor loadings = 0, 1, 2, 3 … • Quadratic: – Factor loadings = 0, 1, 4, 9, 16… – Factor loadings = 4, 1, 0, 1, 4… • Logarithmic: (ln) – Factor loadings = 0, 0.69, 1.10, 1.39… • Exponential: – Factor loadings = 0, 1.72, 6.39, 19.09… • To be freely estimated: – Factor loadings = 0, 1, blank, blank…
  22. 22. 改變斜率設定對結果的影響 • Same – Model fit (c2 or RMSEA) – Mean and variance for the Intercept – Parameter significant test – error variances • Different – mean and variance for the slope – Slopeintercept covariance •以上指的是在同一種模型設定,如線性模型22
  23. 23. 23 Estimation of the Basic LGM • LGM資料型態需求 (Kline, 2006) 1.應變數(y)需為連續變數,且時間至少必需跨 三期 (T=3)。 2.資料期間可以不同,但每一個樣本的時間間格 需要一致。 3.資料分析的單位,在跨期間必須是一致的或是 可轉換成相同單位。 4.樣本數需大到足以檢定出樣本間的差異
  24. 24. LGM 5個主要估計參數 • 截距(Intercept): 起始值的平均數 • 截距變異數(Intercept Variance):樣本 起始值與平均起始值的差異 • 斜率(Slope): 整體平均成長率 • 斜率變異數(Slope Variance):樣本成長 率與平均成長率的差異 • 共變異數(Covariance):截距與斜率相關 的大小
  25. 25. LGM 5個主要估計參數-slope • 斜率:從起始點到最終點改變的比率 • 斜率大表示改變的比較多,斜率正負解釋 隨著研究的不同而不同 – 減重課程,斜率是負的表示減重有效果 – 學習成就,斜率是正的表示學習有進步 – 斜率為0則表示沒有改變,但也未必代表不好, 如水質偵測,多年來斜率不變,表示水質沒有 改變
  26. 26. LGM 5個主要估計參數-slope • 平均斜率(固定效果)(SMean) – 不同的同學會有不同的回嘴次數成長率(斜率) – 所有斜率加以平均得到斜率的平均值(橘線) 大華 小明 小莉 大同 年齡 回嘴 SMean
  27. 27. LGM 5個主要估計參數-slope • 變動斜率(隨機效果)(SVariance) – 不同的同學會有不同的回嘴次數成長率 (斜率) – 個人的斜率與平均斜率差異的平方即為斜 率的變異數,值愈大表示個人之間成長率差 異性愈大. 大華 小明 小莉 大同回嘴 SMean 年齡
  28. 28. LGM 5個主要估計參數-intercept • 平均截距(固定效果)(Imean) – 每個同學在12歲那年都有各自的回嘴次數, 加以平均就得到平均的起始值(藍線) • 變動截距(隨機效果)(IVariance) – 個人的起始值與平均起始值差異的平方即 為距距的變異數,值愈大表示個人之間一開 始差異性愈大. 大華 小明 小莉 大同回嘴 年齡
  29. 29. 參數估計的設定-衡量三次 29
  30. 30. 30 參數估計的設定-截距
  31. 31. 31 參數估計的設定-斜率 • 斜率負荷量定義 時間間隔 • 時間點1設為0表 示基準點 • 0,1,2表示線性 設定
  32. 32. 32 參數估計的設定-殘差與共變異數 • 所有變數的估計殘差同質並設定變數截距為0。 • 截距因子與 斜率因子相關(共變) – 不要設IS (Kenny, 2011)
  33. 33. 共變異數的意義 33 截距大小與 斜率變化無關 Cov不顯著 截距大小與斜率 變化呈負相關 Cov為負值 截距與斜率變化呈 正相關 Cov為正值
  34. 34. 34 共變異數的意義 • 假設斜率平均數為正 – 共變異數為負值(sig.)表示 • 截距與斜率方向相反 • 高的截距會導致較低的斜率 • 一個人一開始體重較重會導致體重成長較慢 – 共變異數為正值(sig.)表示 • 截距與斜率方向同向 • 高的截距會導致較高的斜率 • 一個人一開始體重較重會導致體重成長較快
  35. 35. 共變異數的意義 35 截距大小與 斜率變化無關 Cov不顯著 截距大小與斜率 變化呈正相關 Cov為正值 截距與斜率變化呈 負相關 Cov為負值
  36. 36. 36 共變異數的意義 • 假設斜率平均數為負 – 共變異數為負值(sig.)表示 • 截距與斜率方向相反 • 高的截距會導致較低的斜率 • 一開始成績好的同學會導致成績成長較慢 – 共變異數為正值(sig.)表示 • 截距與斜率方向同向 • 高的截距會導致較高的斜率 • 一開始成績好的同學會導致成績成長較快
  37. 37. 37 時間衡量的間距 • 時間可以有多種的測量單位 – 年,月,日,小時等 • 觀察值的時間間距不需要一樣的間隔 – 只需要改變斜率的負荷量即可調整 – Ex.1日,2日,5日可設為0,1,4 – 斜率的負荷量表示間隔的期數,一期可以為1日 或1年 • 遺漏值在緃斷面資料是常見的 – 進行資料插補
  38. 38. 38 LGM模式辨識 • 需要三個測量值 (T=3) •愈複雜(非線性)的模型需要愈多的測量值 •已知=變數,變數間的共變異數及變數平均數 –所以3 個測量值會有3個變異數,3=(3x2/2)個共變 異數,及3平均數總共9個參數(自由度)。 – 自由度計算= T(T + 1)/2+T •未知(待估計) – 2 個平均數,一個為斜率,一為截距 – 2 個變異數,一個為斜率,一個截距 – T 個誤差 – 1 個斜率與截距的共變異數(COV)
  39. 39. 39 LGM模式辨識 • Identify condition: T(T + 1)/2 + T – P≧0 – T:重複測量次數 – P:估計的參數 •範例說明 – T = 3, df = 9 – 8 = 1 – T = 4, df = 14 – 9 = 5 – T = 5, df = 20 –10= 10 – T = 6, df = 27 -11= 18 – T = 7, df = 35 -12= 23 …
  40. 40. 樣本數需求(Preacher, 2010) • 樣本需要大到足以 – 支持模型所估計的所有自由參數 – 得到適當的Power拒絕不適當的模型,因此要有 適當的模型配適度 (RMSEA<0.09) – 估計參數有較小的標準誤 – 補償遺漏值 40
  41. 41. 41 Estimation of the Basic LGM step by step 1. 圖形檢視 – 了解觀察值與成長率配適的程度 – 容易觀察到個體之間差異的情形 – 明白如何設定時間函數(線性或非線性) – 易於了解某一時間錯誤的設定
  42. 42. 42 Estimation of the Basic LGM step by step 2. 檢定無條件成長模型 – 配適度SEM的要求 • chi-square (χ2) • comparative fit index (CFI) • root mean-square error of approximation (RMSEA) 3. 估計並解釋模型參數 4. 結論 (Tell your story) 5. 截距/斜率變異數具顯著性,找預測變 數估計無條件成長模型
  43. 43. 截距與斜率的變異數 • 研究人員最興趣的是截距與斜率的平均 數與變異數是否顯著? • 尤其是截距與斜率的變異數 – 當截距與斜率的變異數顯著時,表示有可能 可以找到適當的預測變數來解釋初始狀態的 不同及改變的差異所為何來 43
  44. 44. Example for IS-Model • 研究者搜集學校提供營養午餐後對學童6年 來體重的影響? • 研究有興趣的是 – 學童在6歲入學時體重 有無差異? – 體重是否隨時間增加而增加? – 不同的學童體重成長是否 有差異? – 如果有差異有何原因可以解釋? 44 6歲 8歲 10歲 12歲 體重
  45. 45. 45 學校實施全面營養午餐後對學童體重的影響?
  46. 46. 1. 繪出每個人體重改變的平均數 • 以excel繪製每個學童平均數改變的折線圖, 可以看出大致上呈現線性分佈 46
  47. 47. 1. 繪出每個人體重改變的平均數 47 • 整體學童平均體重的成長 • 可以看出體重隨著年齡的增加而增加
  48. 48. 48 1.繪出每個人體重改變的平均數 • 分成男生,女生,會發現女生的起始體重及體 重成長均高於男生
  49. 49. 49 2. 檢定無條件成長模型
  50. 50. 50 潛在成長模型評估 • IMean:所有學童入學時平均初始體重 • SMean:所有學童小學期間平均的體重成長率 • IVariance:學童之間入學初始體重差異情形, 值愈大代表學童間的初始體重差異愈大。 • SVariance:學童入學期間體重成長的差異情形, 值愈大代表學童間的成長率差異愈大。 • Covariance:正值而且顯著,表示一開始體重愈重 的學童,體重增加愈快;若為負值且顯著 ,表示一 開始體重愈重的學童,體重增加較一開始體重輕的 學童慢。
  51. 51. 51 3. 估計模型參數
  52. 52. 52 3. 估計模型參數 參數 符號 標籤 估計值 顯著性 截距與斜率 Imean 學童8歲時的平均體重 21.989 *** Smean 學童6年來每兩年體重的平均成長 1.362 *** 變異數及共變異數 Ivar 學童8歲時的平均體重差異 3.146 0.013 Svar 學童6年來每兩年體重的成長差異 0.335 0.113 IScov 學童8歲時的初始體重對體重成長的影響 0.143 0.679 Level 1測量誤差變異數 E1 8歲時體重的測量誤差 2.108 0.027 E2 10歲時體重的測量誤差 1.462 0.007 E3 12歲時體重的測量誤差 2.313 0.003 E4 14歲時體重的測量誤差 .309 0.710
  53. 53. 53 3. 解釋模型參數 • 平均數 – 截距:學童八歲時平均體重為21.99公斤 – 斜率:學童6年來每兩年體重的平均成長1.36 公斤。 • 變異數 – 截距:學童初始體重有68%(1個標準差)的人在 21.99±1.77公斤之間。 – 斜率:學童6年來每兩年體重的成長68%的人 在1.36±0.579公斤之間。 • 共變異數 – 沒有顯著,代表初始體重與體重成長率無關。
  54. 54. 54 4. 結論 • 從整體模型配適度來看,均符合建議的標準, 因此,假設學童體重成長為線性模式是可以 接受的。
  55. 55. Non-linear LGM • Piecewise LGM • Additive LGM • Log LGM • Experiential LGM • Quadratic LGM • Logit LGM 55
  56. 56. 56 片段式成長模型(Piecewise LGM)
  57. 57. 57 模型配適度與參數估計
  58. 58. 58 累積式成長模型(additive LGM)
  59. 59. 59 模型配適度與參數估計
  60. 60. 60 Piecewise or Additive Model • Piecewise:各自不同的兩個成長率 – 第一條斜率從 T1 to T4 – 第二條斜率從 T4 to T6 • Additive: 先估計斜率當作參考點,再估計 第二條斜率的改變率 – 第一條斜率持續成長從 T1 to T6 – 從T4開始產生偏斜 • 兩種模型在配適度上為等值模型
  61. 61. Piecewise 斜率1 斜率2 截距 0 0 1 1 0 1 2 0 1 3 0 1 3 1 1 3 2 1 斜率1 斜率2 截距 0 0 1 1 0 1 2 0 1 3 0 1 4 1 1 5 2 1 61 Additive
  62. 62. 非線性成長模型(non-linear LGM) • LGC分析的第一個步驟是預設模型的成長 形態,如果設錯了,所有的分析結果都將毫 無意義. 62 time1 time2 time3 time4 time1 time2 time3 time4 指數函數 二次式函數
  63. 63. 非線性成長模型(non-linear LGM) • 非線性設定會造成估計及解釋上的困難,因 此以piecewise的方式去近似非線性模型是 比較具有彈性的做法 time1 time2 time3 time4time1 time2 time3 time4 對數函數 logit函數
  64. 64. 非線性成長模型(non-linear LGM)
  65. 65. 參數估計 • 假設體重成長模型為二次式,結果在體重成 長平方的平均數及變異數均不顯著,顯然假 設是不成立的. 65
  66. 66. How to detective non-linear model • Method 1: – 固定第1個loading,其它的自由估計 66
  67. 67. How to detective non-linear model • Method 2: – 斜率factor loading 第一個設0,最後一個設1 67
  68. 68. 68 條件式成長模型 (Conditional LGM) • 在基本LGC模型加外自變數(covariate) 來解釋截距及斜率變異數
  69. 69. 自變數的種類 • IS模型加入預測(自)變數 • 預測變數 – 不隨時間改變的變數 • 可以是觀察變數,如年齡,性別,所得,IQ,SES等 • 可以是潛在變數,如性格, 投資意願等 – 隨著時間而改變的變數 • 可以是觀察變數,如温度,壓力等 • 可以是潛在變數,如知識,技能,疼痛,健康情形等 69
  70. 70. 70 男女不同對體重成長的影響? • 以性別當自變數解釋截距與斜率的變異數 boy=1 girl=0
  71. 71. 71 多變量成長模型
  72. 72. 72 多變量成長模型(Multivariate LGM)
  73. 73. 73 模型配適度與參數估計
  74. 74. 74 模型修正(配適度不佳) • 主要概念: 增加自由度或(及)降 低卡方值。 1. 設定跨時間的誤差變 異數相同 2. 設定殘差不獨立,亦 即完全有相關 3. 設定殘差自我相關 (e1 e2 e3) 4. 重新界定模型
  75. 75. 75

×