多语言展示
当前在线:1800今日阅读:31今日分享:25

如何判断多重共线性

多重共线性是回归分析里面的一个知识点。首先你要把模型做出来,然后检查是否有“多重共线性”,如果有则有,如果没有则没有。是否有还是没有,以检测结果为准。
工具/原料

电脑

方法/步骤
1

在线性回归模型时,存在这样一种假设,即各个解释变量之间不存在很强的关系。如果解释变量之间存在很强的线性相关关系,就认为数据之间存在共线性问题。

2

在解释变量中,有某一解释变量可由其他解释变量线性表出。

3

共线性会导致回归参数不稳定,即增加或删除一个样本点或特征,回归系数的估计值会发生很大变化。总结下,共线性对线性模型影响回归模型缺乏稳定性。样本的微小扰动都可能带来参数很大的变化; 难以区分每个解释变量的单独影响; 参数的方差增大; 变量的显著性检验失去意义; 影响模型的泛化误差;

4

多重共线性诊断发现系数估计值的符号不对;某些重要的解释变量t值低,而R方不低当一不太重要的解释变量被删除后,回归结果显著变化

5

多重共线性处理主要方法有:增加样本量、变量聚类、方差膨胀因子、相关系数、逐步回归、PCA、L1 L2正则化

6

共线性检验看模型系数,和实际业务是否相符合。(注:在进行完证据权重转化后,系数正负,不在具有实际的业务意义。当woe是好客户占比/坏客户占比时,系数都为负,反之系数都为正。(相关原因可以公式推导))模型R^2较高,通过F检验,系数不能通过t检验

推荐信息