多元回归分析是指在相关变量中将一个变量视为因变量,其他一个或多个变量视为自变量,建立多个变量之间线性或非线性数学模型数量关系式并利用样本数据进行分析的统计分析方法。
回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析。
在下面回归分析的应用中,存在如下前提假设:
• 自变量和因变量之间在一定区间内存在线性关系
• 自变量和因变量之间的线性关系是稳定,可预测的
• 因变量的变化只受到自变量的影响,不受其他因素的干扰
• 多元回归分析中,多个自变量之间独立,各自的变化不会互相影响
一元回归分析:
在商业应用中,回归分析最常被用作成本预测,这种统计学的方法可以从历史成本数据中提炼出生产活动和成本之间的关系。
多元线性回归:
一般来说,多元线性回归与一元回归思路相近,只是多元回归中有两个或更多的自变量(X1,X2……Xn)。
数学表达为: Y=a+b1X1+ b2X2+ b3X3 +…bnXn
多元线性分析需要额外考量的因素是各个自变量之间的相关性,要确保不存在多重共线性,即任意两个变量之间的相关性不超过0.7。如果超过,就需要去掉其中一个自变量,再重新建立回归分析方程。
回归分析的优点:
1、表明自变量和因变量之间的显著关系;
2、表明多个自变量对一个因变量的影响强度。
它也允许去比较那些衡量不同尺度的变量之间的相互影响,如价格变动与促销活动数量之间联系。有利于帮助市场研究人员,数据分析人员以及数据科学家排除并估计出一组最佳的变量,用来构建预测模型。
回归分析的缺点:算法相对简单。