我们感兴趣的问题不仅是关于随机变量的分布或其概率,而且我们可能想要确定随机变量的“平均值”或期望值,以及它与其期望值或标准差的偏差程度。我们将只研究离散随机变量的期望值和标准差,这些离散随机变量是其可能值集合形成可数不同值列表的随机变量。例如,博兹曼医院接下来的三胎女孩数量就是一个离散随机变量,因为它只能取值 0、1、2 或 3。离散随机变量可以取无限数量的可能值,只要我们能够将它们列在有序列表中。例如,掷硬币直到第一次出现正面的次数是一个离散随机变量,可能值为 1、2、3、4、...可以在某个间隔内取任意值的随机变量(例如时间、长度、利率、高度)称为连续随机变量。我们将使用以下符号来指定离散随机变量可能结果的概率:
方法:从 2005 年 1 月开始,上述各组成部分的每个系列都进行了标准化,因此每个组成部分和 WEHI 的值均为 100。随着每个组成部分每月的变化,WEHI 值也会发生变化。接下来,计算每个组成部分标准化系列值的标准差,然后计算每个组成部分标准差的倒数。最后,对各个倒数标准差进行标准化,从而得出总和为 1 的权重。这种加权方法的原理是,随着时间的推移,更稳定的组成部分的标准差较小,因此倒数标准差和权重较大。通常稳定的数据系列的大幅变化比通常波动较大的数据系列的大幅变化更能表明经济发生了变化。因此,这种加权方法允许 WEHI 赋予更稳定的组成部分更大的权重,这样,如果它们确实发生了大幅变化,WEHI 的值将受到更大的影响,以代表该州经济状况的变化。
表号表标题 页码 表 1.1 员工离职率 6 表 3.1 Cronbach’s 信度 35 表 3.2 Cronbach’s 值结果 35 表 4.1 响应率 37 表 4.2 员工人口统计资料 38 表 4.3 受访者年龄分布 38 表 4.4 受访者学历 39 表 4.5 受访者员工经验 39 表 4.6 离职意向的平均值、标准差和百分比 40 表 4.7 组织承诺的平均值、标准差和百分比 41 表 4.8 工作满意度的平均值、标准差和百分比 42 表 4.9 激励的平均值、标准差和百分比 43 表 4.10 薪酬和福利的平均值、标准差和百分比 44 表 4.11 关联测量和描述性形容词 45 表 4.12 相关性变量之间的矩阵 46 表 4.13 描述性统计 47 表 4.14 Durbin-Watson 49 表 4.15 模型摘要 50 表 4.16 方差分析 51
表号 表格标题 页码 表 1.1 员工离职率 6 表 3.1 Cronbach’s 信度 35 表 3.2 Cronbach’s 值结果 35 表 4.1 回应率 37 表 4.2 员工人口统计资料 38 表 4.3 受访者年龄分布 38 表 4.4 受访者学历 39 表 4.5 受访者员工经验 39 表 4.6 离职意向的平均值、标准差和百分比 40 表 4.7 组织承诺的平均值、标准差和百分比 41 表 4.8 工作满意度的平均值、标准差和百分比 42 表 4.9 激励的平均值、标准差和百分比 43 表 4.10 薪酬和福利的平均值、标准差和百分比 44 表 4.11 关联测量和描述性形容词 45 表 4.12 变量之间的相关矩阵 46 表4.13 描述性统计 47 表 4.14 Durbin-Watson 49 表 4.15 模型摘要 50 表 4.16 方差分析 51
方法:从 2005 年 1 月开始,上述各组成部分的每个系列都进行了标准化,因此每个组成部分和 ChEHI 的值均为 100。随着每个组成部分每月的变化,ChEHI 值也会发生变化。接下来,计算每个组成部分标准化系列值的标准差,然后计算每个组成部分标准差的倒数。最后,对各个倒数标准差进行标准化,得出总和为 1 的权重。这种加权方法的原理是,随着时间的推移,更稳定的组成部分的标准差较小,因此倒数标准差和权重较大。通常稳定的数据系列的大幅变化比通常波动较大的数据系列的大幅变化更能表明经济发生了变化。因此,这种加权方法允许 ChEHI 赋予更稳定的组成部分更大的权重,这样,如果它们确实发生了大幅变化,ChEHI 的值将受到更大的影响,以代表该县经济状况的变化。最后,使用 3 个月移动平均线来平滑指数。这有助于消除由于某个成分在特定月份记录异常高或低值而可能出现的大“峰值”。
方法:从 2005 年 1 月开始,上述各组成部分的每个系列都进行了标准化,因此每个组成部分和 CaEHI 的值均为 100。随着每个组成部分每月的变化,CaEHI 值也会发生变化。接下来,计算每个组成部分标准化系列值的标准差,然后计算每个组成部分标准差的倒数。最后,对各个倒数标准差进行标准化,从而得出总和为 1 的权重。这种加权方法的原理是,随着时间的推移,更稳定的组成部分的标准差较小,因此倒数标准差和权重较大。通常稳定的数据系列的大幅变化比通常波动较大的数据系列的大幅变化更能表明经济发生了变化。因此,这种加权方法允许 CaEHI 对更稳定的组成部分赋予更大的权重,这样,如果它们确实经历了大幅变化,CaEHI 的值将受到更大的影响,以代表该县经济状况的变化。最后,使用 3 个月移动平均线来平滑指数。这有助于消除由于某个成分在特定月份记录异常高或低值而可能出现的大“峰值”。
预期寿命,即平均寿命,存在着相当多的不确定性。在美国,成年人寿命的标准差约为 15 年,理论和证据表明,这代价高昂。我校准了一个效用理论模型,以衡量寿命偏好,并表明标准差少一年相当于平均寿命减少一半。标准差的差异加剧了美国与其他工业化国家、富国与穷国之间以及穷国之间的预期寿命的横截面差异。但是,考虑寿命差异的成本似乎也放大了最近发现的世界平均人类福祉趋同模式。这部分是由于方法论的原因,部分是因为人类寿命的无条件差异(主要是婴儿死亡率造成的部分)比预期寿命表现出更大的趋同性。成年人寿命标准差的持续减少(在发达国家中这种现象已基本停止)占美国 1950 年之前死亡率降低总经济价值的约 15%,但自那以后仅占 5% 左右。
表(3-1):主成分分析自动化 ...................................................................................................... 35 表(3-2):主成分分析效率 ...................................................................................................... 36 表(3-3):主成分分析易用性 ...................................................................................................... 37 表(3-4):主成分分析招聘 ...................................................................................................... 37 表(3-5):主成分分析选拔 ...................................................................................................... 38 表(3-6):主成分分析任命 ...................................................................................................... 38 表(3-7):主成分分析人工智能 ............................................................................................. 39 表(3-8):主成分分析就业 ...................................................................................................... 39 表(3-9):研究领域的 Cronbach's Alpha 系数 ............................................................................................. 40 表(3-10):受访者性别 ............................................................................................................. 41 表(3-11):受访者年龄........................................................................................................... 41 表(3-12):受访者经验 ...................................................................................................................... 41 表(3-13):受访者学历 ...................................................................................................................... 42 表(3-14):受访者职位 ...................................................................................................................... 42 表(4-1):算术平均值,标准差高科技公司人工智能的离差、T值、项目重要性及重要性水平 ............................................................................................................. 43 表(4-2):算术平均值,标准差高科技公司人工智能自动化水平的离差、t值、项目重要性及重要性水平 ............................................................................................................. 44 表(4-3):算术平均值,标准差高科技企业人工智能效率水平的离差、t值、项目重要性及重要性水平......................................................................................................... 45 表(4-4):算术平均值、标准差。......... 53 表(4-12):人工智能维度对就业影响的多元回归分析。高科技企业AI易用性水平的离差、t值、项目重要性及重要性水平 ............................................................................................................. 46 表(4-5):算术平均值,标准差高科技企业就业水平的离差、t值、项目重要性及重要性水平 ............................................................................................................. 47 表(4-6):算术平均值,标准差高科技企业招聘水平的离差、t值、项目重要性及重要性水平 ............................................................................................................. 47 表(4-7):算术平均值,标准差高科技企业选拔水平的离差、t值、项目重要性及重要性水平 ............................................................................................................. 48 表(4-8):算术平均值,标准差高科技公司聘任水平的离差、t值、项目重要性和重要性水平..................................................................................................... 49 表(4-9):变量之间的关系..................................................................................................................... 50 表(4-10):Durbin-Watson值与方差膨胀因子............................................................................................. 53 表(4-11):人工智能维度对聘任的多元回归分析.......... 54 表(5-1):人工智能维度对聘任(选拔、招聘和聘任)的多元回归分析总结(方差分析)............................................................................................. 55
会随机分布在平均值 (算术平均值) 附近。如果累积无数次这样的测量,各个值将分布在类似于图 1010:1 所示的曲线中。左侧曲线表示高斯分布或正态分布,可以用平均值 µ 和标准差 σ 精确描述。分布的平均值或平均值就是所有值的总和除以求和的值的数量,即 µ = ( ∑ i x i )/ n 。因为没有测量会重复无限次,所以使用相同的求和程序,但 n 等于有限次重复测量 (10、20 或...),对平均值进行估算。µ 的这个估计值用 x 表示。正态分布的标准差定义为 σ = [ ∑ ( x −µ ) 2 / n ] 1/2 。同样,由于观测次数有限,分析师只能估计标准差;σ 的估计值用 s 表示,计算如下:
变量描述观察平均值标准差最小值 最大值 影子 影子经济 2775 36.539 10.939 12.02 71.95 国内生产总值增长 国内生产总值年增长率 2721 4.112 7.174 -50.248 149.973 腐败 腐败 1887 2.973 .624 .908 4.273 国内 国内私营部门信贷 2621 27.135 22.751 .001 166.504 移动货币 移动货币 2775 .155 .362 0 1 产权 产权 2148 39.267 17.353 0 90 贸易 GDP 贸易 2663 78.502 40.536 13.753 531.737 碎片 Fragmentationethnic 1,803 .16583 .6067578 0 3 观测值:观测值。标准差:标准差。最小值:最小值。最大值:最大值。来源:作者计算