课程描述:本课程是针对要研究经济学,金融,会计,营销和管理科学的学生的定量方法的严格介绍。示例是从这些领域绘制的。所涵盖的主题包括概率分布,统计推断,多个线性回归,逻辑回归,优化和机器学习。本课程重点介绍了用数据集说明概念的应用程序。统计编程语言R,已完全集成到课程中。学生可以将以下课程计入学位或证书,但不超过一个:MGMT E-104,Stat E-100,Stat E-101(以前提供),STAT E-102或Stat E-104。
主题是 - 学习与概括[6周] - 分类:感知算法的融合 - 回归:线性回归剂 - 成本最小化与概率模型 - 贝叶斯学习 - 贝叶斯学习:共轭先生,大约推理的推理公平[3周] - 有条件的独立性 - 平稳性 - 平稳性 - 平稳性-Caissaly -Caissations -Caissality -Caissationsy -Caissality -Caissality -Caissality -Caissality -Caissality -Caissality -caus caissality caus caissality acy caussations anderness。隐私[3周] - 匿名和差异隐私 - 随机响应和拉普拉斯机制 - 指数机制。
逻辑回归[27]是一种广泛使用的监督机器学习算法,该算法基于一组自变量,预测了基于一组自变量的变量。它采用曲线拟合方法来预测0到1范围内的概率值,作为分类或离散输入的结果。与线性回归[28]相反,它适合线性预测一个或多个因变量的线,逻辑回归预测了0到1范围内值的S形逻辑曲线。这对于分析音频数据是有利的,因为影响帕金森氏病分类(PD)的属性没有线性相关;相反,它们遵循指数模式。图16显示了逻辑分类的激活函数。
课程内容 第一单元(16 个接触时段) 研究的意义和目标、优秀研究的标准、研究的意义、研究的类型、研究方法:历史方法、案例研究方法、调查方法和实验方法。 研究过程、研究问题的确定和制定、文献综述的相关性。 假设:类型和特点。 研究设计:优秀研究设计的需要、特点和特性。 不同的研究设计:描述性、探索性和实验性。 抽样调查设计:人口普查和抽样调查的概念、抽样和非抽样误差、概率和非概率抽样设计及其类型。 第二单元(16 个接触时段) 测量和缩放技术:定性和定量数据的测量尺度、缩放技术:比较和非比较、多维缩放。 数据收集:收集原始数据和次要数据的方法、问卷设计。 数据准备过程:编辑、编码、分类、制表和图形表示。描述性统计:集中趋势测量、离散度测量和关系测量。属性关联。概率分布的概念,正态分布、二项分布和泊松分布。第三单元(16 个接触期)矩阵、向量和微积分的基本知识。推论统计:点和区间估计、样本量的确定。抽样分布。I 类和 II 类错误。假设检验程序、t 检验、z 检验、卡方检验、F 检验、方差分析。回归分析:简单线性回归、多元线性回归、逻辑回归。多重共线性问题。因子分析:质心和主成分方法。撰写科学报告、撰写研究项目提案、学术道德和剽窃、知识产权和专利法。
回归是预测连续价值的过程。我们可以使用回归方法来预测使用其他一些变量的连续值,例如CAR模型的CO2发射。例如,让我们假设我们可以访问包含与来自不同汽车的CO2排放相关的数据的数据集。数据集包含诸如汽车发动机尺寸,气缸数,燃油消耗量和来自各种汽车型号的CO2排放之类的属性。现在,我们有兴趣估计其生产后新车模型的近似CO2发射。使用机器学习回归模型这是可能的。在回归中,有两种类型的变量:一个因变量和一个或多个自变量。因变量是我们研究和尝试预测的“状态”,“目标”或“最终目标”,而自变量(也称为解释变量)是这些“状态”的“原因”。自变量通常通过x显示,并且因变量用y表示。回归模型将y或因变量与x的函数相关联,即自变量。回归的关键点是因变量值应该是连续的,而不是离散值。但是,可以在分类或连续测量量表上测量自变量或变量。回归的类型:基本上,回归模型有两种类型:简单回归和多重回归。简单回归是当使用一个自变量来估计因变量时。它可以在非线性上是线性的。例如,使用“汽车的发动机尺寸”预测CO2排放。回归的线性基于自变量和因变量之间关系的性质。存在多个自变量时,该过程称为多个线性回归。例如,使用变量“汽车的发动机尺寸”和“汽车中存在的气缸数”来预测CO2排放。再次取决于因变量和自变量之间的关系,多个线性回归可以是线性或非线性回归。
单元I:机器学习介绍,学习模型,几何模型,概率模型,逻辑模型,分组和分级,设计学习系统,学习类型,学习,监督,无监督,增强,观点和问题,版本空间,PAC学习,PAC学习,VC尺寸。单元II:有监督和无监督的学习决策树:ID3,分类和回归树,回归:线性回归,多线性回归,逻辑回归,神经网络:简介,感知,多层感知,支持向量机:线性和非线性,线性和非线性,内核功能,K最近的邻居。聚类简介,K-均值聚类,K-Mode聚类。单元III:合奏和概率学习模型组合方案,投票,错误纠正输出代码,包装:随机林木,增强:Adaboost:堆叠,堆叠。高斯混合模型 - 期望 - 最大化(EM)算法,信息标准,最近的邻居方法 - 最近的邻居平滑,有效的距离计算:KD -Tree,距离测量。第四单元:加强学习和评估假设的介绍,学习任务,Q学习,非确定性奖励和行动,时间差异学习,与动态编程的关系,主动的加强学习,在增强学习中的概括。动机,抽样理论的基础:误差估计和估计二项式比例,二项式分布,估计器,偏见和差异单位V:遗传算法:动机,遗传算法:代表假设,遗传操作员,遗传操作员,适应性和选择,示例性的探索,遗传探索,遗传学探索,遗传学的探索,模型:效果,并行化遗传算法。
本研究旨在确定Matahari百货商店大都会购物中心的产品质量,定价策略和战略位置对购买意图的影响。这种类型的研究是定量的。这项研究的人口总计85人。使用饱和抽样技术采样技术。本研究中的样本总计85位受访者。数据收集技术通过通过Google表单分发问卷来收集。使用多个线性回归分析的假设检验。研究对象是该百货商店的消费者。这项研究的结果表明,产品质量,定价策略和战略位置的独立变量对购买意图的因变量(Y)具有重大影响。
• 什么是机器学习?• 传统编程与机器学习的区别 • 机器学习与人工智能的关系 • 机器学习的应用 • 机器为什么要学习?为什么不首先设计出按预期执行的机器?• 机器学习的类型(监督、无监督、半监督和强化学习) • 具有一个变量的线性回归 • 假设表示、假设空间 • 学习需要偏差 • 训练示例的概念 • 损失函数的概念,• 训练方法:机器学习算法可能用来训练模型的迭代试错过程,迭代训练方法的缺点,均方误差 (MSE),梯度下降算法。学习率对减少损失的影响,特征缩放的重要性(最小-最大规范化)。