此主题为学生提供了从基本数据分析到使用R和XGBoost的高级机器学习概念的旅程。每周通过代表性的业务示例研究,我们发现数据如何形成有效的管理和决策。该主题逐渐建立在R编程和机器学习知识的基础上,从而为学生提供了与每周主题相关的R分配的实践经验。需要对任何语言的统计和先前的基本编程技能的基本理解。-------------------------------------------------------------------------------- Part I: Fundamentals of data analytics - Importance of data - Big data - The process of data collection - The process of data cleaning -------------------------------------------------------------------------------- Part II: Human behavior - Non-linear relationships - Missing responses - Biases - Choices and value estimates -------------------------------------------------------------------------------- Part III: Machine learning hiccups - Overfitting and underfitting - Corelation vs causality - Statistical hypothesis testing - Text analysis
Sharffenberg, WA、Fleming, MJ,2010。水文建模系统,HEC-HMS 用户手册。美国陆军工程兵团(水文工程中心 -HEC),美国华盛顿特区。Simon, HA,1981。人工智能科学。麻省理工学院出版社,美国马萨诸塞州剑桥。Simonovic, SP,2009。水资源管理:系统方法和工具。联合国教科文组织出版社,法国巴黎/英国伦敦。Simpson, J.、Adler, RF、North, GR,1988。拟议的热带降雨测量任务 (TRMM) 卫星。美国气象学会公报 69,278-295。Skaags, RW、Khaleel, R.,1982。渗透,小流域的水文建模。美国农业工程师学会,美国密歇根州圣约瑟夫。 Smith, L., Turcotte, D., Isacks, B., 1998. 使用离散小波变换的河流流量特性和特征检测。《水文过程》12,233-249。 Southgate, D., Whitaker, M., 1994. 经济进步与环境:一个发展中国家的政策危机。牛津大学出版社。 Sprague, RH, Watson, HJ, 1993. 决策支持系统:将理论付诸实践。Prentice Hall,Englewood Clifts,NJ Tecle, A., Duckstein, L., 1994. 多准则决策制定概念,载于:Bogardi Janos J.、Hans-Peter, N. (Eds.),《水资源管理中的多准则决策分析》。联合国教科文组织国际水文计划,法国巴黎。 Tian, Y., Peters-Lidard, CD, 2010. 卫星降水测量不确定性全球图。地球物理研究快报 37,doi:10.1029/2010GL046008。Turban, E.,2007。决策支持和商业智能系统。Pearson Prentice Hall,美国新泽西州 Upper Saddle River。USDA,1986。TR-55:小型流域城市水文学。美国农业部;国家资源保护局 (NCRS),华盛顿。USDA,2004。国家工程手册,第 630 部分:水文学:暴雨直接径流估算。自然资源保护局 (NRCS),美国农业部,华盛顿特区,美国。van Ast, AJ,2000。国际河流流域互动管理;北美和西欧的经验。地球物理学和化学,B 部分:水文学、海洋和大气 25,325-328。 van Dam, AA、Kelderman, P.、Kansiime, F.、Dardona, A.,2007 年。乌干达(东非)维多利亚湖附近纸莎草湿地氮滞留模拟模型。湿地生态与管理 15, 469-480。 van der Knijff, JM, Younis, J., de Roo, APJ, 2010。LISFLOOD:基于 GIS 的流域规模水平衡和洪水模拟分布式模型。国际地理信息科学杂志 24, 189-212。 van Griensven, A., Alvarez-Mieles, M., 2009。Abras de Mantequilla 湿地和影响区域的环境监测。联合国教科文组织-IHE,荷兰代尔夫特。 van Griensven, A.、Xuan, Y.、Haguma, D.、Niyonzima, W., 2008。使用遥感数据和建模了解河流湿地集水区过程,收录于:Sánchez-Marrè, M.、Béjar, J.、Comas, J.、Rizzoli, AE、Guariso, G. (Eds.),国际环境建模与软件大会。iEMSs,西班牙巴塞罗那,第 462-469 页。Vernimmen, RRE、Hooijer, A.、Mamenun, Aldrian, E.、van Dijk,AIJM,2012 年。印度尼西亚干旱监测卫星降雨数据的评估和偏差校正。水文与地球系统科学杂志 16,133-146。 Villa-Cox, G.、Arias-Hidalgo, M.、Mino, S.、Delgado-Cabrera, L.,2011。情景描述、管理选项和相关指标:Abras de Mantequilla 案例研究情况说明书,WP7。 WETWin 项目,ESPOL 大学,厄瓜多尔瓜亚基尔。
通讯作者。Pedro Larran〜Aga,智能系统集团,计算机科学与人工智能系,巴斯克大学,Paseo Manuel de Lardizabal,1,20018 San Sebastian,西班牙。电话:Þ34943018045;传真:34934015590;电子邮件:pedro.larranaga@ehu.es pedro larran×Aga是巴斯克大学大学计算机科学和人工智能教授。他于1981年获得了Valladolid大学的数学学士学位,并于1995年获得了巴斯克大学的计算机科学博士学位。他发表了40多个被指控的期刊论文。他的主要研究兴趣在于进化计算,机器学习,概率图形模型和生物信息学领域。Borja Calvo于1999年获得生物化学硕士学位和2004年的计算机科学学士学位,均来自巴斯克大学的大学。目前,他是巴斯克大学大学的博士生,也是智能系统小组的成员。他的研究兴趣包括应用于生物信息学的机器学习方法。罗伯托·桑塔纳(Roberto Santana)于2005年获得哈瓦那大学的数学博士学位。目前,他是巴斯克大学的智能系统小组成员。他的研究兴趣包括分布算法和生物信息学的估计。Concha Bielza于1989年获得了Madrid的Compressense University,Madrid和Phd的计算机科学博士学位,于1996年获得了马德里马德里技术大学的计算机科学学位。她是马德里技术大学计算机科学学院的统计与操作研究副教授。她的研究兴趣主要在概率图形模型,决策分析,用于优化的元启发式,数据挖掘,分类模型和实际应用领域。她的研究出现在管理科学,计算机和运营研究,统计和计算,海军研究物流,运营研究学会杂志等期刊上。Josu Galdiano目前正在巴斯克大学的计算机科学硕士学位。他的研究兴趣包括应用于生物信息学的机器学习方法。在Aki Inza中是巴斯克大学智能系统小组的讲师。他的研究兴趣包括数据挖掘和搜索启发式方法,特别关注概率图形模型和生物信息学应用程序。JoseäA.Lozano分别于1991年,1992年和1998年获得了西班牙巴斯克大学的数学和计算机科学学士学位以及博士学位。自1999年以来,他一直是巴斯克大学大学计算机科学副教授。他已经编辑了三本书,并发表了25份被指控的期刊论文。他的主要研究兴趣是进化计算,机器学习,概率图形模型和生物信息学。rubeãn arman ‹anzas于2004年从巴斯克大学的计算机科学获得了计算机科学硕士学位。目前,他是博士生,也是智能系统小组的成员。他的研究兴趣包括特征选择,计算生物学和生物信息学。guzmaäNsantafeä2002年从巴斯克大学获得了计算机科学硕士学位。目前,他是巴斯克大学大学的博士生,也是智能系统小组的成员。他的研究兴趣包括应用于生物信息学的机器学习技术。aritzpeäRez从巴斯克大学获得了计算机科学学位。他目前正在计算机科学和人工智能系获得计算机科学博士学位。他的研究兴趣包括机器学习,数据挖掘和生物信息学。目前,他正在使用贝叶斯网络,可变选择和密度估计的监督分类,重点是连续域。Victor Robles分别于1998年和2003年获得了MADRID大学的计算机工程和博士学位。在2004年,他是哈佛医学院的博士后研究员。他目前是马德里大学计算机系统建筑和技术系的副教授。他的研究兴趣包括生物信息学,数据挖掘和优化。Robles博士一直参与了几个研讨会和出版物的组织,以及有关程序的几本书。
[1] J. M. Day,S。A。Melnyk,P。D。Larson,E。W。Davis和D. C. Whybark,“人道主义和灾难救济供应链:生死攸关的问题”,《供应链管理杂志》,第1卷。48,否。2,pp。21-36,2012,doi:10.1111/j.1745-493x.2012.03267.x [2] C. Boonmee,M。Arimura和T. Asada,“灾难人道主义物流的设施位置优化模型”,《国际灾害风险杂志减少杂志》,第1卷。24,pp。485-498,2017,doi:10.1016/j.ijdrr.2017.01.017。[3] S. Shavarani,“灾后人道主义救济分配的多级设施位置分配问题:案例研究”,《人道主义物流与供应链管理杂志》,第1卷。9,第1号,pp。70-81,2019,doi:10.1108/ jhlscm-05-2018-0036。[4] C. T. Ragsdale,电子表格建模与决策分析:美国康涅狄格州第8版的业务分析实用介绍; Cengage Learning,2017年。[5] A. Charnes,W。W. Cooper和E. Rhodes,“衡量决策单位的效率”,《欧洲运营研究杂志》,第1卷。2,不。6,pp。429-444,1976,doi:10.1016/0377-2217(78)90138-8。[6] T. R. Sexton,R。H。Silkman和A. J. Hogan,“数据包络分析:测量效率的批判和扩展”,在评估数据包络分析的评估中,R。Silkman,ED,旧金山,加利福尼亚州,美国加利福尼亚州:Jossey-Bass:Jossey-Bass,1986年。73-105。30,否。3,pp。387-400,2018,doi:10.1504/ijise.2018.095533。[8] Y. C. Lee,“通过基于香农的熵结合跨效率得分来对DMU进行排名,”熵,第1卷。[7] B. Paryzad,E。Najafi,H。Kazemipoor和N. S. Pour,“ DEA中决策单位的新排名方法:采用修改交叉效率方法的方法,《国际工业与系统工业杂志》,第1卷。21,否。5,467,2019,doi:10.3390/e21050467。[9] H. H. Liu,Y。Y.Song和G. L. Yang,“基于前景理论的数据包络分析中的跨效率评估”,《欧洲运营研究杂志》,第1卷。273,否。1,pp。364-375,2019,doi:10.1016/j.ejor.2018.07.046。[10] J. Doyle和R. Green,“ DEA的效率和交叉效率:推导,含义和用途”,《运营研究学会杂志》,第1卷。45,否。5,pp。567-578,1994,doi:10.1057/jors.1994.84。[11] A. Anderson和C. N. Petersen,“在DEA中排名有效单位的程序”,《管理科学》,第1卷。39,否。10,pp。1261-1264,1993,doi:10.1287/mnsc.39.10.1261。[12] A. Charnes,S。Haag,P。Jaska和J. Semple,“数据包络分析加成模型中效率分类的敏感性”,《国际系统科学杂志》,第1卷。23,否。5,pp。789-798,1992,doi:10.1080/00207729208949248。[13] J. D. Hong和K. Y. Jeong,“使用数据包络分析和多客观编程模型的人道主义供应链网络设计”,《欧洲工业工程杂志》,第1卷。13,否。3,pp。651-680,2019,doi:10.1504/ ejie.2019.102158。57,否。5,pp。24,pp。[14] L. van Wassenhove,“人道主义援助后勤:高档供应链管理”,《运营研究学会杂志》,第1卷。475-489,2006,doi:10.1057/palgrave.jors.2602125。[15] C. Boonmee,M。Arimura和T. Asada,“灾难人道主义物流的设施位置优化模型”,《国际灾害风险减少杂志》,第1卷。485-498,2017,doi:10.1016/j.ijdrr.2017.01.017。
Abbreviations ADC: Antibody-drug conjugate ADCP: Antibody-dependent cell phagocytosis ADCC: Antibody-dependent cellular cytotoxicity AI: Aromatase inhibitor AKT: Protein kinase B ASCO-CAP: American Society of Clinical Oncology/College of American Pathologists CAR-T cells: Chimeric antigen receptor T cells cTNM: Clinical肿瘤淋巴结 - 纳斯症CDK:依赖细胞周期蛋白的激酶CCL5:趋化因子(C-C基序)配体5 CHI3L1:几丁质酶-3样蛋白1 CHRM1:毒蕈碱乙酰胆碱受体受体M1 DCIS M1 DCIS M1 DCIS M1 DCIS M1 DCIS:DDPCR:DDDPCR:DDDPCR:ddplet DIDIDER DIMDASE CRASSENT CONSE RIDENCASE COSSERVER DILDATE CRASSISS COMENCASS COMASE DRFFS: Early Breast Cancer Trialists' Collaborative Group EC: Epirubicin and cyclophosphamide EGFR: Epidermal growth factor receptor ER: Estrogen receptor ERBB2: Human epidermal growth factor receptor 2 (HER2) ERK: Extracellular signal-regulated kinase FDR: False discovery rate FZD: Frizzled receptors GNRH: Gonadotropin-releasing hormone GPCR: G蛋白偶联受体GPRC5D:G蛋白偶联受体C类C组5成员D HER1:人表皮生长因子受体1(EGFR)HER2:人类表皮生长因子受体2
2014 年: Juho Andelmin:电动汽车的最佳路线 Jimmy Forsman:评估合作伙伴渠道模型中的国际软件扩展选项 Raul Kleinberg:评估概率风险分析中时间相关现象的影响 Ville Koponen:根据智能卡数据估算公共交通的使用情况 Mikko Kotilainen:研究船冰致负荷的统计建模 Lasse Lindqvist:具有共同疾病的捕食者-猎物系统分析 Harri Mäkelin:基于统计学习的预测性维护中罕见事件的分类 Outi Pönni:使用扩展逻辑回归对能源生产的风速预测进行后处理 Olli Rentola:使用归因模型分析在线广告效果 Anton von Schantz:使用细胞自动机方法对出口拥堵进行建模 2013 年: Mikko Harju:模拟元建模中动态贝叶斯网络的自动构建 Rasmus Hotakainen:根据核电站的运行经验估计人为错误概率 Noora Hyttinen:经验对从事故报告中提取知识的影响 Juha Kännö:北欧电力市场的短期价格预测模型 Tuomas Lahtinen:均等交换方法中的路径依赖性 Pekka Laitila:改进排名节点在贝叶斯网络条件概率引出中的使用 Eerno Niemenmaa:使用不同的认知无线电场景计算电信市场模型中的纳什均衡 Tony Nysten:短期销售预测的制定和传达 Joonas Ollila:环境决策中的投资组合建模 Lars Östring:用于生产和维护市场特定标准配置的产品开发过程模型 Kaisa Parkkila:信用组合的风险价值分析 Heikki Puustinen:具有多目标网络优化和仿真的军用飞机路线 Vendla Sandström:实时资源管理和活动控制 - 从推送和拉动视角 Ville Viitasaari:海运远期运费建模 2012: Karin Ahlbäck:使用环境价值流图降低制造业的能源消耗 Jari Alahuhta:使用多级模型评估薪酬保密的影响 Yrjänä Hynninen:口腔保健服务提供商的效率分析 Ilkka Leppänen:Stackelberg 游戏中的廉价谈话和合作 Ilkka Mansikkamäki:基于直方图的签名用于检测保修欺诈 Juha Nuutinen:健康产品零售中的消费者选择模型 Taneli Silvonen:核电站被动自催化氢复合器的可靠性分析 Otto-Ville Sormunen:芬兰湾化学品油轮碰撞的泄漏估计 Martti Sutinen:社交机器人的基于情感的自适应决策模型 Lauri Talvikoski:短期负荷使用分析和季节性时间序列方法进行预测 Juha Törmänen:系统智能清单 Heikki Vesterinen:船舶性能分析的统计回归模型 2011:Gillis Danielsen:优化热中子探测新技术 Olli Eskola:用于分析不对称战争策略的贝叶斯游戏 Aira Hast:评估芬兰国家温室气体减排行动的风险和成本效益 Janne Junes:使用模拟模型比较道路路面维护策略 Juha-Matti Koljonen:通过简单规则和本地信息提高信噪比 Teppo Luukkonen:急救医学服务模拟和优化模型 Joni Nurmentaus:呼叫中心到达人数的战术预测。 Jirka Poropudas:篮球评分和预测的卡尔曼滤波算法 Osmo Salomaa:基于可达性的目的地和出行方式选择仿真模型 Antti Savelainen:利用加速度计从脑电图中检测运动伪影 Tero Tyrväinen:动态流程图方法中的风险重要性度量和常见原因故障 2010:Lassi Ahlvik:波罗的海经济有效的营养物减排 Lars Baarman:计算热化学平衡 Reda Guerfi:不准确参数对辐射剂量评估的影响 Lauri Haapamäki:识别网络中的商业模式 Aapo Huovila:使用多标准模型方法评估工作区性能 Lauri Hyry:客户质量感知和忠诚度与全球公司销售额之间关系的统计分析 Väinö Jääskinen:人类睡眠阶段转变 Tuomas Kervinen:一种用于估计北欧电力市场水电供应量的线性规划方法 Arttu Klemettilä:三方寡头垄断模型,用于评估认知无线电的经济影响 Juho Kokkala:防御战斗机的最佳分配 Marko Kotilainen:工业合作分析的复杂网络方法 Janne Laitonen:核安全监管控制中的风险跟进 Jari Liede:跨国公司的货币风险对冲 Mikko Loimula:使用两种方法评估洛维萨核电站房间的火灾风险 Mikko Luttinen:无限注德州扑克 - 现金游戏策略分析 Karl Johan Mangs:使用多变量方法对个人层面的迁移行为进行分类 Maija Mattinen:本地地磁活动的建模和预测 Eero Nevalainen:芬兰全球定位系统增强选项评估 Tuomas Nummelin:识别大额支付系统数据的行为变化 Tommi Pastinen:销售和物料管理中的预测系统 Timo Pekkala:管理利率衍生品投资组合市场风险的情景测试 Harri Räsänen:资本结构和估值——芬兰公司的横断面分析 Mauno Taajamaa:ICT 领域创新过程的加速 Jukka Ylitalo:资源与增长导向作为企业增长的预测因素 Jutta Ylitalo:海上事故频率建模 2009:Samuel Aulanko:岸边集装箱起重机的工作周期建模 Juho Helander:核电站风险研究中的主要不确定性因素 Tapani Hyvämäki:在维护故障检测中测试贝叶斯网络和基于密度的聚类 Juha-Matti Kuusinen:建筑物人流建模与预测 Topi Leisti:基于网络优化的造纸工业仿真模型构建 Matias Leppisaari:使用芬兰数据对死亡率进行随机建模 Mikko Loimula:使用两种方法评估洛维萨核电站房间的火灾风险 Jukka Luoma:系统思维过程中的系统智能 Pyry- Matti Niemelä:基准测试-mittaristo sosiaali- ja terveydenhuollon tuotannonohjaukseen Arto Niinistö:模拟带有风能、太阳能和燃气发电机的微电网管理 Ville-Veikko Niskanen:估算股票指数的流动性溢价 Matti Ollila:大学研究小组与其资金来源之间相互关系的效率分析 Jouni Pousi:基于效果的运营决策分析方法 Ismo Räisänen:运输问题、其解决方法及其在海上运输中的应用 Juha Saloheimo:在宽带网络故障管理过程中使用 Syslog 消息 Kimmo Söderholm:WSFS 中湖泊流出量的计算 Antti Toppila:电信公司标准化活动的资源分配模型 2008:Mikko Dufva:以成本效益的方式减少农业对水系统的负荷 Markus Ehrnrooth:金融市场质量飞跃分析 Antti Eloranta:外来汇率期权 Tanja Eronen:非定期存款估价与对冲 Michael Gylling:为消费品制造商设计全球供应链 Matti Heimonen:多人游戏中的收入生成模型 Ville Holma:信贷篮子定价中的系动词 Petri Holappa:工业批发商的采购优化 Jussi Kangaspunta:武器系统成本效益评估中的投资组合分析 Tommi Kauppinen:食品物质投入和营养价值的效率分析 Lauri Kovanen:预测企业违约概率 Anna Matala:火灾模拟的固相反应参数估计 Sampsa Ruutu:利用系统动力学预测国家海上运输需求和能力 Erkka Ryynänen:零售银行的客户细分 Topi Sikanen:火灾模拟中的火把散射建模 Atso Suopajärvi:水平不确定性的现象学建模2 核电站的概率安全评估 Maija Vanhatalo:多元建模在改进产品创建过程中的应用 Eeva Vilkkumaa:稳健投资组合建模中的群体决策支持方法 2007:Tommi Ekholm:气候变化缓解负担分担情景 Simo Heliövaara:火灾疏散中人类行为的计算模型 Erkka Jalonen:创新管理中的投资组合决策 Harri Järvinen:彩票投注和赌博游戏的功能和数学结构 Anssi Käki:报废备件采购中的预测 Kalle Korpiaho:研发中的项目组合管理;组织 Ilkka Kujamäki:跨国论文中的客户盈利能力评估 Kimmo Lehikoinen:风险价值系统回测过程的开发 Antti Malava:期权组合的波动风险建模 Teemu Mutanen:普适计算中的消费者数据和隐私 Juuso Nis sinen:评估信息对项目组合选择的影响 Mirko Ruokokoski:电梯群控中的整数优化 Timo Salminen:远期利率市场模型的校准 Sami Sirén:核电站允许停机时间的风险知情优化 Olli Stenlund:施工项目进度优化 Olli Väyrynen:通过多种财务比率识别被低估的股票