本书从算法的角度介绍了数据挖掘中使用的主要原理和技术。对这些原理和技术的研究对于更好地理解如何将数据挖掘技术应用于各种数据至关重要。本书也是有兴趣在该领域进行研究的读者的起点。我们以有关数据的一章(第2章)开始了本书的技术讨论,该章节讨论了数据质量,数据质量,预专业技术的基本类型以及相似性和相似性的度量。尽管可以快速涵盖此材料,但它为数据分析提供了重要的基础。第3章,关于数据探索,讨论了摘要统计数据,可视化技术和在线分析处理(OLAP)。这些技术提供了快速洞悉数据集的手段。第4章和第5章封面分类。第4章通过讨论决策树分类器和对所有分类重要的几个问题提供基础:过度拟合,绩效评估和不同分类模型的比较。使用此基础,第5章介绍了许多其他重要的分类技术:基于规则的系统,最近的邻居分类器,贝叶斯分类器,人工神经网络,Sup-Port-Port-Port-Port-Port vector Machines和Ensemble Classifier,它们是Classi-
数据挖掘在私营和公共部门都越来越普遍。银行、保险、医药和零售等行业通常使用数据挖掘来降低成本、加强研究和增加销售额。在公共部门,数据挖掘应用最初被用作检测欺诈和浪费的手段,但后来也用于衡量和改进程序性能等目的。然而,一些国土安全数据挖掘应用代表了要分析的数据数量和范围的显著扩大。一些引起国会高度关注的努力包括恐怖主义信息意识 (TIA) 项目(现已停止)和计算机辅助乘客预检系统 II (CAPPS II) 项目(现已取消并由安全飞行取代)。其他引起国会关注的举措包括多州反恐信息交换 (MATRIX)、Able Danger 计划、自动瞄准系统 (ATS) 以及国家安全局 (NSA) 正在进行的数据收集和分析项目。
美国计算机协会 (ACM) 是一个国际科学和教育组织,致力于推动信息技术的艺术、科学和应用。ACM 拥有全球会员,是信息技术各个领域计算专业人员和学生的主要资源,也是解释信息技术对社会影响的主要资源。ACM 是世界上历史最悠久、规模最大的教育和科学计算协会。自 1947 年以来,ACM 一直为信息、思想和发现的交流提供重要论坛。如今,ACM 为来自 100 多个国家/地区的工业、学术和政府各个领域的计算专业人员和学生提供服务。ACM 的 34 个特别兴趣小组 (SIG) 满足当今 IT 和计算专业人员的各种需求,包括计算机图形、人机界面、人工智能、数据挖掘、移动通信、计算机教育、软件工程和编程语言。每个 SIG 都围绕特定活动进行组织,以最好地服务于其从业者和研究群体。许多 SIG 赞助领先的会议和研讨会,制作时事通讯和出版物,并支持用于信息交流的电子邮件论坛。ACM 可在 http://www.acm.org 上找到
酒店的占用率通常很高,当房间费用很高时,占用率的提高会受到因素的影响[Athey 17],如果已知这种因素是一种季节性的效果,则可以使用FAML方法来预测与房间费用到居住率
“今天,我们还没有达到赫伯特·乔治·威尔斯多年前预测的水平,但社会正因需要而越来越接近这一水平。全球企业和组织被迫使用统计分析和数据挖掘应用程序,这种形式结合了艺术和科学——直觉和专业知识,用于收集和理解数据,以便建立准确的模型,真实地预测未来,从而做出明智的战略决策,从而采取正确的行动,确保成功,以免为时已晚……今天,计算能力与读写能力一样重要。正如约翰·埃尔德喜欢说的:“去数据挖掘吧!”它确实节省了大量的时间和金钱。对于那些有耐心和信心度过业务理解和数据转换早期阶段的人来说,一连串的结果可能是非常有益的。”
数据挖掘似乎是解决 MRO 组织不可预测性问题的一种有前途的方法。因此,阿姆斯特丹应用科学大学与航空业合作开展了一项为期两年的应用研究项目,探索数据挖掘在这一领域的可能性。研究人员研究了 8 家不同的 MRO 企业的 25 多个案例,在整个项目中应用 CRISP-DM 方法作为结构指南。他们探索、准备和组合 MRO 数据、飞行数据和外部数据,并使用统计和机器学习方法来可视化、分析和预测维护。他们还使用个别案例研究来预测计划维护任务的持续时间和成本、周转时间和零件的使用寿命。案例研究提出的挑战包括耗时的数据准备、对外部数据源的访问限制以及公司仍然有限的数据科学技能。就如何在 MRO 中实施数据挖掘以及克服相关挑战的方法提出了建议。总体而言,该研究项目已经提供了有希望的概念证明和试点实施
1。简介535 2。解决问题的天真模型536 3。信息颗粒的几何模型538 4。信息颗粒/分区540 5。非分区申请 - 中国墙安全政策模型541 6。知识表示543 7。拓扑概念层次结构晶格/树549 8。知识处理553