摘要人力资源管理信息系统(HRIS)由于当今的技术和全球技术发展而迅速发展。随着企业的数字化,它被广泛用于人力资源(HR)和HRIS的预测应用中。HR和HRI,更好地管理人力资源数据并做出更准确,更可靠的决策对企业至关重要。在该领域,数据挖掘和机器学习方法用于通过预测分析揭示管理决策中数据之间的有意义的关系和趋势。两种方法在人力资源领域都非常重要,对于企业将数据集转换为有用信息非常有效。它可以帮助企业了解趋势,这些趋势可以通过使用分析能力来实现更准确和可靠的业务决策。在本研究的范围内,对Bursa汽车行业的一家公司的白领雇员使用HRIS系统的使用进行了研究。通过统计和数据挖掘,研究了人力资源信息系统对公司和信息技术基础设施的成本,时间节省和战略影响,根据该部门工作,年龄,性别和教育水平的差异和关系。KNIME和SPSS统计计划,这些程序是机器学习工具。HRIS结果,并提出了建议以将来的计划。关键字:人力资源管理,人力研究信息系统,数据挖掘,机器学习,汽车,分类,刀具,IBM SPSS统计1.介绍由于全球技术发展,企业更喜欢像在所有部门和领域一样以人力资源管理和信息学为导向技术。今天,人力资源(HR)经历了重大的转变,从就业和业务流程到在建筑工地上实施应用程序,需要使用人力资源信息系统(HRIS)。hris是一个集成的计算机系统,包括获取,存储,分析和分发有关企业人力资源的宝贵信息[1]。使用HRI进行企业的行政流程也提高了做出的决定的可靠性[2]。不仅要监视和管理HRIS人力资源功能和流程
在预测糖尿病的数据挖掘的实施研究中,研究人员使用了源自Kaggle的数据库,多达768个数据,其中有9个糖尿病指标。本研究使用2种方法,即随机森林和XGBoost来分析糖尿病的预测。这项研究经历了预处理的几个阶段,以处理初始数据,然后再通过随机森林和XGBoost之间的两个建模主题进行测试,使用交叉验证5测试以确定最佳参数。使用精度,精度,召回和F1得分的矩阵评估。
抽象背景性肌动育症(DT)是免疫检查点抑制剂(ICIS)的常见毒性,先前的工作表明甲状腺功能障碍(DT)可能与ICI功效有关。在这项回顾性研究中,使用了一种新一代数据挖掘解决方案的患者和方法,从而从在法国Marseille Institut Paoli-Comaltes(法国马赛)接受ICI治疗的成人癌症患者的电子记录中提取数据。验证了每个DT,并且仅保留ICI诱导的DT。生存分析是通过Kaplan-Meier方法(日志秩检验)和COX模型进行的。为了说明不朽的时间偏差,进行了有条件的地标分析(2个月零6个月),以及随时间变化的COX模型。结果数据提取确定了1385例在2011年至2021年间接受ICI治疗的患者。dt与提高总生存期(OS)(HR 0.46,(95%CI 0.33至0.65),p <0.001),在非DT组(NDT)中,DT组为15.4个月的中位OS为35.3个月。在NDT组中,使用6个月的地标分析,中位数为36.7个月(95%CI 29.4(95%CI 22.8至27.8),DT的生存影响是一致的。在多元分析中,DT与改进的OS独立相关(HR 0.49,95%CI 0.35至0.69,p = 0.001)。在随时间变化的COX模型进行调整后,该关联保持显着(调整后的HR 0.64,95%CI 0.45至0.90,p = 0.010)。此外,与隔离DT患者相比,DT患者和其他免疫相关的不良事件的中位OS分别为38.8个月和21.4个月,OS增加了OS。结论数据挖掘确定了大量ICI诱导的DT患者,这与OS改善有关,占不朽的时间偏差。
新型抗艾滋病毒药物的开发和抗逆转录病毒疗法 (ART) 方案的进步使得艾滋病毒感染者 (PLWH) 的治疗时间更长、更有效。然而,PLWH 的老龄化是另一个需要解决的问题。除了 ART 之外,许多 PLWH 还经常接受治疗各种合并症的药物治疗。然而,关于 PLWH 发生不良事件及其致病药物的真实世界数据很少。因此,本研究旨在阐明日本 PLWH 不良事件报告的特点。使用日本不良药物事件报告数据库 (JADER) 对发生不良事件的 PLWH 病例进行了全面搜索和分析。尽管指南推荐的 ART 方案有所变化,但在整个研究期间,抗 HIV 药物是 PLWH 不良事件的主要原因。然而,在 JADER 中注册为致病药物的抗 HIV 药物类别的报告率存在相当大的差异,尤其是主力药物。换言之,近年来整合酶链转移抑制剂的报告率有所增加,而蛋白酶抑制剂和非核苷逆转录酶抑制剂的报告率有所下降。免疫重建炎症综合征是报告最多的不良事件,并且经常被管理 HIV 感染患者的医疗保健提供者注意到。女性和老年患者的不良事件报告趋势与总体人群不同。这项研究可能提供有助于制定艾滋病毒感染者最佳管理策略的见解。
tems,发展个人的健康状况等。[1]。卫生组织产生的数据非常庞大,复杂,因此很难消除数据,以便就患者健康做出重要决定。此数据包含有关医院,患者,医疗索赔,治疗费用等的详细信息。因此,有必要生成一个强大的工具,用于分析和从此复杂数据中提取重要信息。对健康数据的分析通过增强患者管理任务的执行来证明医疗保健。数据挖掘技术的结果是为卫生保健组织提供好处,以将具有相似类型的疾病或健康问题的患者分组,以便医疗保健组织为他们提供有效的治疗。这也可用于预测医院患者的住院时间,用于医学诊断并制定有效的信息系统管理计划。最近的技术用于医学领域,以具有成本效益的方式增强医疗服务。数据挖掘技术还用于分析导致疾病的各种因素,例如食物类型,不同的工作环境,教育水平,生活条件,纯水,卫生保健服务,文化,环境和农业因素的可用性,如图1所示。
大数据库受到数据挖掘技术的约束,该技术采用统计分析,机器学习和数据库技术的组合策略来发现隐藏的模式。此外,由于其作为研究领域的巨大重要性,医疗数据挖掘在创建蓬勃发展的医疗保健行业的几种应用中的重要性。在考虑全球发生的所有死亡时,心脏病似乎是主要因素。医疗专业人员在确定患者是否患有心脏病时面临着一项具有挑战性的任务,因为它要求进行广泛的测试和多年的经验。使用三种数据挖掘分类技术(例如决策树和幼稚的贝叶斯)开发预测系统,这是探索大量数据集的过程,用于以前未发现和未知的链接,模式和知识,这些链接,模式和知识在使用常规统计技术方面具有挑战性。数据挖掘和知识发现是在业务中使用了十多年的想法。数据挖掘技术已经开发出来,现在已被广泛用于商业目的以及许多其他应用,包括诸如乳腺癌筛查和心脏病诊断,临床途径中的时间依赖性模式挖掘以及重症监护医学分析。对预后和对医学数据的更深入理解具有重要意义的新兴主题是医疗保健中的数据挖掘。在本文中涵盖。关键字:数据挖掘,心脏病,数据挖掘分类技术,预测,决策树。
随着全世界的快速精炼,创新至关重要。数据挖掘在医疗保健行业正在蓬勃发展。糖尿病是一种慢性病,如今相当频繁。是出于多种原因而发生的,但最终结果是,未达到人体满足其葡萄糖需求的所需胰岛素。这些激素的正常产生在体内保持正常的血糖水平,范围为70至180 mg / dl(4.0至7.8 mmol / l)。糖尿病的症状之一是高血糖水平,是由胰岛素产生引起的。胰岛素抵抗是这种糖尿病的主要原因。这是一种慢性疾病,筛查是必要的,因为将水平保持在一定范围内很重要,因为它对身体具有如此深刻的影响。在提供的数据中,我们使用建模机学习模型来预测糖尿病。今天,数据挖掘在各种领域,包括农业,医疗保健,安全和银行业务。糖尿病是体内血糖水平升高的慢性疾病。糖尿病会随着时间的流逝对肾脏,眼睛和心脏造成损害。国际糖尿病联合会估计糖尿病会影响全球3.82亿人。到本世纪末,数量将增加到5.92亿。医学专家发现在大多数情况下很难预测糖尿病。糖尿病可以分为三类:
摘要:收割机自动记录的数据是一种很有前途的、可能非常有用的科学分析信息来源。大多数研究人员已将 StanForD 文件用于此目的,但这些文件很难获取,需要进行一些预处理。本研究利用了类似数据的新来源:JDLink,这是一项由机器制造商运营的基于云的服务,可实时存储来自传感器的数据。此类数据量巨大,难以理解和有效处理。数据挖掘技术有助于在此类数据库中发现趋势和模式。使用经典回归(线性和对数)、聚类分析(树状图和 k 均值)和主成分分析 (PCA) 分析了在波兰东北部工作的两台中型收割机的记录。线性回归表明,树木的平均大小是对每立方米燃料消耗和生产率影响最大的变量,而每小时燃料消耗也取决于低速行驶距离或高发动机负荷时间份额等因素。聚类和 PCA 的结果更难解释。树状图显示了最不相似的变量:每天采伐的总体积、每天的总燃料消耗和高转速 (RPM) 的工作时间份额。K 均值聚类使我们能够识别特定变量聚类更突出的时期。尽管 PCA 结果解释了近 90% 的方差,但机器之间的结果尚无定论,因此需要在后续研究中进行仔细审查。生产率值(平均约 10 m 3 /h)和燃料消耗率(平均 13.21 L/h,1.335 L/m 3)与其他作者在可比条件下报告的结果相似。本研究获得的一些新指标包括,例如,低速行驶距离(每天约 7 公里)或发动机在低、中或高负荷下运行的时间比例(分别为 34%、39% 和 7%)。本研究的假设是使用不从外部来源补充的数据,并且尽可能少地进行处理,这将分析方法限制在无监督学习上。在后续研究中扩展数据库将有助于监督学习技术在建模和预测中的应用。
摘要:收割机自动记录的数据是一种很有前途的、可能非常有用的科学分析信息来源。大多数研究人员已将 StanForD 文件用于此目的,但这些文件很难获取,需要进行一些预处理。本研究利用了类似数据的新来源:JDLink,这是一项由机器制造商运营的基于云的服务,可实时存储来自传感器的数据。此类数据量巨大,难以理解和有效处理。数据挖掘技术有助于在此类数据库中发现趋势和模式。使用经典回归(线性和对数)、聚类分析(树状图和 k 均值)和主成分分析 (PCA) 分析了在波兰东北部工作的两台中型收割机的记录。线性回归表明,树木的平均大小是对每立方米燃料消耗和生产率影响最大的变量,而每小时燃料消耗也取决于低速行驶距离或高发动机负荷时间份额等因素。聚类和 PCA 的结果更难解释。树状图显示了最不相似的变量:每天采伐的总体积、每天的总燃料消耗和高转速 (RPM) 的工作时间份额。K 均值聚类使我们能够识别特定变量聚类更突出的时期。尽管 PCA 结果解释了近 90% 的方差,但机器之间的结果尚无定论,因此需要在后续研究中进行仔细审查。生产率值(平均约 10 m 3 /h)和燃料消耗率(平均 13.21 L/h,1.335 L/m 3)与其他作者在可比条件下报告的结果相似。本研究获得的一些新指标包括,例如,低速行驶距离(每天约 7 公里)或发动机在低、中或高负荷下运行的时间比例(分别为 34%、39% 和 7%)。本研究的假设是使用不从外部来源补充的数据,并且尽可能少地进行处理,这将分析方法限制在无监督学习上。在后续研究中扩展数据库将有助于监督学习技术在建模和预测中的应用。
作者:J Rivera-Chávez · 2022 · 被引用 5 次 — 由于在产生 rimosa-mide 的菌株中未发现杀稻瘟素 S,这些化合物可能有助于它们防御其他链霉菌。