在信息时代,对大型复杂数据集进行适当的融合是必要的。只需处理少量记录,人类大脑就不得不寻找数据中的模式并绘制整体图景,而不是将现实视为一组单独的实体,因为处理和分析这些实体要困难得多。同样,使用适当的方法减少计算机上的信息过载,不仅可以提高结果的质量,还可以显著减少算法的运行时间。众所周知,依赖单一信息源的信息系统(例如,从一个传感器收集的测量值、单个权威决策者的意见、一个且只有一个机器学习算法的输出、单个社会调查参与者的答案)通常既不准确也不可靠。聚合理论是一个相对较新的研究领域,尽管古代数学家已经知道并使用了各种特定的数据融合方法。自 20 世纪 80 年代以来,聚集函数的研究通常集中于构造和形式化数学分析各种方法来汇总元素在某个实区间 I = [ a, b ] 中的数值列表。这涵盖了不同类型的广义均值、模糊逻辑连接词(t 范数、模糊蕴涵)以及 copula。最近,我们观察到人们对偏序集上的聚集越来越感兴趣,特别是在序数(语言)尺度上。在面向应用数学的古典聚集理论方面,具有开创性的专著包括 Beliakov、Pradera 和 Calvo 撰写的《聚集函数:从业者指南》[49] 以及 Grabisch、Marichal、Mesiar 和 Pap 撰写的《聚集函数》[230]。我们注意到,聚合理论家使用的典型数学武器库包括代数、微积分、序和测度理论等方法的非常有创意的组合(事实上,聚合理论的结果也对这些子领域做出了很大的贡献)。此外,以下教科书深入研究了聚合函数的特定子类:三角范数[277],作者
我们的研究调查了社会经济因素与对气候变化的看法之间的相对未开发的关系,以尼泊尔为例,他们对发展环境中家庭能源偏好的影响。我们旨在实现两个目标:创建一个可靠的模型,以识别影响家庭能量行为的关键社会经济和气候感知变量;并比较这些因素的各自影响。采用混合方法方法,我们调查了尼泊尔的49个地区和3个物理学区域(高山,中山和Terai Plains)的323个家庭。我们通过文献综述修复了解释性和响应量,并评估了三个序数逻辑回归模型:一种仅关注社会经济因素,第二个仅关注气候感知,而第三个是综合模型。数据统计数据表明,有47%的受访者不喜欢其现有能源状况,23%选择完全依靠电网电信,有14%喜欢改用可再生能源,而16%的人则优先使用网格电动性和可再生能源的最佳组合。发现复合模型是我们数据集的最佳拟合模型。确定的关键社会经济因素包括城市化,教育水平以及能源替代方案的可用性,表明尼泊尔不同社会经济类别的能源获取和使用差异很大。同样,夏季和冬季降雨的幅度和时机,家庭能源需求的变化和社区级补贴也是重大的气候变化变量。因此,我们的发现凸显了需要更好地获得现代能源和经济激励措施,主要是对农村偏远地区以及全国各地的社区意识倡议,并受到综合能源政策的支持,以在房屋持有水平以及缓解气候变化影响的可持续可再生能源过渡方面支持。通过加强这种政策科学社会界面,我们的研究为开发有效策略的有价值的见解提供了宝贵的见解,以在类似的发展环境中促进可再生能源采用。
摘要 本研究评估了对话式人工智能 (CAI) 在纠正认知偏差和识别人机交互中的情感方面的有效性,这对于数字心理健康干预至关重要。认知偏差——系统性偏离规范思维——会影响心理健康,加剧抑郁和焦虑等状况。治疗聊天机器人可以使认知行为疗法 (CBT) 更易于获得且更实惠,提供可扩展和即时的支持。该研究采用结构化方法,使用基于临床的虚拟案例场景模拟典型的用户-机器人交互。在两类认知偏差中评估了表现和情感识别:心智理论偏差(人工智能拟人化、对人工智能的过度信任、归因于人工智能)和自主性偏差(控制错觉、基本归因错误、公正世界假设)。使用定性反馈机制和序数量表来量化基于准确性、治疗质量和对 CBT 原则的遵守情况的反应。通过脚本交互评估治疗机器人(Wysa、Youper)和通用 LLM(GTP 3.5、GTP 4、Gemini Pro),由认知科学家和临床心理学家双重审查。统计分析表明,治疗机器人在偏见纠正方面始终优于非治疗机器人,并且在 6 种情感识别偏见中有 4 种表现出色。数据表明,非治疗聊天机器人在解决某些认知偏见方面更有效。关键词:认知偏见、对话式人工智能、聊天机器人、数字心理健康、偏见纠正、情感识别 * 通讯作者。电子邮件:marcin.rzadeczka@umcs.pl,邮寄地址:Wydział Filozofii i Socjologii UMCS, pl。Marii Curie-Skłodowskiej 4, pok。204, 20-031 卢布林数据和协议:https://data.mendeley.com/datasets/h2xn2bxz5r/1 预印本 doi:https://doi.org/10.48550/arXiv.2406.13813
研究基础:意义,目标,动机,实用性。理论,经验主义,演绎和归纳理论的概念。科学方法的特征 - 了解研究的语言 - 概念,构造,定义,可变。研究过程。问题识别和表述:定义和制定研究问题,定义问题的必要性,在定义问题中的重要性,研究问题 - 进行研究问题 - 测量问题 - 测量问题 - 假设 - 良好假设的质量 - 无效假设和替代假设。假设检验 - 逻辑和重要性。研究设计:研究中的概念和重要性 - 良好的研究设计的特征 - 探索性研究设计 - 概念,类型和用途,描述性研究设计 - 概念,类型和用途。实验设计 - 独立和因变量的概念。定性和定量研究:定性 - 定量研究 - 测量,因果关系,概括,复制的概念。合并两种方法。数据收集和分析:研究的执行 - 数据收集数据方法的观察和收集,假设测试 - 概括和解释。测量:测量概念 - 测量的内容?研究中的问题 - 有效性和可靠性。测量水平 - 名义,序数,间隔,比率。抽样:统计人群,样本,抽样框架,采样误差,样本量,无响应的概念。一个好样本的特征。概率样本 - 简单的随机样本,系统样本,分层随机样品和多阶段采样。确定样本的大小 - 采样和样本量的实际考虑。数据分析:数据准备 - 单变量分析(频率表,条形图,饼图,百分比),双变量分析 - 跨列表和卡方检验,包括关联的测试假设。数据和纸质写作的解释:研究论文的布局,计算机科学期刊,期刊的影响因素,何时何地发布?与出版,窃和自位态主义有关的道德问题。使用百科全书,研究指南,手册等,相关学科的学术数据库。
AEC -501微观经济理论和应用2(2 + 0)目标本课程旨在提供微观经济理论及其应用的概述。课程始于消费者行为理论,该理论由消费者的效用最大化问题和需求理论组成。它打算在生产理论和成本理论中提供基本的概念和模型,并列出以在不同类型的市场结构(包括因素市场)下对价格和 /或产出确定的基本理解。本课程还将使学生了解一般平衡和福利经济学的理论。消费者行为的理论 - 基本效用方法 - 序数实用方法 - 收入效应和替代效应 - 冷漠曲线方法的应用 - 揭示偏好假设 - 消费者盈余 - 需求曲线的推导 - 需求的弹性。生产理论 - 生产函数 - 规模和规模经济回报 - 技术进步 - 成本理论 - 成本曲线 - 利润最大化和成本最小化 - 供应曲线的推导 - 供应定律 - 生产者的盈余。市场均衡 - 竞争市场中公司的行为 - 完美的竞争 - 税收和补贴对市场均衡的影响 - 垄断 - 垄断 - 寡头垄断 - 因素市场理论。一般平衡理论 - 福利经济学 - 帕累托最优性 - 社会福利标准 - 社会福利职能。建议阅读David M Kreps1990。微观经济理论的课程。普林斯顿大学出版社。Dewitt KK。 2002。 2000。Dewitt KK。2002。2000。现代经济理论。Sultan Chand&Co。Henderson JM&Quandt Re。微观经济学理论:一种数学方法。McGraw- Hill。 koutsoyiannis A. 2003。 现代微观经济学。 Macmillan出版社。 Silberberg E&Suen W.2001。 经济学结构 - 数学分析。 McGraw- Hill。 Varian Hal R.1999。 中级微观经济学。 附属的东西方出版社。 AEC -502宏观经济和政策2(2 + 0)McGraw- Hill。koutsoyiannis A.2003。现代微观经济学。Macmillan出版社。Silberberg E&Suen W.2001。经济学结构 - 数学分析。McGraw- Hill。 Varian Hal R.1999。 中级微观经济学。 附属的东西方出版社。 AEC -502宏观经济和政策2(2 + 0)McGraw- Hill。Varian Hal R.1999。中级微观经济学。附属的东西方出版社。AEC -502宏观经济和政策2(2 + 0)
1。Tang,L。和Song,P.X。(2016)。回归系数聚类中的融合拉索方法 - 数据整合中的学习参数异质性。机器学习研究杂志,17(113),1-23。2。Zhou,L.,Tang,L.,Song,A.T.,Cibrik,D。和Song,P.X。 (2017)。 识别蛋白质特征的套索方法可预测移植后肾移植物存活。 Biosciences中的统计数据,9(2),431-452。 3。 Tang,L.,Chaudhuri,S.,Bagherjeiran,A。和Zhou,L。(2018)。 通过分裂和串联技术学习大规模序数排名模型。 2018年网站会议的同伴会议记录,1901- 1909年。 4。 Tang,L.,Zhou,L。和Song,P.X。 (2019)。 融合学习算法以结合部分异质的Cox模型。 计算统计,34(1),395-414。 5。 Tang,L.,Zhou,L。和Song,P.X。 (2020)。 通过置信分布在广义线性模型中的分布式推理。 多元分析杂志,176,104567。 6。 Wang,L.,Zhou,Y.,He,J.,Zhu,B.,Wang,F.,Tang,L.,Kleinsasser,M.,Barker,D. (2020)。 一个流行病学预测模型和软件评估了中国的COVID-19流行病的干预措施。 数据科学杂志,18(3),409-432。 7。 Tang,L.,Zhou,Y.,Wang,L.,Purkayastha,S.,Zhang,L.,He,J.,Wang,F。和Song,P.X。 (2020)。 8。 (2020)。Zhou,L.,Tang,L.,Song,A.T.,Cibrik,D。和Song,P.X。(2017)。识别蛋白质特征的套索方法可预测移植后肾移植物存活。Biosciences中的统计数据,9(2),431-452。3。Tang,L.,Chaudhuri,S.,Bagherjeiran,A。和Zhou,L。(2018)。通过分裂和串联技术学习大规模序数排名模型。2018年网站会议的同伴会议记录,1901- 1909年。4。Tang,L.,Zhou,L。和Song,P.X。 (2019)。 融合学习算法以结合部分异质的Cox模型。 计算统计,34(1),395-414。 5。 Tang,L.,Zhou,L。和Song,P.X。 (2020)。 通过置信分布在广义线性模型中的分布式推理。 多元分析杂志,176,104567。 6。 Wang,L.,Zhou,Y.,He,J.,Zhu,B.,Wang,F.,Tang,L.,Kleinsasser,M.,Barker,D. (2020)。 一个流行病学预测模型和软件评估了中国的COVID-19流行病的干预措施。 数据科学杂志,18(3),409-432。 7。 Tang,L.,Zhou,Y.,Wang,L.,Purkayastha,S.,Zhang,L.,He,J.,Wang,F。和Song,P.X。 (2020)。 8。 (2020)。Tang,L.,Zhou,L。和Song,P.X。(2019)。融合学习算法以结合部分异质的Cox模型。计算统计,34(1),395-414。5。Tang,L.,Zhou,L。和Song,P.X。 (2020)。 通过置信分布在广义线性模型中的分布式推理。 多元分析杂志,176,104567。 6。 Wang,L.,Zhou,Y.,He,J.,Zhu,B.,Wang,F.,Tang,L.,Kleinsasser,M.,Barker,D. (2020)。 一个流行病学预测模型和软件评估了中国的COVID-19流行病的干预措施。 数据科学杂志,18(3),409-432。 7。 Tang,L.,Zhou,Y.,Wang,L.,Purkayastha,S.,Zhang,L.,He,J.,Wang,F。和Song,P.X。 (2020)。 8。 (2020)。Tang,L.,Zhou,L。和Song,P.X。(2020)。通过置信分布在广义线性模型中的分布式推理。多元分析杂志,176,104567。6。Wang,L.,Zhou,Y.,He,J.,Zhu,B.,Wang,F.,Tang,L.,Kleinsasser,M.,Barker,D. (2020)。 一个流行病学预测模型和软件评估了中国的COVID-19流行病的干预措施。 数据科学杂志,18(3),409-432。 7。 Tang,L.,Zhou,Y.,Wang,L.,Purkayastha,S.,Zhang,L.,He,J.,Wang,F。和Song,P.X。 (2020)。 8。 (2020)。Wang,L.,Zhou,Y.,He,J.,Zhu,B.,Wang,F.,Tang,L.,Kleinsasser,M.,Barker,D.(2020)。一个流行病学预测模型和软件评估了中国的COVID-19流行病的干预措施。数据科学杂志,18(3),409-432。7。Tang,L.,Zhou,Y.,Wang,L.,Purkayastha,S.,Zhang,L.,He,J.,Wang,F。和Song,P.X。(2020)。8。(2020)。多室传染病模型的综述。国际统计评论,88(2),462–513。[国际统计评论中的第2020-2021条第2020-2021条。]Tang,L。*和Song,P.X。纵向数据分析中的分层后融合学习。Biometrics,77(3),914-928。9。Wang,F.,Zhou,L.,Tang,L。和Song,P.X。(2021)。线性模型中同时推断的收缩膨胀方法(MOCE)。机器学习研究杂志,22(192),1-32。10。tan,X.,Chang,C.H.,Zhou,L。和Tang,L。*(2022)。基于树的模型平均方法
使用未增强的机器学习,基于大脑MRI衍生的体积特征将多发性硬化症患者(PWM)分层的抽象目标。方法回顾性地收集了包括3D-T1W和FLAIR-T2W序列的复发PWM的3-T脑MRI,以及残疾状态量表(EDSS)的扩大和长期(10±2年)临床结果(EDS,认知和渐进式课程)。从MRI中,脱髓鞘病变和116个Atlas定义的灰质区域的体积自动分割,并表示为引用外部种群的Z分数。在特征选择之后,基线MRI衍生的生物标志物进入了亚型和阶段推断(sovera)算法,该算法估计了以生物标志物进化的不同模式和亚组中的不同模式为特征的亚组。然后将训练的模型应用于纵向MRI。亚型和阶段变化随着时间的变化的稳定性分别通过Krippendorf的Sα和多级线性回归模型评估。通过序数/逻辑回归分析评估了维持分类的预后相关性。结果,我们选择了425个PWM(35.9±9.9岁; f/m:301/124),对应于1129次MRI扫描,以及健康对照(n = 148; 35.9±13.0年; f/m:f/m:77/71)和外部PWMS和外部PWMS(n = 80; 40.40; 40.4±11.9岁; f/m:56/M:56/M:56/M:56/M:56/M:56/。基于11种生物标志物的特征选择,确定了两个亚型,指定为“深灰质(DGM) - 首先”亚型(n = 238)和“ Cortex-first”亚型(n = 187),根据萎缩模式。亚型随着时间的推移是一致的(α= 0.806),年阶段显着增加(b = 0.20; p <0.001)。EDSS与阶段和DGM-FirST亚型相关(p≤0.02)。基线阶段预测了长期残疾,过渡到渐进型病程和认知障碍(p≤0.03),后者也与DGM-First第一个亚型有关(P = 0.005)。结论的无监督学习模型对大脑MRI衍生的体积特征提供了对PWM的生物学可靠和预后有意义的分层。关键点•脑MRI衍生的体积特征的无监督建模可以提供多发性硬化症患者的单访问分层。•所谓的分类往往会随着时间的流逝而保持一致,并捕获与疾病相关的脑损伤进展,从而支持模型的生物学可靠性。•基线分层可以预测长期的临床障碍,认知和过渡到次要进行的过程。
成对比较数据在统计学和机器学习中受到了广泛关注,并在各个领域有着广泛的应用。这类数据通常来自锦标赛,其中每个成对比较结果都来自两个选手或队伍之间的比赛,或来自众包环境,其中个人负责比较两个项目,例如图像、电影或产品。具体而言,著名的瑟斯顿 (Thurstone, 1927) 和布拉德利-特里 (BT; Bradley and Terry, 1952) 模型为该领域奠定了基石,随后进行了许多扩展,包括 Shah 等人 (2016a) 提出的参数序数模型,拓宽了参数模型的类别。Oliveira 等人 (2018) 放宽了已知链接函数的假设,并提出了允许链接函数属于广泛函数家族的模型。非参数方法也已出现,例如 Shah 和 Wainwright (2018) 中基于 Borda 计数算法介绍的工作,以及 Chatterjee (2015) 和 Chatterjee 和 Mukherjee (2019) 研究的非参数 Bradley-Terry 模型。此外,还开发了用于众包环境的成对比较模型,如 Chen 等人 (2013) 和 Chen 等人 (2016) 等所讨论的。成对比较模型已获得广泛的应用,包括排名聚合(Chen and Suh,2015;Chen 等人,2019;Heckel 等人,2019;Chen 等人,2022b)、预测比赛 / 锦标赛(Cattelan 等人,2013;Tsokos 等人,2019;Macr`ı Demartino 等人,2024)、测试博彩市场的效率(McHale and Morton,2011;Ly´ocsa and V`yrost,2018;Ramirez 等人,2023)以及基于人工评估改进大型语言模型(Christiano 等人,2017;Ouyang 等人,2022;Zhu 等人,2023)。虽然上述模型对该领域做出了重大贡献,但它们依赖于随机传递性的假设,这意味着球员/球队/项目之间存在严格的排名。然而,这种假设可能不切实际,特别是在涉及多种技能或策略的环境中,不传递性自然会出现。尽管它具有实际重要性,但对允许不传递性的模型的研究仍然有限。一些值得注意的例外包括 Chen 和 Joachims (2016) 和 Spearing 等人 (2023) 的工作,他们通过引入额外参数来描述不传递性以及基于 Bradley-Terry 概率指定绝对优势的参数,扩展了 Bradley-Terry 模型。Spearing 等人 (2023) 提出了一种在完整贝叶斯框架下进行参数估计的马尔可夫链蒙特卡罗算法。然而,他们的贝叶斯程序计算量大,对于涉及许多球员或相对较高潜在维度的高维设置不切实际。 Chen 和 Joachims (2016) 将参数视为固定量,并通过优化正则化目标函数来估计它们。然而,它们的目标函数是非凸的,并且它们的模型高度过度
机器学习模型是自动化任务的强大工具,使其更加准确和高效。这些模型可以按需求处理新的数据并扩展新的数据,从而提供有价值的见解,以提高随着时间的推移绩效。该技术具有许多好处,包括更快的处理,增强的决策和专业服务。机器学习模型是在看不见的数据集中识别模式以做出决定的软件程序。自然语言处理(NLP)使用机器学习模型来分析非结构化文本并提取可用的数据和见解。图像识别是机器学习的另一种应用,它可以识别人,动物或车辆等物体。机器学习模型需要一个数据集来培训和在优化过程中使用算法,以查找数据的模式或输出。基于数据和学习目标有四种主要类型的机器学习模型:1。**监督模型**:这些模型使用标记的数据来发现输入特征和目标结果之间的关系。2。**分类**:这种类型的模型将类标签分配给看不见的数据点,例如对电子邮件进行分类或预测贷款申请人的信誉。常见分类算法包括: *逻辑回归 *支持向量机(SVM) *决策树 *随机森林 * K-Nearest邻居(KNN)预测使用输入功能作为基础的连续输出变量预测连续输出变量在现实世界中至关重要,例如预测房地产价格,股票市场趋势,股票市场趋势,客户销售速率,销售速度和销售费用和销售。常见回归算法包括:1。回归模型利用这些功能来了解连续变量和输出值之间的关系。他们应用了学习的模式来预测新的数据点。**线性回归**:使用直线建模关系。2。**多项式回归**:使用更复杂的函数(例如二次或立方)用于非线性数据。3。**决策树回归**:一种基于决策树的算法,可预测分支决策的连续输出。4。**随机森林回归**:结合了多个决策树,以确保准确稳健的回归预测。5。**支持向量回归(SVR)**:调整支持向量机概念的回归任务,找到一个密切反映连续输出数据的单个超平面。无标记数据的无监督学习交易。它涉及使用聚类算法进行分组类似的数据点,例如:1。** K-均值聚类**:基于相似性将数据分组为预定群体。2。**分层聚类**:构建群集的层次结构,以轻松研究组系统。3。** DBSCAN(基于密度的空间群集使用噪声)**:即使在缺少数据或异常值的区域,也可以检测高密度数据点。降低维度在处理大型数据集时也至关重要。它降低了维度以维护关键功能,从而更容易可视化和分析数据。技术包括:1。2。** PCA(主要组件分析)**:通过将数据集中在更少的维度中来识别最重要的维度。** LDA(线性判别分析)**:类似于PCA,但专为分类任务而设计。最后,也可以应用无监督的学习来检测异常 - 数据与大多数的点大不相同。在数据分析中对异常值,半监督学习和强化学习的建模得到了奖励,并受到所需的行动的奖励,并对不希望的行为进行惩罚有助于玩家获得最高的回报。这种方法还涉及基于价值的学习,其中像机器人一样的代理商学会了通过获得达到末端并在撞墙时损失时间来浏览迷宫的过程。算法Q学习可以预测每个州行动组合的未来奖励,从而通过重复评估和奖励更新其知识。基于策略的学习采用了不同的途径,重点是直接学习映射到行动的政策。Actor-Critic将策略更新与价值功能再培训结合在一起,而近端策略优化解决了早期基于政策的方法中的高变化问题。深度学习利用人工神经网络识别复杂的模式。诸如人工神经网络(ANN),卷积神经网络(CNN)和经常性神经网络(RNN)之类的模型用于图像识别,自然语言处理和顺序数据分析等任务。机器学习模型利用各种功能来输入数据并产生预测,包括线性方程,决策树或复杂的神经网络。学习算法是负责在训练过程中适应模型参数以最小化预测错误的核心部分。培训数据包括输入功能和相应的输出标签(监督学习)或无标记的数据(无监督学习)。目标函数衡量预测和实际结果之间的差异,目的是最大程度地减少此功能。优化过程,例如梯度下降,迭代调整参数以减少错误。一旦受过培训,就会在单独的验证集上评估模型,以评估概括性能。最终输出涉及将训练有素的模型应用于新的输入数据以进行预测或决策。高级机器学习模型包括神经网络,这些神经网络成功地解决了复杂问题,例如图像识别和自然语言处理。卷积神经网络(CNNS)处理符号数据,例如图像,而复发性神经网络(RNN)处理顺序数据(如文本)。长期短期内存网络(LSTMS)识别长期相关性,而生成对抗网络(GAN)通过从现有数据集中学习模式生成新数据。机器学习模型随着时间的流逝而发展,产生了两个网络:一个产生网络数据,另一个区分真实样本和假样品。变压器模型通过随着时间的推移处理输入数据并捕获长期依赖性,从而在自然语言处理中获得了知名度。*医疗保健:机器学习预测疾病,建议治疗并提供预后。机器学习的现实应用程序包括: *金融服务:银行使用智能算法来了解客户的投资偏好,加快贷款批准并检测异常交易。例如,医生可以为患者预测正确的冷药。*制造业:机器学习通过提高效率和确保质量来优化生产过程。*商业领域:ML模型分析大型数据集,以预测趋势,了解营销系统并为目标客户定制产品。机器学习中的挑战包括: *有限的资源和工具,用于上下文化大数据集 *需要更新和重新启动模型以了解新的数据模式 *收集和汇总不同技术版本之间的数据以应对这些挑战,战略规划,适当的资源分配以及技术进步至关重要。