文本对图像模型的当前指标通常依赖于不足以代表人类真正偏好的统计指标。尽管最近的工作试图通过人类注释的图像来学习这些偏好,但它们将人类偏好的丰富挂毯降低到单个总分。然而,当人类评估不同方面的图像时,偏好会有所不同。因此,为了学习多维人类偏好,我们提出了多维偏好评分(MPS),这是评估文本对图像模型的第一个多维偏好评分模型。MPS引入剪辑模型上的偏好条件模块,以学习这些不同的偏好。它是根据我们的多维人类偏好(MHP)数据集进行了训练的,该数据集包括607,541图像的四个维度(即美学,语义一致性,详细信息,详细质量和整体评估)的918,315个人类偏好选择(即,美学,语义一致性,细节质量和整体评估)。这些信息是由各种最新的文本对图像模型生成的。MPS在4个维度上的3个数据集上优于现有的评分方法,从而使其成为评估和改进文本对象的有希望的指标。该模型和数据集将被公开使用,以促进未来的研究。项目页面:https://wangbohan97.github.io/mps/。
在巨大的文本语料库中鉴定的大型语言模型(LLM)表现出了各种自然语言处理任务的非凡能力[Brown,2020]。但是,这些模型通常显示出偏见或有毒行为,以及如何使它们与人类价值观保持一致仍然是一个开放的问题。最近,通过将其作为加强学习(RL)问题来解决这个问题,目的是最大化人类偏好。这种方法,也称为人类反馈(RLHF)[Christiano等人,2017年,Stiennon等,2020],已成为使LLMS对齐的主要方式。将偏好学习作为RL问题,一个重要的问题是如何定义奖励功能。以前,这通常是使用成对比较模型(例如Bradley-Terry模型[Bradley and Terry,1952])建模的。但是,正如Munos等人指出的那样,这可能是有问题的。[2023],而解决此问题的一种更自然的方法是将其作为游戏进行。在目前的工作中,我们遵循这种方法,并将其与可以看待优势函数的想法结合使用以编码动作的因果效应[Pan等,2022],并证明这使我们能够量化代币在RLHF环境中的因果效应。
摘要 印尼婚庆业目前是一个非常大的产业。每年,印尼有超过 200 万人结婚。每个婚礼派对的平均邀请人数约为 500 人。而所需的资金约为 3 亿印尼盾,几乎是印尼人平均年意愿的五倍。从以上研究数据可以得出结论,婚庆行业(包括摄影、婚礼组织者等)的市场是一个巨大且有前途的产业。市场很大,尤其是在印尼。这项研究的目的是了解顾客在选择婚纱摄影时如何偏好这些市场。本研究的方法使用 AHP 分析和 TOWS 矩阵分析,从受访者那里获得相关策略业务,以及从公司能力的内部和外部因素中获得相关策略。虽然有用于选择婚纱摄影标准的 AHP 应用程序,但请使用 Expert Choice 软件。我们报告了我们的发现和见解,以及敏感性分析的结果。为了实施 AHP 方法,本研究需要确定将包括哪些标准和替代方案。从以前的研究来看,消费者对婚礼摄影的看法以及他们认为婚礼摄影中某些方面非常必要。从这项研究得出的结论是,人们倾向于对供应商提供的价格和套餐敏感,这是他们选择婚礼摄影的最重要因素。在评估了婚礼摄影中哪些方面重要的 AHP 结果后,结果被用作 Natura Project 的业务战略,以确定未来的步骤并成为对公司本身的评估。关键词:层次分析过程、消费者偏好、业务战略、专家选择、
学分:[1] Christiano等。,《神经》 17中的深入强化从人类的偏好中学习。[2] Ziegler等。,来自人类偏好的微调语言模型,在Arxiv'19中。[3] Ouyang等。,培训语言模型在Neurips'22中按照人为反馈的指示进行指示。[4] Rafailov等。,直接偏好优化:您的语言模型是秘密的奖励模型,在Neurips'23中。[5] Hong等。,ORPO:Arxiv'24中的无参考模型的单片偏好优化。
国际贸易绝对不是免费的。世界各地的国家通常会征收关税和其他贸易障碍。关于他们为什么这样做的一个突出的解释是重新进行部落政治。即使贸易限制减少了馅饼的大小,它们也可以增加某些人以牺牲其他人为代价的切片。关于Rodrik(1995),Gawande和Krishna(2003)和McLaren(2016)在Rodrik(1995)中审查的政治政策政策政策的现有文献富裕,解释了为什么政治家可能会选择偏爱社会特定成分。直接示威者可能会导致政客迎合中位数选民;与美国总统大选一样,争夺选举票数的投票可能会使他们对摇摆州投票者的偏好偏见;游说活动可能与政治组织的部门相称。在每种理论中,一个完全指定的政治进程与典型的风格化经济环境相结合,以产生有关贸易保护结构的预测。经验工作又可以测试这种特定的预测在实践中是否存在。Grossman and Helpman(1994)销售模型的保护及其随后的测试由Goldberg and Maggi(1999)体现了这种规范方法。1
结果:较短的睡眠饲养者占32.25±6.99岁的212名护士的61.8%。异常的社交喷气行。与正常的喷气lag组相比,经历异常社交喷气lag的群体表现出明显较低的早晨情感和更高的夜晚(EV)(分别为p = 0.003和p = 0.004)。dm风险占全体6.6%。在年龄较大,工作经验较长的人,较高的体重指数(BMI),男性性别和较低的EV评分中观察到DM的较高风险(P <0.001,P <0.001,P <0.001,P <0.001,P = 0.006和P = 0.042)。独特的得分与DM风险评分呈正相关(r = 0.168; p = 0.014),而它们与夜班计数成反比(r = -0.149; p = 0.022)。BMI的较高值(优势比= 1.255; 95%置信区间= 1.036-1.520; P = 0.020)和男性性别(优势比= 7.350; 95%置信区间= 1.265-42,161; p = 0.026)与DM的风险增加有关。
简介现代社会中数据收集可能性的增加意味着统计人工智能 (AI) 或机器学习 (ML) 通常用于了解用户的偏好,以便更好地(有时是为了用户,有时是为了系统所有者)为他们提供某些服务。偏好可以通过直接询问受试者(陈述偏好)来直接了解,也可以通过称为显示偏好理论 (RPT) (Varian 2006) 的过程推断出来。这两种方法都存在一系列局限性,这些局限性已被实验经济学家和心理学家随着时间的推移所证明。一组限制大致属于“非理性”行为或信念的范畴。例如,Gui、Shanahan 和 Tsay-Vogel (2021) 讨论了用户在平衡相互冲突的短期和长期偏好时行为不一致的现象。偏好在不同情境之间可能不是静态的;群体内人士的社会规范(Cialdini 和 Trost 1998)可能与他们通过数字行为显露的个人偏好相悖。不同情况下的多种偏好的存在提出了一个问题:决策者应该选择行为中“显露”的哪种偏好作为“真实”偏好或“规范”偏好(Beshears 等人 2008)。决策者也可能会犯错误(Nishimura 2018),容易受到各种环境影响,如框架(Tversky 和
摘要 - 本研究旨在研究喀麦隆中部地区 6 所学校 30 间自然通风教室中空气流动偏好与热舒适度之间的关系。这项研究在两个季节(旱季和雨季)进行。采用了一种自适应方法,符合 ASHRAE 55/2004、ISO 7730 和 ISO 10551。在测量房间风速、空气温度、相对湿度和二氧化碳的同时,还发放了问卷。这些不同的学校共发放了 1545 份问卷。结果显示,57.62% 的投票者认为他们的环境可以忍受。问卷分析后得到的结果并不总是与通过物理测量得到的结果相符。空气偏好因每个人和研究地点而异。一般来说,在这两个季节,75% 的居住者希望他们的地方有更多的空气流动。研究表明,学校内空气流速的增加是获得热舒适环境的重要现象。简历 - 与喀麦隆中部地区 6 所学院的 30 个等级、自然通风和场所的空气和舒适热偏好运动相关的研究人员的工作。 Cette étude a été menée pendant deux saisons (saison sèche et saison de pluie)。适合员工的方法,符合 ASHRAE 55/2004、ISO 7730 和 ISO 10551 标准。调查问卷
有很多现实世界的黑框优化概率需要同时优化多个标准。然而,在多目标优化(MOO)问题中,确定整个帕累托阵线需要过度的搜索成本,而在许多实际情况下,决策者(DM)只需要在帕累托最佳解决方案集中的特定解决方案。我们提出了一种贝叶斯操作方法(BO)方法,以使用昂贵的目标功能识别MOO中最喜欢的解决方案,其中DM的贝叶斯偏好模型是根据两种称为成对偏好和改进请求的Supperions类型的交互方式自适应估算的。要探索最优选的解决方案,我们定义了一个采集函数,在该函数中,在观察函数和DM偏好中的不确定性都已合并。为了最大程度地减少与DM的相互作用成本,我们还为偏好估计提出了一种主动学习策略。我们通过基准功能优化和机器学习模型的高参数优化问题来证明我们提出的方法的有效性。
神经营销是一种现代营销研究技术,利用神经科学方法分析消费者的行为。在这项研究中,我们创建、处理和研究了消费者对图像广告反应的脑电图数据库,目的是建立能够根据消费者脑电图数据对其偏好进行分类的预测模型。我们使用三种分类器算法(即 SVM、KNN 和 NN 模式识别)进行了几种类型的分析。据报道,女性受试者和 KNN 分类器的最大准确度和灵敏度分别为 75.7% 和 95.8%。此外,额叶区域电极产生了最佳的选择性通道性能。最后,根据得到的结果,KNN 分类器被认为最适合解决偏好分类问题。新创建的数据集及其得出的结果将帮助研究界开展神经营销方面的进一步研究。