在本文中,我们通过对图像的纹理、结构和自然度进行建模,提出了一种基于纹理强度的无监督自然图像质量评估器(TI-NIQE)。具体来说,本文提出了一种有效的质量感知特征,即纹理强度(TI)来检测图像纹理。图像结构通过梯度和基础图像的分布来捕获。自然度通过局部均值减去对比度归一化(MSCN)系数的分布以及相邻 MSCN 系数对的乘积来表征。此外,通过将质量分数作为识别模型的基本输入,提出了一种新的图像质量评估(IQA)指标的应用模式。使用 TI-NIQE 计算的视频质量分数统计数据作为输入特征,提出了一种基于 IQA 的自动视觉识别模型,用于回转窑的状态识别。在基准数据集上进行的大量实验表明,TI-NIQE 在准确率和计算复杂度方面均比其他最先进的无监督 IQA 方法表现出更好的性能,并且在真实数据上的实验结果表明该识别模型对回转窑状态识别具有较高的预测精度。
联邦学习在统计和系统异质性方面面临重大挑战,以及高能量消耗,需要有效的客户选择策略。传统方法,包括启发式和基于学习的方法,无法解决这些复杂性。为了回应,我们提出了FedGC,这是一种新颖的生成客户选择框架,它可以创新将客户选择过程作为一项固定的任务重新铸造。从大语模型中使用的方法中汲取灵感,FedGC能够在连续表示空间内编码丰富的决策知识,从而实现了有效的基于梯度的优化,以搜索将通过生成而产生的最佳客户选择。框架组合四个步骤:(1)使用经典客户端选择方法自动收集“选择得分”对数据; (2)在此数据上训练编码器 - 评估器 - 编码器框架以结构连续的表示空间; (3)在此空间中启用基于梯度的优化,以进行最佳客户选择; (4)通过使用光束搜索训练有素的解码器来生成最佳客户端选择。FedGC通过更全面,可推广和高效,同时选择模型性能,延迟和能力消费来优于传统方法。通过广泛的实验分析证明了FedGC的有效性。
资源分配决策在塑造公司的技术轨迹和竞争优势方面起着主导作用。最近的工作表明,在评估新项目和思想时,创新的公司和科学机构在评估新项目和思想时倾向于表现出反偏见的偏见。在本文中,我们通过研究问题焦点领域中的评估者专业知识如何塑造新颖性与可行性在技术解决方案评估质量评估中的关系,将其重点放在这种观察到的模式中。为了估算关系,我们与NASA和Freelancer.com合作,在线劳动力市场设计了一项评估挑战,在此挑战中,我们从技术域内和外部招募了374位评估人员,从9个机器人挑战中汲取了101个解决方案。这导致了3,869个评估者解决方案对,其中评估器被随机分配到解决方案中,以促进实验比较。我们的实验发现辅以评估者评论的文本分析,表明领域专家表现出可行性的偏好,首先关注解决方案作为其质量的主要指标,同时具有更具风险但更新颖的解决方案。这导致了一个折衷方案,在这种方案中,高度可行但新颖的解决方案被认为是质量更高的,这使专家们偏爱更激进但未经测试的想法更喜欢增量思想。
尽管开源大型语言模型(LLM)(例如 LLaMA)取得了进步,但它们在工具使用能力方面仍然受到很大限制,即使用外部工具(API)来执行人类指令。原因是当前的指令调整主要侧重于基本语言任务,但忽略了工具使用领域。这与最先进(SOTA)闭源 LLM(例如 ChatGPT)的出色工具使用能力形成鲜明对比。为了弥补这一差距,我们引入了 ToolLLM,这是一个通用的工具使用框架,涵盖数据构建、模型训练和评估。我们首先介绍 ToolBench,这是一个用于工具使用的指令调整数据集,它是使用 ChatGPT 自动构建的。具体而言,构建可分为三个阶段:(i)API 收集:我们从 RapidAPI Hub 收集了 49 个类别的 16,464 个真实 RESTful API; (ii) 指令生成:我们提示 ChatGPT 生成涉及这些 API 的各种指令,涵盖单工具和多工具场景;(iii) 解决方案路径注释:我们使用 ChatGPT 为每条指令搜索有效的解决方案路径(API 调用链)。为了增强 LLM 的推理能力,我们开发了一种新颖的基于深度优先搜索的决策树算法。它使 LLM 能够评估多个推理轨迹并扩大搜索空间。此外,为了评估 LLM 的工具使用能力,我们开发了一个自动评估器:ToolEval。基于 ToolBench,我们对 LLaMA 进行微调以获得 LLM ToolLLaMA,并为其配备神经 API 检索器,为每条指令推荐合适的 API。实验表明,ToolLLaMA 表现出执行复杂指令和推广到未见过的 API 的卓越能力,并且表现出与 ChatGPT 相当的性能。我们的 ToolLLaMA 还在分布外工具使用数据集 APIBench 中展示了强大的零样本泛化能力。代码、训练模型和演示均可在 https://github.com/OpenBMB/ToolBench 上公开获取。
•2017 - 2020年首席调查员 - 与物联网:物联网(IoT)工具包和基础架构进行播放,以支持9岁以下的9岁以下的户外游戏互动和体验。我们将开发和测试一个概念框架,该概念框架将儿童发展,游戏理论和叙事学习联系起来,以指定基于物联网的游戏的新形式。EPSRC£840,000•2017 - 2019年首席调查员 - Jolly:在线笑话,以提高弱势背景的年轻人的识字和学习数字技能。由Newton Fund Initiative的机构链接赠款资助,是UCL知识实验室和菲律宾Ateneo de Manila University之间的合作。286,455英镑。我在2018年切换到合作社。•2016年-2017首席研究员。协作解决问题。NESTA 30K•2014年 - 2017年首席研究员 - 佩雷尔斯。基于实践的体验学习分析研究和支持。h2020总成本为380万欧元(欧盟300万欧元),向IOE€614K•2010 - 2014年首席调查员 - 下一代:下一代教学,教育和学习生活。EU 8.176.135 EURO(授予伦敦知识实验室的536.480欧元)•2007 - 2012年首席研究员 - 通过技术脚手架丰富的学习经验:Scarlet。 高级奖学金。 EPSRC EP/E051847/1。 £758,092。 •2010 - 2013年首席研究员 - 接任青少年 - 使用青少年能量减少能源使用。 EPSRC EP/I000550/1。 £1,238,643(授予233,282英镑授予知识实验室)。 ESRC。 Res-149-25-1064£107,666.70。EU 8.176.135 EURO(授予伦敦知识实验室的536.480欧元)•2007 - 2012年首席研究员 - 通过技术脚手架丰富的学习经验:Scarlet。高级奖学金。EPSRC EP/E051847/1。 £758,092。 •2010 - 2013年首席研究员 - 接任青少年 - 使用青少年能量减少能源使用。 EPSRC EP/I000550/1。 £1,238,643(授予233,282英镑授予知识实验室)。 ESRC。 Res-149-25-1064£107,666.70。EPSRC EP/E051847/1。£758,092。•2010 - 2013年首席研究员 - 接任青少年 - 使用青少年能量减少能源使用。EPSRC EP/I000550/1。 £1,238,643(授予233,282英镑授予知识实验室)。 ESRC。 Res-149-25-1064£107,666.70。EPSRC EP/I000550/1。£1,238,643(授予233,282英镑授予知识实验室)。ESRC。Res-149-25-1064£107,666.70。•2008 - 2009年首席研究员 - 电子目标:探索一种面向目标的学习者建模和元认知软件脚手架的方法。EPSRC EP/F018495/1£53,346•2007 - 2009 - 2009年共同投资者 - 使支持网格的学校电子科学可用于教师和与老师一起使用。•2006 - 2009年首席研究员-Vesel(终身电子科学)。EPSRC。EP/E007198/1£450,000。 •首席研究员 - 平台赠款,以支持苏塞克斯人以人为中心的技术集团的工作。 EPSRC。 £395,653。 •首席研究员 - 增强现实试验AD JAM增强现实试验,英国广播公司。 £24,000。 •首席主管 - Madeline Alsmeyer EPSRC的博士生。 •共同投资者 - 16后部门的电子学习有效性的证据有多令人信服? 系统评价。 eduserv。 £121,574。 •共同投资者 - 愉悦的个人学习环境的戏剧和表演,EPSRC。 £38,565。 •首席研究员 - 作业,一个为密钥阶级1数学的范例互动电视应用程序的项目。 EPSRC/ESRC/DTI PACCIT链接程序。 £700,000•共同投资者 - 使用多媒体系统中的外部化和软件脚手架来发展儿童的语言理解。 EPSRC。 £333,929•共同评估器 - 实验室和现场EPSRC中环境电子科学的高级网格接口。 £42,608EP/E007198/1£450,000。•首席研究员 - 平台赠款,以支持苏塞克斯人以人为中心的技术集团的工作。EPSRC。£395,653。•首席研究员 - 增强现实试验AD JAM增强现实试验,英国广播公司。£24,000。•首席主管 - Madeline Alsmeyer EPSRC的博士生。•共同投资者 - 16后部门的电子学习有效性的证据有多令人信服?系统评价。eduserv。£121,574。•共同投资者 - 愉悦的个人学习环境的戏剧和表演,EPSRC。£38,565。•首席研究员 - 作业,一个为密钥阶级1数学的范例互动电视应用程序的项目。EPSRC/ESRC/DTI PACCIT链接程序。£700,000•共同投资者 - 使用多媒体系统中的外部化和软件脚手架来发展儿童的语言理解。EPSRC。£333,929•共同评估器 - 实验室和现场EPSRC中环境电子科学的高级网格接口。£42,608