对模型关键词检索结果

Amazon SageMaker Jumpstart在私人模型中添加了对模型的微调支持

Amazon SageMaker JumpStart adds fine-tuning support for models in a private model hub

今天,我们宣布了一项增强的私人枢纽功能,并具有几种新功能,可为组织提供更大的控制权。这些增强功能包括直接在私人枢纽内微调SageMaker JumpStart模型的能力,支持和管理定制训练的模型,为关联笔记本电脑的深层链接功能以及改进的模型版本管理。

道德与偏见:应对模型评估中人机协作的挑战

Ethics and Bias: Navigating the Challenges of Human-AI Collaboration in Model Evaluation

在利用人工智能 (AI) 的变革力量的过程中,科技界面临着一个关键挑战:确保道德诚信并尽量减少人工智能评估中的偏见。在人工智能模型评估过程中融入人类直觉和判断虽然非常宝贵,但也带来了复杂的道德考量。本文探讨了这些挑战并引导我们找到 […]

发布通知:在广谱照明下使用氧化铁基胶体溶液对模型污染物进行高性能光催化降解

PUBLICATION NOTICE: High-Performance Photocatalytic Degradation of Model Contaminants with Iron Oxide–Based Colloidal Solutions under Broad-Spectrum Illumination

摘要:小分子污染物,例如来自药品、个人护理产品和杀虫剂的化合物,在传统的废水处理过程中持续存在。过渡金属氧化物(TMO)的多相光催化是一种去除废水中这些顽固污染物的新兴技术。为了利用这项技术,我们选择性地将三种不同的 TMO 与太阳光谱不同区域的带隙能量结合起来,作为收集多个波长的入射辐射的手段,以提高模型和实际污染物的降解率。具体来说,我们结合了红锌矿(ZnO,紫外线活性)、赤铁矿(α-Fe2O3,可见光活性)和镁铁矿(CuO,近红外活性)。长铁矿和赤铁矿的组合(质量比为 2:1)是最有效的降解甲基橙的方法,速率常数为 40±1E-03 min−1。当使用实验室照明应用于多污染物解决方案时,

外部验证工具可以改善LLM-AS-A-Gudge的注释质量

Can External Validation Tools Can Improve Annotation Quality for LLM-as-a-Judge

对模型响应的成对偏好被广泛收集,以评估和提供大型语言模型(LLMS)的反馈。给定两个对同一输入的替代模型响应,人类或AI注释者选择``更好''响应。这样的数据可以在很难获得传统硬编码指标的域中提供反馈信号(例如,聊天互动的质量),从而帮助衡量模型进度或模型微调(例如,通过从人类反馈中的增强型RLHF学习,RLHF)。但是,对于某些域而言,在…

您的模型还确定吗? LLMS的不确定性意识公平评估

Is Your Model Fairly Certain? Uncertainty-Aware Fairness Evaluation for LLMs

最近快速采用大语模型(LLMS)强调了基准对其公平性进行基准测试的关键需求。传统的公平度量指标集中在基于离散准确性的评估(即预测正确性)上,无法捕获模型不确定性的隐式影响(例如,尽管精度相似,但还是对一个组的更高模型置信度更高,而另一组的置信度更高)。为了解决这一限制,我们提出了一个不确定性意识的公平度量,ucerf,可以对模型公平进行精细的评估,与…

大语言模型中的超级重量

The Super Weight in Large Language Models

最近的作品显示出令人惊讶的结果:一小部分大语言模型(LLM)参数异常值对模型的质量不成比例。 LLM包含数十亿个参数,因此这些小部分(例如0.01%)转化为数十万个参数。在这项工作中,我们提出了一个更令人惊讶的发现:修剪较少的单个参数可以破坏LLM生成文本的能力 - 使困惑度增加了3个数量级,并将零拍的精度降低到猜测。我们提出了一种无数据识别此类参数的方法…

评估代码生成LLMS中的长距离依赖性处理

Evaluating Long Range Dependency Handling in Code Generation LLMs

随着语言模型支持越来越大的上下文大小,评估其使其有效使用该上下文的能力变得越来越重要。我们分析了Several Code生成模型在上下文Windows中使用多个STEPKEY检索任务处理远距离依赖性的能力,最高为8K令牌。与喜欢流行的海景测试的测试相比,这些任务在难度方面逐渐降低,并允许对模型功能进行更多细微的评估。我们发现,当功能…

与Sima.ai Edgematic一起加速EDED AI开发与无缝AWS集成

Accelerate edge AI development with SiMa.ai Edgematic with a seamless AWS integration

在这篇文章中,我们演示了如何使用SageMaker AI和Sima.ai Palette软件套件对模型进行重新训练和量化。目的是准确检测个人在可见性和保护设备检测对于合规性和安全性至关重要的环境中。

高等教育特许经营不是问题。流氓提供者和监管差距

Higher Education franchising is not the problem. Rogue providers and regulatory gaps are

监管中的差距 - 不加以自身 - 能够滥用滥用,并关闭它们是恢复对模型的信任的关键。高等教育特许经营不是问题。流氓提供者和监管差距首先出现在HEPI上。

通过传输激活来控制语言和扩散模型

Controlling Language and Diffusion Models by Transporting Activations

大型生成模型变得越来越有能力,并且更广泛地部署到电力生产应用程序中,但是让这些模型确切地产生所需的东西仍然具有挑战性。对这些模型的输出的细粒度控制对于满足用户的期望和减轻潜在的滥用非常重要,从而确保了模型的可靠性和安全性。为了解决这些问题,Apple Machine Learning研究人员开发了一种新技术,该技术具有模态性敏捷性,并通过可忽略的计算开销对模型的行为进行了精细的控制,而…

模型航空中巴尔萨木价格的野生历史

The Wild History of Balsa Wood Prices in Model Aviation

曾经对模型飞机建筑的“过去的美好时光”感到怀旧,当Balsa Wood丰富时,您的胶水可靠地粘住,而崩溃只会伤害您的骄傲?如果您在拿起几张balsa床后发现了最近的钱包,那么您就不会想象事物了,实际上,Prices的飙升比您最新的《模型航空中的Balsa Wood Price的野生历史》

Odontobuthus doriae 蝎的一些毒腺肽对 SARS-CoV-2 的抗病毒效果的计算机模拟评估

In silico antiviral effect assessment of some venom gland peptides from Odontobuthus doriae scorpion against SARS-CoV-2

计算机模拟评估 Odontobuthus doriae 蝎子的一些毒腺肽对 SARS-CoV-2 的抗病毒作用摘要 SARS-CoV-2 属于导致 COVID-19 大流行的包膜病毒家族。目前尚无有效药物可用于治疗由该病毒明确引起的感染。因此,寻找治疗 SARS-CoV-2 引起的严重疾病的有效方法至关重要。蝎毒是具有药用潜力的肽(包括抗病毒药物)的重要来源。尽管一些研究已经确定了一些蝎子肽对冠状病毒科其他成员的抗病毒作用,但迄今为止,这些肽的抗 SARS-CoV-2 作用报道很少。本研究通过计算方法评估了伊朗黄蝎“Odontobuthus doriae”中五种具有抗病毒活性潜力的预测抗菌肽的

气候变化:创建死亡率情景 - 根据气候变化的路径预测整个日本未来的死亡率...

気候変動:死亡率シナリオの作成-気候変動の経路に応じて日本全体の将来死亡率を予測してみると…

■ 摘要 到目前为止,我们已经根据气象数据为全日本创建了气候指数。我们还通过回归分析建立了气候指数与人类死亡率之间的关系。根据获得的关系,通过限制目标区域和用于收集数据的气候模型来估算未来的死亡率。该估计基于政府间气候变化专门委员会(IPCC)在其第六次评估报告中概述的共同社会经济路径(SSP)。由此得出的结论是“气候变化加剧可能会对死亡人数产生一定影响”。此次,预报区域扩大至日本全境。此外,用于获取数据的模型扩展到五种气候模型。在此基础上,根据SSP预测了整个日本未来的死亡率。研究结果显示,“在不引入气候政策的 SSP5-8.5 路径中,2081 年至 2100 年的死亡人数将比使用气候政策

评估预训练和即时适应语言模型之间的性别偏见转移

Evaluating Gender Bias Transfer between Pre-trained and Prompt-Adapted Language Models

*平等贡献者大型语言模型 (LLM) 越来越多地被调整以实现任务特异性,以便在现实世界的决策系统中部署。之前的几项研究通过研究微调适应策略对模型公平性的影响,调查了偏见转移假设 (BTH),发现在使用微调进行调整时,预训练的屏蔽语言模型中的公平性对模型公平性的影响有限。在这项工作中,我们将 BTH 的研究扩展到提示适应下的因果模型,因为提示是一种可访问且计算效率高的方式来部署……

Classic Aero-TV:RJ Gritter - 航空业光明新未来的一部分

Classic Aero-TV: RJ Gritter - Part of Aviation’s Bright New Future

来自 2015 年(YouTube 版):模特飞行员瞄准全面的职业生涯 在 2015 年室内电动 RC 节(称为 eFest)上,ANN 首席执行官兼主编 Jim Campbell 不仅发表了这份引人入胜的报道,他还对他所看到的“震惊”了。正如您将在本视频中看到的,室内遥控模型飞机飞行是任何年龄段的人都会感兴趣的事。Jim 与美国 F3P 飞行队成员 RJ Gritter 进行了交谈,该队将前往波兰参加此类室内遥控飞机的世界锦标赛。Gritter 谈到了比赛,还分享了他对模型飞行运动的见解,以及遥控模型社区如何齐心协力让每个人都能享受他们的爱好。

发现 Llama 模型中每个神经元的作用

Discover What Every Neuron in the Llama Model Does

Transluce 的新工具正在改变 AI 透明度的游戏规则——一个测试用例和一些值得思考的内容作者提供的图片——正在使用新工具!Transluce 是一家新成立的非营利研究实验室,肩负着鼓舞人心的使命,刚刚发布(23.10.24)一款引人入胜的工具,可深入了解 LLM 中的神经元行为。或者用他们自己的话说:当 AI 系统表现异常时,我们希望了解解释行为发生原因的“思维过程”。这使我们能够预测和修复 AI 模型的问题,发现隐藏的知识,并发现习得的偏见和虚假相关性。为了完成他们的使命,他们推出了一个可观察性界面,您可以在其中输入自己的提示,接收响应并查看哪些神经元被激活。然后,您可以探索激活的神

使用基于语音检索的增强功能将 ASR 与 LLM 关联化

Contextualization of ASR with LLM Using Phonetic Retrieval-Based Augmentation

大型语言模型 (LLM) 已展现出对包括音频和文本在内的多模态信号进行建模的卓越能力,允许模型根据语音输入生成口头或文本响应。然而,当输入模态为语音时,识别个人命名实体(例如电话簿中的联系人)对模型来说仍然是一个挑战。在这项工作中,我们从语音识别任务开始,并提出了一种基于检索的解决方案来将 LLM 情境化:我们首先让 LLM 在没有任何上下文的情况下检测语音中的命名实体,然后使用此命名实体作为查询来检索……

XPER:揭示预测性能的驱动力

XPER: Unveiling the Driving Forces of Predictive Performance

一种分解您最喜欢的性能指标的新方法照片由 Sira Anamwong 在 123RF 上拍摄与 S. Hué、C. Hurlin 和 C. Pérignon 合著。I - 从解释模型预测到解释模型性能敏感 AI 系统的可信度和可接受性在很大程度上取决于用户理解相关模型或至少是其预测的能力。为了揭开不透明 AI 应用的面纱,可解释 AI (XAI) 方法(例如事后可解释性工具(例如 SHAP、LIME))如今被广泛使用,并且从其输出中产生的见解现在已被广泛理解。除了单个预测之外,我们在本文中展示了如何使用可解释性能 (XPER) 方法识别任何分类或回归模型的性能指标(例如 AUC、R2)的驱动因