准确率关键词检索结果

每周回顾 2024 年 8 月 16 日

Weekly Review 16 August 2024

我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):生成式人工智能如何应用于生物医学研究:https://www.nature.com/articles/d42473-023-00458-1 也许这个工具在检测人工智能生成的写作方面有 99.9% 的准确率,因为它将所有内容归类为人工智能生成的?https://futurism.com/the-byte/openai-software-detects-ai-writing学费飞涨不仅仅是美国的问题。学生因为费用而放弃选修课,从长远来看会付出更大的代

新研究表明,阿尔茨海默氏症血液测试优于标准诊断

Alzheimer's Blood Test Outperforms Standard Diagnostics in New Study

血液测试准确诊断阿尔茨海默氏症的准确率约为 90%,而专科医生的准确率仅为 73%,初级保健医生的准确率仅为 61%

流氓波:利用先进的神经网络预测不可预测的事情

Rogue Waves: Predicting the Unpredictable With Advanced Neural Networks

一种利用神经网络技术的新工具可以使用来自海洋浮标的数据,提前五分钟预测流氓波,准确率达到 75%……

留意(和倾听)负鼠

Keeping an eye (and ear) out for possums

研究人员经常使用录音来监测新西兰的鸟类,但现在,他们首次将这种技术应用于追踪害虫。他们发布了一个经过微调的模型,可以以 98% 的准确率检测长期现场录音中负鼠的存在与否。他们表示,这种方法可能是一种新的经济有效的选择,可以补充目前的负鼠监测工作。

新的车载 AI 算法可以通过不断扫描面部来发现醉酒司机

New in-vehicle AI algorithm can spot drunk drivers by constantly scanning their faces for signs of intoxication

车载摄像头可以持续观察您是否有醉酒迹象,新的 AI 算法可以以 75% 的准确率确定您的醉酒程度。

新的免费筛查工具旨在将痴呆症防患于未然

New, free, screening tool aims to catch dementia in the bud

澳大利亚研究人员开发了一种筛查工具,可以识别痴呆症的早期迹象,从而尽早进行治疗干预。研究人员表示,他们的工具是一份人们自己填写的问卷,可以以 99.9% 的准确率检测出中度至重度认知衰退。“这种工具对于检测与神经退行性过程相关的认知衰退特别有用,例如[…]

新的 AI 系统利用语音分析成功识别阿尔茨海默病

New AI system successfully identifies Alzheimer’s disease using speech analysis

通过分析语音模式,波士顿大学的研究人员开发了一种人工智能系统,该系统可以以近 80% 的准确率预测轻度认知障碍患者是否会在六年内患上阿尔茨海默病。这项研究发表在《阿尔茨海默病与痴呆症》杂志上,利用人工智能从认知评估中提取有价值的诊断信息,加速阿尔茨海默病的诊断,进而加速治疗。该团队的人工智能模型在预测六年内从轻度认知障碍 (MCI) 发展到阿尔茨海默病方面实现了 78.5% 的准确率和 81.1% 的灵敏度。这超过了其他传统的非侵入性测试。但至关重要的是,该系统依赖于新人工智能系统使用语音分析成功识别阿尔茨海默病的帖子首先出现在 DailyAI 上。

FBSDetector:普渡大学的新工具发现假手机信号塔

FBSDetector: Purdue's New Tool Finds Fake Cell Towers

普渡大学的研究人员推出了 FBSDetector,这是一种尖端的机器学习工具,可以以超过 90% 的准确率检测假手机信​​号塔,为对抗蜂窝网络中不断演变的威胁提供了一种新颖、经济高效的解决方案。

使用 SAFE 在 ChatGPT 等法学硕士中进行高效事实核查

Efficient fact-checking in LLMs like ChatGPT with SAFE

Google 的 DeepMind 开发了一种用于大型语言模型中长篇事实性的新方法——搜索增强事实性评估器 (SAFE)。该 AI 事实核查工具表现出令人印象深刻的准确率,优于人类事实核查员。

从模型到复合 AI 系统的转变

The Shift from Models to Compound AI Systems

2023 年,AI 凭借大型语言模型 (LLM) 吸引了所有人的注意力,只需提示即可指示该模型执行一般任务,例如翻译或编码。这自然导致人们强烈关注模型作为 AI 应用程序开发的主要要素,每个人都想知道新的 LLM 将带来哪些功能。然而,随着越来越多的开发人员开始使用 LLM 进行构建,我们相信这种关注点正在迅速改变:最先进的 AI 结果越来越多地由具有多个组件的复合系统获得,而不仅仅是单片模型。例如,Google 的 AlphaCode 2 通过精心设计的系统在编程中设置了最先进的结果,该系统使用 LLM 为任务生成多达 100 万种可能的解决方案,然后筛选该集合。同样,AlphaGeomet

英国科学家推出了一种比人类更快阅读盲文的机器人

Британские ученые представили робота читающего шрифт Брайля быстрее человека

剑桥大学的一个研究团队使用机器学习算法来训练机器人传感器以每分钟 315 个单词的速度阅读盲文,准确率接近 90%。

VA 残疾福利:退伍军人上诉委员会应解决其质量保证流程中的漏洞

VA Disability Benefits: Board of Veterans' Appeals Should Address Gaps in Its Quality Assurance Process

美国政府问责局的发现退伍军人上诉委员会 (Board) 有一个质量保证 (QA) 流程和相关的决策准确性衡量标准。具体来说,其 QA 流程包括:1) 每月通过案件审查流程检查随机抽样的决策草案是否存在委员会定义的某些类型的错误;2) 监控进一步上诉至美国退伍军人索赔上诉法院 (CAVC) 的委员会决策结果。委员会利用这些活动的结果提供各种干预措施,例如向退伍军人法官 (VLJ) 提供个人反馈或培训。委员会还计算并发布代表无错误裁决的准确率。但是,美国政府问责局发现委员会计算此指标的过程存在不足。与联邦内部控制标准相反,GAO 发现委员会没有:(1) 制定计算其准确率或管理案例审查错误数据的书面

每周回顾 2024 年 5 月 17 日

Weekly Review 17 May 2024

我上周在 Twitter 上发布的一些有趣链接(我也在 Mastodon、Threads、Newsmast、Bluesky 和 ​​Post 上发布了这些链接):难以与真人互动的青少年发现与人工智能互动更容易:https://futurism.com/the-byte/lonely-teens-friends-with-ai 关于使用人工智能生成的数据训练人工智能是否会导致问题的不同意见:https://www.theregister.com/2024/05/09/ai_model_collapse/ 澳大利亚正在认真对待深度伪造和其他人工智能生成的内容:https://www.techrep

MIPT 制作了量子神经网络

В МФТИ сделали квантовую нейросеть

年轻的 MIPT 科学家是俄罗斯第一批在超导量子比特链中实验性实施量子学习算法的人。多个量子比特的量子神经网络解决了手写图像的多类分类和识别问题,准确率达到90%以上。研究结果于 2023 年 3 月上旬在米阿斯举行的 VI 国际量子技术学校上公布。

发现机器学习模型的系统性错误

Discovering the systematic errors made by machine learning models

使用跨模态嵌入发现系统性错误在这篇博文中,我们介绍了 Domino,这是一种发现机器学习模型系统性错误的新方法。我们还讨论了定量评估 Domino 等方法的框架。链接:📄 论文(ICLR 2022)🌍 更长的演练💻 GitHub📘 文档📒 Google Colab 实现高总体准确率的机器学习模型通常会在连贯的验证数据切片上犯系统性错误。什么是切片?切片是一组具有共同特征的数据样本。例如,在大型图像数据集中,老式汽车的照片构成一个切片(即切片中的所有图像都有一个共同的主题)。术语切片有许多您可能更熟悉的同义词(例如子组、子群体、地层)。这些术语基本上可以互换,但在本文中我们将坚持使用“切片”。如

发现机器学习模型所犯的系统性错误

Discovering the systematic errors made by machine learning models

使用跨模态嵌入发现系统性错误在这篇博文中,我们介绍了 Domino,这是一种发现机器学习模型系统性错误的新方法。我们还讨论了定量评估 Domino 等方法的框架。链接:📄 论文(ICLR 2022)🌍 更长的演练💻 GitHub📘 文档📒 Google Colab 实现高总体准确率的机器学习模型通常会在连贯的验证数据切片上犯系统性错误。什么是切片?切片是一组具有共同特征的数据样本。例如,在大型图像数据集中,老式汽车的照片构成一个切片(即切片中的所有图像都有一个共同的主题)。术语切片有许多您可能更熟悉的同义词(例如子组、子群体、地层)。这些术语基本上可以互换,但在本文中我们将坚持使用“切片”。如

选择性分类可以放大群体之间的差异

Selective Classification Can Magnify Disparities Across Groups

选择性分类是一种在错误代价高昂的环境中部署模型的有效方法,即当模型对预测不确定时,允许它们“弃权”。例如,在医学领域,模型错误可能会造成生死攸关的后果,但弃权问题可以通过让医生做出诊断来轻松处理。在从视觉 123 到 NLP 45 的一系列应用中,即使是简单的选择性分类器,仅依赖于模型逻辑,也会通过弃权而经常显著提高准确性。这使得选择性分类成为 ML 从业者 67 的有力工具。然而,在我们最近的 ICLR 论文中,我们发现尽管选择性分类可以可靠地提高平均准确率,但它可能无法提高甚至损害某些数据子群体的准确率。作为一个激励人心的例子,考虑通过胸部 X 光片诊断胸腔积液或肺部积液的任务。胸腔积液通

选择性分类可以放大群体之间的差异

Selective Classification Can Magnify Disparities Across Groups

选择性分类是一种在错误代价高昂的环境中部署模型的有效方法,即当模型对预测不确定时,允许它们“弃权”。例如,在医学领域,模型错误可能会产生生死攸关的后果,但弃权可以通过退到医生那里,然后由医生做出诊断来轻松处理。在从视觉 123 到 NLP 45 的一系列应用中,即使是简单的选择性分类器,仅依赖于模型逻辑,也会通过弃权而经常显著提高准确性。这使得选择性分类成为 ML 从业者 67 的有力工具。然而,在我们最近的 ICLR 论文中,我们发现,尽管选择性分类可以可靠地提高平均准确率,但它可能无法提高甚至损害某些数据子群体的准确率。作为一个激励人心的例子,考虑通过胸部 X 光片诊断胸腔积液或肺部积液的