Beyond Benchmarks: Why AI Evaluation Needs a Reality Check
,如果您如今一直关注AI,您可能已经看到头条新闻,报告了AI模型实现基准记录的突破性成就。从ImageNet图像识别任务到在翻译和医学图像诊断方面的超人分数,长期以来,基准一直是测量AI性能的金标准。但是,像这些数字一样令人印象深刻[…]超越基准的帖子:为什么AI评估需要现实检查首先出现在unite.ai上。
Sansec uncovered a supply chain attack via 21 backdoored Magento extensions
通过21个后室的Magento Extensions通过21个供应链攻击达到了500-1,000个E商店,其中包括$ 40B的跨国公司。 SANSEC研究人员报告说,多个供应商在协调的供应链攻击中被黑客入侵,专家发现,后门被隐藏在21个应用程序中。奇怪的是,恶意代码是在6年前注入的,但供应链攻击是[…]
Затонувшую на Сицилии летом яхту Bayesian поднимут на поверхность в мае
去年8月在西西里岛沉没的贝叶斯游艇将于5月升级为浮出水面。 4月15日,星期二,英国报纸《镜子》(The Mirror)提到了MarcéKamMarcéCoamAgency and Coast Guard的高级调查员。 “在某个阶段,我们计划检查船只。救恩的工作开始了,我们希望它将在今年5月在岸上。”
80 years ago the Allies found their bridge across the Rhine
在雷玛根(Remagen)占领这座桥的一条令人惊讶的完整道路,它帮助美军加速了第二次世界大战的结束。80年前,盟军发现他们跨过莱茵河的桥梁在任务和目的方面都是首先。
SECURITY AFFAIRS MALWARE NEWSLETTER ROUND 33
安全事务恶意软件新闻通讯包括国际景观中有关恶意软件的最佳文章和研究。移动印度网络抢劫:Fatboypanel和他的大量数据泄露Google Tag Manager Skimmer从南美到东南亚的Magento网站窃取信用卡信息:Ref7707的脆弱网络,分析深#驱动器:朝鲜[…]
Crooks use Google Tag Manager skimmer to steal credit card data from a Magento-based e-stores
Sucuri 研究人员观察到威胁行为者利用 Google Tag Manager (GTM) 在基于 Magento 的电子商店上安装电子撇取软件。 Sucuri 研究人员发现威胁行为者使用 Google Tag Manager (GTM) 在 Magento 电子商务网站上部署 e-skimmer 恶意软件。Google Tag Manager (GTM) 是一款免费工具,可让网站所有者管理营销标签而无需修改网站代码,[…]
Boeing 737 VP-BEL drops in to Christchurch
昨天,28 日,波音 737-74T (BBJ) VP-BEL c/n 29139 坠入基督城国际机场。我相信这架飞机于 1999 年 11 月 1 日首次飞行,波音测试注册号为 N1786B,然后在北太平洋航空公司注册为 N73721,2000 年 8 月更改为 N21KR,然后于次月消失在富国银行西北 NA 受托人账簿中。2003 年 11 月,它以 VP-BEL 的身份重新出现在 Magenta Aviation 中,随后在 2007 年 8 月出现在 Orient Global 中。
Interpreting CLIP: Insights on the Robustness to ImageNet Distribution Shifts
稳健模型和非稳健模型的区别是什么?虽然对于 ImageNet 分布变化,已经表明这种稳健性差异可以主要追溯到训练数据的差异,但到目前为止,尚不清楚这在模型学习方面意味着什么。在这项工作中,我们通过探测具有各种主干(ResNets 和 ViTs)和预训练集(OpenAI、LAION-400M、LAION-2B、YFCC15M、CC12M 和 DataComp)的 16 个稳健零样本 CLIP 视觉编码器的表示空间,并将它们与较少的表示空间进行比较来弥合这一差距……
Google Wisk nytt AI-verktyg för bildgenerering
Whisk 是 Google 实验室的一项新实验,允许用户使用其他图像而不是文本提示来创建图像。这款生成式 AI 工具使用 Gemini 生成详细的字幕,并使用 Imagen 3 进行推理,让用户可以自由地重新组合主题、场景和风格来开发 […]Google Wisk 发布的用于图像生成的新 AI 工具首次出现在 AI 新闻中。
State-of-the-art video and image generation with Veo 2 and Imagen 3
我们正在推出一款全新的、最先进的视频模型 Veo 2,以及 Imagen 3 的更新。此外,请查看我们的新实验 Whisk。
VQAScore: Evaluating and improving vision-language generative models
简介 文本到图像/视频模型(如 Midjourney、Imagen3、Stable Diffusion 和 Sora)可以根据自然语言提示生成美观、逼真的视觉效果,例如,给定“几只巨大的猛犸象走近,穿过一片雪地草地……”,Sora 会生成:但我们如何知道这些模型是否生成了我们想要的东西?例如,如果提示是“棕色的狗在树周围追逐黑色的狗”,我们如何判断模型显示的是狗“在树周围追逐”而不是“在后院玩耍”?更一般地说,我们应该如何评估这些生成模型?虽然人类可以轻松判断生成的图像是否与提示一致,但大规模的人工评估成本高昂。为了解决这个问题,我们引入了一个新的评估指标 (VQAScore) 和基准数据集
Israel says another rocket barrage from Lebanon kills 2 more in Israel, hours after 5 were killed
以色列主要紧急医疗组织 Magen David Adom 表示,其医务人员证实,周四在北部城市海法郊区,一名 30 岁男子和一名 60 岁女子死亡。
Image Data Collection for Climate Change Analysis
初学者指南埃特纳火山的卫星图像。来源:美国地质调查局 (USGS) 在 Unsplash 上的照片。I. 简介深度学习在地球观测中成功传播。它的成就导致了更复杂的架构和方法。然而,在这个过程中,我们忽略了一些重要的东西。拥有更多优质数据比拥有更好的模型更好。不幸的是,EO 数据集的开发一直很混乱。如今,它们有数百个。尽管我们努力编译数据集,但可以说它们散布在各处。此外,EO 数据已经激增以满足非常具体的需求。矛盾的是,这正是我们应该用它们前进的相反方向,特别是如果我们希望我们的深度学习模型更好地工作的话。例如,ImageNet 编译了数千张图像以更好地训练计算机视觉模型。然而,EO 数据比 I
How to Tackle the Weekend Quiz Like a Bayesian
您知道以下哪个是 malmsey 吗?您能猜出来吗?几周前,悉尼先驱晨报美好周末测验中出现了这个问题:malmsey 是什么:轻微宿醉、女巫的诅咒还是强化葡萄酒?假设我们对答案一无所知,在这种情况下有什么方法可以做出明智的猜测吗?我认为有。在继续阅读之前,请随意思考一下。使用 Gemini Imagen 3 创建的因强化葡萄酒而轻微宿醉的女巫我们真的没有什么可以回答这个问题的吗?看着这个词,感觉它可能意味着这些选项中的任何一个。当然,多项选择题就是为了给人这种感觉而构建的。但我们可以采取一种理性的方法,即认识到每个选项都有不同的基准利率。也就是说,暂时忘掉什么是玛姆西酒,什么不是玛姆西酒,我们
New Caledonia's Aircalin in merger talks, cuts flights
新喀里多尼亚航空 (SB,努美阿 La Tontouta) 正在与另一家新喀里多尼亚航空公司喀里多尼亚航空 (TY,努美阿 Magenta) 和新喀里多尼亚航空 (RLY,努美阿 Magenta) 进行早期合并谈判,以应对该国长期民间骚乱导致的机场关闭和街头骚乱造成的收入大幅下降。该航空公司还减少了部分航线的航班频率,并取消了其他航线,以应对客流量下滑。Aircalin 首席执行官 Georges Selefen 于 2017 年 11 月 23 日在努美阿对记者表示......
New Caesar Cipher Skimmer targets popular CMS used by e-stores
一种名为 Caesar Cipher Skimmer 的新型电子窃取器被用于入侵多个 CMS,包括 WordPress、Magento 和 OpenCart。 Sucuri 研究人员发现了一种名为 Caesar Cipher Skimmer 的新型电子窃取器,最近几周它被用来针对基于流行 CMS 的电子商店用户,包括 WordPress、Magento 和 OpenCart。在过去几周里,专家们 […]
New generative media models and tools, built with and for creators
我们推出了 Veo,这是我们最强大的高清视频生成模型,以及 Imagen 3,这是我们最高质量的文本转图像模型。我们还将分享使用我们的 Music AI Sandbox 创建的新演示录音。