Archer Midnight Air Taxi Heads to Japan in $500M Deal
Soracle 是日本航空公司和日本企业集团住友的合资企业,有权购买多达 100 辆电动空中出租车。文章《Archer Midnight 空中出租车以 5 亿美元的价格前往日本》首次出现在《飞行杂志》上。
VQAScore: Evaluating and improving vision-language generative models
简介 文本到图像/视频模型(如 Midjourney、Imagen3、Stable Diffusion 和 Sora)可以根据自然语言提示生成美观、逼真的视觉效果,例如,给定“几只巨大的猛犸象走近,穿过一片雪地草地……”,Sora 会生成:但我们如何知道这些模型是否生成了我们想要的东西?例如,如果提示是“棕色的狗在树周围追逐黑色的狗”,我们如何判断模型显示的是狗“在树周围追逐”而不是“在后院玩耍”?更一般地说,我们应该如何评估这些生成模型?虽然人类可以轻松判断生成的图像是否与提示一致,但大规模的人工评估成本高昂。为了解决这个问题,我们引入了一个新的评估指标 (VQAScore) 和基准数据集
Video Friday: Swiss-Mile Robot vs. Humans
视频星期五是每周精选的精彩机器人视频,由 IEEE Spectrum robotics 的朋友收集。我们还发布未来几个月即将举行的机器人活动日历。请将您的活动发送给我们以供收录。Humanoids 2024:2024 年 11 月 22 日至 24 日,法国南希,享受今天的视频!Swiss-Mile 的机器人(实际上是任何满足运行其软件的硬件要求的机器人)比“大多数人类”都快。那么,这到底意味着什么呢?获胜者是 Riccardo Rancan,他看起来并没有特别努力——他是高速城市定向越野赛的世界冠军,这是一项我以前不知道但听起来很棒的运动。[ Swiss-Mile ]谢谢,Marko!哦,太
DAI#59 – APIs, dead bills, and NVIDIA opens up
欢迎阅读我们每周一次的人工 AI 新闻汇总。本周,OpenAI 发布了 API 好东西。加州的 AI 安全法案被否决。NVIDIA 用一个强大的开放模型给我们带来了惊喜。让我们深入研究。代理来了 OpenAI 在其 Dev Day 活动上没有宣布任何新模型(或 Sora),但开发人员对新的 API 功能感到兴奋。Realtime API 将改变游戏规则,使应用程序更智能,可以与用户对话,甚至充当代理。演示真的很酷。有传言称 OpenAI 走“营利”路线,并向 Sam Altman 奖励数十亿美元 DAI#59 – API、死账单和 NVIDIA 开放首先出现在 DailyAI 上。
How is China doing in the AI race? Tech giants and startups are pushing boundaries
阿里云最近在其 Qwen 2.5 系列中发布了 100 多个新的开源模型。这些模型的大小从 0.5 到 720 亿个参数不等,可以用 29 种不同的语言处理从编码到数学的任务。该公司的统一模型可通过 Model Studio 平台使用,短短几个月内,其用户群就从 90,000 人跃升至 300,000 多人。阿里巴巴还在多模态 AI 领域不断突破界限。他们推出了一种文本转视频模型,可以根据书面描述创建各种视频风格,类似于尚未发布的 OpenAI 的 Sora。该公司的 Qwen 2-VL 模型可以The post 中国在 AI 竞赛中表现如何?科技巨头和初创公司正在突破界限首先出现在 Dail
VQ4DiT: A Fast Post-Training Vector Quantization Method for DiTs (Diffusion Transformers Models)
文本到图像的扩散模型在根据输入条件生成复杂而忠实的图像方面取得了重大进展。其中,扩散变压器模型 (DiT) 变得特别强大,OpenAI 的 SoRA 是一个值得注意的应用程序。DiT 由堆叠多个变压器块构建而成,利用变压器的缩放属性通过灵活的参数扩展实现增强的性能。文章 VQ4DiT:一种用于 DiT(扩散变压器模型)的快速后训练矢量量化方法首次出现在 AI Quantum Intelligence 上。
Philippine Coast Guard's first 97-meter Multi-Role Response Vessel to launch soon
菲律宾海岸警卫队期待在接下来的几天里听到好消息。其迄今为止最大的船舶采购项目是向日本三菱重工订购的 94 米多用途反应舰 (MRRV),该舰将在本周达到一个重要的里程碑。但在此之前,我们之前的报道称,新的 MRRV 实际上长 97 米,而不是项目概念和合同签署阶段建议的 94 米。该级别首舰船体编号为 9701(97 米,船体 01),尚未命名,计划于 2021 年 7 月 26 日星期一在三菱重工在日本的造船厂下水。船体编号 9701 是菲律宾海岸警卫队这种新型 97 米 MRRV 的首舰。它的大部分外部组件(包括雷达和其他子系统)已经安装在桅杆上。消息人士向 MaxDefense Phil
Preparing Leaders for Justice with Imagination
Soraya Sablo Sutton,加州大学伯克利分校教育学院和 Woo Williams Zou,加州大学伯克利分校教育学院和国家公平项目 注意:本博客是第 9 集“培养想象力”播客的延伸。“我经常觉得自己被困在别人的想象中,我必须发挥自己的想象力才能[…]
三个新的强大的开放 AI 模型。 Snowflake Artic。 Apple OpenELM。 Microsoft Phi-3。 OpenVoicev2.Open-Sora。 JAT 代理。 GTE SOTA 嵌入。 Maestro 子代理。 Cohere RAG 工具包。 Diffusion GenAI 视频。
重新审视 GenAI RAG。Command-R。RAFT。RAT。RAG + 知识图谱。Devin AI 工程师。KPU(知识处理单元)。Open-Sora GenAI Vid。AutoDev。DeepMind SIMA。DeepSeek-VL。Amazon Chronos 模型。
Stable Diffusion 3 – next-gen AI image generator
OpenAI 的最新作品 Sora 制作了引人入胜的视频,提供了无与伦比的视觉构图真实感。该模型利用语言理解和视频生成的融合,可以解释文本提示、适应各种输入方式并模拟动态相机运动。
SORA: Redefining text-to-video generation with advanced AI capabilities
OpenAI 的最新创作 Sora 制作了引人入胜的视频,提供了无与伦比的视觉构图真实感。利用语言理解和视频生成的融合,该模型可以解释文本提示,适应各种输入模式,并模拟动态相机运动。
超越 GenAI 和 LLM。bGPT 字节预测。一次性图形表示学习。保形预测 + ML。StarCoder 模型。CoRe SOTA 优化器。Sora 评论。 hybridbread 重新排序模型。INRIA MLXP。
AI 世界模型和视频。OpenAI Sora。加州大学伯克利分校大型世界模型。MetaAI V-JEPA SSL 模型。AI 操作系统。Mamba 模型深入研究。Phidata AI 助手。BCG AgentKit。
The Wall Street Journal: New OpenAI Technology Can Create Realistic Video From a Line of Text
在这篇《华尔街日报》文章中,高级研究员 Arthur Holland Michel 被引用,讨论了新人工智能工具(如 Sora)的潜在滥用问题。
Soft Computing, Volume 28, Issues 9-10, May 2024
1) 使用改进的 SSO 算法对绿色能源集成微电网电力系统进行优化频率控制作者:A. Deepa、Arangarajan Vinayagam...Andrew Xavier Raj Irudayaraj页数:6423 - 64462) 动态适应度距离平衡随机分形搜索 (dFDB-SFS 算法):一种用于全局优化和精确光伏建模的有效元启发式方法作者:Hamdi Tolga Kahraman、Mohamed H. Hassan...Salah Kamel页数:6447 - 64743) 一种用于大规模多目标优化问题的基于快速插值的多目标进化算法作者:Zhe Liu、Fei Han...Jing J