The genius of SUPER drone’s two-trajectory strategy
双轨迹规划系统让 MAV 能够探索未知路径,同时始终保持安全的备用路线。借助基于 LiDAR 的感知和 CIRI 算法,无人机可以动态生成实时飞行路径,以便在不可预测的环境中实现高速导航。
From text to 3D: the magic behind Edify 3D by NVIDIA
NVIDIA 的 Edify 3D 使用 AI 在 2 分钟内创建高质量的 3D 模型。通过结合多视图扩散模型和 Transformers,它可以从文本或图像快速、准确且可扩展地生成 3D,使其成为游戏、动画和设计行业的完美解决方案。
Microsoft launched the Phi-4 model with fully open weights
微软在 MIT 许可下推出了具有开放权重的 Phi-4 模型,为研究人员和开发人员提供了前所未有的灵活性。凭借 140 亿个参数,Phi-4 在解决数学问题和多任务处理方面的表现优于同类产品,确保以有限的资源高效工作。
RadiologyLlama-70B: A new language model for radiology reports
RadiologyLlama-70B 是一种先进的 AI 模型,经过超过 650 万份医疗报告的训练,可增强对放射学发现的分析。该模型可以显著改善放射科医生的工作流程,在降低计算成本的同时提供卓越的准确性。
Alibaba vs. OpenAI: Can a new model outperform ChatGPT?
阿里巴巴的新 AI 模型 QwQ-32B-Preview 以其出色的数学和逻辑技能向 ChatGPT 发起挑战,在关键基准测试中超越竞争对手。该模型在开放许可下发布,具有高级推理能力,但在需要强大常识理解的任务中仍然举步维艰。
Anthropic simplifies AI access to data sources
Anthropic 推出了模型上下文协议 - 一个简化 AI 与数据源和外部工具集成的开源框架。通过提供通用标准,MCP 增强了 AI 功能并消除了对定制解决方案的需求。
AI can control computer just like a human
Anthropic 推出了 Claude 3.5 Sonnet,这是一种能够像人类一样控制计算机的新型 AI 模型。该模型使用桌面屏幕截图来导航应用程序并执行单击、键入和收集信息等任务。
Stable Diffusion 3.5 opens new doors in digital art
Stability AI 最新发布的 Stable Diffusion 3.5 引入了三种强大的模型变体,可为消费硬件提供增强的图像质量、速度和可访问性。这些模型可免费用于非商业用途,并集成了先进的安全功能以防止滥用。
Controversial science: AI and Nobel Prizes
2024 年诺贝尔物理学奖和化学奖开创了承认人工智能对科学贡献的先例。虽然有些人可能质疑人工智能与传统学科之间的契合度,但另一些人认为这是承认现代研究跨学科性质的必要一步。
Movie Gen – the future of AI video generation
Meta 推出了 Movie Gen,这是一款人工智能工具,可通过简单的文本提示创建具有同步声音的高清视频。该模型提供高级视频创建和编辑功能,让用户能够更好地控制内容生成。
Google releases major updates for Gemini models
通过降价、提高速率限制和加快输出速度,Google 推出的全新 Gemini 模型让全球开发者能够更轻松地使用高级 AI。它们可提高速度、降低成本,并增强各种文本、代码和多模式任务的性能。
Autonomous landing innovation – a new era for drones
印度专利局已授予微型无人机创新着陆系统的专利。该技术可在具有挑战性的地形上实现精确着陆,并有可能应用于军事和民用物流,包括高空交付和紧急情况。
Will Ideogram 2.0 overtake MidJourney?
Ideogram AI 的最新文本到图像模型带来了重大进步,可能会挑战 MidJourney 和 Leonardo AI 等老牌参与者的主导地位。新功能已经可用,包括多种不同的风格、增强的真实感和高级提示工具。
Collision avoidance system transforms drone navigation
低成本、创新的无人机防撞系统使用机载传感器和摄像头自动防止空中相撞。这项技术对于无人机操作至关重要,可确保日益拥挤的空域的安全和效率。
Advanced vision system inspired by praying mantis eyes
新的计算机视觉系统可显著降低能耗,同时提供实时、逼真的空间感知。它增强了人工智能系统准确感知 3D 空间的能力——这对于自动驾驶汽车和无人机等技术至关重要。
A new competitor for Sora: Runway released the Gen-3 Alpha AI video generator
Gen-3 Alpha – 新的 AI 模型引入了强大的工具来生成高质量的视频,为创意人员提供了前所未有的控制和真实感。凭借其先进的功能和卓越的品质,该模型突破了 AI 驱动的内容创作的界限,超越了竞争对手。
MIT's MAIA: an automated agent for interpreting AI models
MAIA 可以通过进行实验和改进其分析来解释神经网络,从而增强对 AI 模型的理解。该代理可以识别神经元活动、删除不相关的特征并检测偏差,从而使 AI 系统更安全、更透明。
Ant insights lead to robot navigation breakthrough
研究人员为微型轻量级机器人创建了受昆虫启发的自主导航策略。该系统在一架 56 克的无人机上进行了测试,使其能够使用最少的计算和内存在长途飞行后返回家中。