Will Ideogram 2.0 overtake MidJourney?
Ideogram AI 的最新文本到图像模型带来了重大进步,可能会挑战 MidJourney 和 Leonardo AI 等老牌参与者的主导地位。新功能已经可用,包括多种不同的风格、增强的真实感和高级提示工具。
Collision avoidance system transforms drone navigation
低成本、创新的无人机防撞系统使用机载传感器和摄像头自动防止空中相撞。这项技术对于无人机操作至关重要,可确保日益拥挤的空域的安全和效率。
Advanced vision system inspired by praying mantis eyes
新的计算机视觉系统可显著降低能耗,同时提供实时、逼真的空间感知。它增强了人工智能系统准确感知 3D 空间的能力——这对于自动驾驶汽车和无人机等技术至关重要。
A new competitor for Sora: Runway released the Gen-3 Alpha AI video generator
Gen-3 Alpha – 新的 AI 模型引入了强大的工具来生成高质量的视频,为创意人员提供了前所未有的控制和真实感。凭借其先进的功能和卓越的品质,该模型突破了 AI 驱动的内容创作的界限,超越了竞争对手。
MIT's MAIA: an automated agent for interpreting AI models
MAIA 可以通过进行实验和改进其分析来解释神经网络,从而增强对 AI 模型的理解。该代理可以识别神经元活动、删除不相关的特征并检测偏差,从而使 AI 系统更安全、更透明。
Ant insights lead to robot navigation breakthrough
研究人员为微型轻量级机器人创建了受昆虫启发的自主导航策略。该系统在一架 56 克的无人机上进行了测试,使其能够使用最少的计算和内存在长途飞行后返回家中。
Drone racing drives AI innovation for space exploration
无人机竞赛已用于测试未来太空任务的神经网络。该项目旨在自主管理复杂的航天器机动,优化机载操作并提高任务效率和稳健性。
Creating digital elevation models from open data
如今,雷达卫星可以提供连续、高精度的地球表面数据,开源软件也越来越快、越来越方便,用户只需单击一下即可创建 DEM。这可以有效监测地形变化和自然现象。
NVIDIA’s breakthrough in synthetic data generation and AI alignment
Nemotron-4 340B 是用于合成数据生成和 AI 校准的高级模型系列。它经过 9 万亿个 token 的训练,在优化性能和确保数据质量方面表现出色,显著增强了各个行业的 AI 能力。
Deep Learning Strategies for Multi-Camera Drone Vision Systems
近年来,随着无人机使用量的大幅增加,人们对其安全性的担忧也随之增加。在这方面,已经开发出一种新系统,该系统利用计算机视觉和深度学习算法来准确、快速地检测和跟踪无人机。
Zephyr drone is breaking records in the stratosphere
太阳能驱动的 Zephyr 无人机创造了续航时间和飞行高度的世界纪录,在高达 75,000 英尺的高度上停留了 64 天。Zephyr 的应用范围从地球观测到移动电话基站,为偏远地区提供了关键的连接。
Meteorological marvels: AI redefines weather forecasting
就像一股令人振奋的强冷锋通过一样,天气预报界正在发生重大变化。结局如何?一种基于可在台式计算机上运行的人工智能的全新天气预报方式。
Digital sorcery in action: “Alchemist” changes material properties in images
麻省理工学院计算机科学和人工智能实验室和谷歌研究院的研究人员似乎用他们的最新发明创造了奇迹:一种可以改变图像中物体材料属性的扩散模型。
A new era of multimodal AI with GPT-4o
在 Spring Update 活动期间,OpenAI 展示了 GPT-4®——一种独特的全能模型,集成了文本、音频和图像处理,使其能够比以往更快、更高效地工作。
China’s AI model SenseNova 5.0 surpasses ChatGPT
商汤集团最新的人工智能模型SenseNova 5.0凭借其令人印象深刻的进步引发了市场兴趣的激增,包括增强的知识处理、数学推理和语言能力。
Llama 3: the latest advances in LLM
Llama 3 是 Meta AI 的最新进展,拥有无与伦比的语言理解能力,增强了其执行复杂任务的能力。凭借扩大的词汇量和先进的安全功能,该模型可确保提高性能和多功能性。
The art of AI music: exploring Udio and Suno music generators
使用 Udio 和 Suno 平台探索 AI 音乐合成的前沿。音乐生成器使用户能够毫不费力地生成不同流派的完整歌曲,同时提供可定制的功能,以便在几秒钟内尝试各种风格并制作原创旋律。
Machine “unlearning” safeguards generative AI from copyright and violence issues
机器“反学习”允许生成 AI 选择性地忘记有问题的数据,而无需进行大量的再训练。这种方法可以确保符合法律和道德标准,同时保持图像到图像模型的创造能力。