Drone racing drives AI innovation for space exploration
无人机竞赛已用于测试未来太空任务的神经网络。该项目旨在自主管理复杂的航天器机动,优化机载操作并提高任务效率和稳健性。
Creating digital elevation models from open data
如今,雷达卫星可以提供连续、高精度的地球表面数据,开源软件也越来越快、越来越方便,用户只需单击一下即可创建 DEM。这可以有效监测地形变化和自然现象。
NVIDIA’s breakthrough in synthetic data generation and AI alignment
Nemotron-4 340B 是用于合成数据生成和 AI 校准的高级模型系列。它经过 9 万亿个 token 的训练,在优化性能和确保数据质量方面表现出色,显著增强了各个行业的 AI 能力。
Deep Learning Strategies for Multi-Camera Drone Vision Systems
近年来,随着无人机使用量的大幅增加,人们对其安全性的担忧也随之增加。在这方面,已经开发出一种新系统,该系统利用计算机视觉和深度学习算法来准确、快速地检测和跟踪无人机。
Zephyr drone is breaking records in the stratosphere
太阳能驱动的 Zephyr 无人机创造了续航时间和飞行高度的世界纪录,在高达 75,000 英尺的高度上停留了 64 天。Zephyr 的应用范围从地球观测到移动电话基站,为偏远地区提供了关键的连接。
Meteorological marvels: AI redefines weather forecasting
就像一股令人振奋的强冷锋通过一样,天气预报界正在发生重大变化。结局如何?一种基于可在台式计算机上运行的人工智能的全新天气预报方式。
Digital sorcery in action: “Alchemist” changes material properties in images
麻省理工学院计算机科学和人工智能实验室和谷歌研究院的研究人员似乎用他们的最新发明创造了奇迹:一种可以改变图像中物体材料属性的扩散模型。
A new era of multimodal AI with GPT-4o
在 Spring Update 活动期间,OpenAI 展示了 GPT-4®——一种独特的全能模型,集成了文本、音频和图像处理,使其能够比以往更快、更高效地工作。
China’s AI model SenseNova 5.0 surpasses ChatGPT
商汤集团最新的人工智能模型SenseNova 5.0凭借其令人印象深刻的进步引发了市场兴趣的激增,包括增强的知识处理、数学推理和语言能力。
Llama 3: the latest advances in LLM
Llama 3 是 Meta AI 的最新进展,拥有无与伦比的语言理解能力,增强了其执行复杂任务的能力。凭借扩大的词汇量和先进的安全功能,该模型可确保提高性能和多功能性。
The art of AI music: exploring Udio and Suno music generators
使用 Udio 和 Suno 平台探索 AI 音乐合成的前沿。音乐生成器使用户能够毫不费力地生成不同流派的完整歌曲,同时提供可定制的功能,以便在几秒钟内尝试各种风格并制作原创旋律。
Machine “unlearning” safeguards generative AI from copyright and violence issues
机器“反学习”允许生成 AI 选择性地忘记有问题的数据,而无需进行大量的再训练。这种方法可以确保符合法律和道德标准,同时保持图像到图像模型的创造能力。
Efficient fact-checking in LLMs like ChatGPT with SAFE
Google 的 DeepMind 开发了一种用于大型语言模型中长篇事实性的新方法——搜索增强事实性评估器 (SAFE)。该 AI 事实核查工具表现出令人印象深刻的准确率,优于人类事实核查员。
MIT achievement: AI now generates high-quality images 30 times faster
麻省理工学院的研究人员开发了一个新框架,将图像生成简化为一个步骤。该团队通过展示新框架快速创建高质量视觉内容的能力,增强了现有模型(如稳定扩散)。
The rise of Grok-1 – a new game-changing LLM
埃隆·马斯克 (Elon Musk) 的 xAI Corp 推出了 Grok-1,这是一款配备 3140 亿个参数和混合专家架构的新 LLM。Grok-1 在 Apache 2.0 许可下作为开源发布,旨在催化人工智能研究的进步。
Stable Diffusion 3 – next-gen AI image generator
OpenAI 的最新作品 Sora 制作了引人入胜的视频,提供了无与伦比的视觉构图真实感。该模型利用语言理解和视频生成的融合,可以解释文本提示、适应各种输入方式并模拟动态相机运动。
SORA: Redefining text-to-video generation with advanced AI capabilities
OpenAI 的最新创作 Sora 制作了引人入胜的视频,提供了无与伦比的视觉构图真实感。利用语言理解和视频生成的融合,该模型可以解释文本提示,适应各种输入模式,并模拟动态相机运动。
Google introduces Gemma – a new open-source model
Gemma 汲取了前身 Gemini 的灵感,专注于开放性和可访问性,提供适用于各种设备和框架的多功能模型。该模型标志着人工智能民主化的重要一步,同时强调了人工智能负责任的发展和透明度。