Qudata领域信息情报检索

收集有关机器学习和人工智能开发服务的最新新闻,数据更新和研究结果。Qudata是一家于2018年从游戏开发公司崛起,并转型专注于解决复杂的机器学习和人工智能挑战的初创公司。

超级疲倦的AI:像人类思维一样学习

Super-Turing AI: Learning like the human mind

模仿大脑学习过程的新的高级神经系统有望创造更快,更高效和节能的AI。通过利用Hebbian学习和依赖于峰值的可塑性,这一创新可以提高AI的性能,同时大大降低环境和经济成本。

AI工具在X射线分析中提高了透明度

AI tool enhances transparency in X-ray analysis

ITPCTRL-AI通过模仿放射科医生的凝视模式来改善X射线诊断,提供可解释的热图,从而提高对AI驱动的医学成像的透明度和信任。通过滤除无关紧要的数据并专注于关键诊断区域,该系统可确保更准确和可解释的结果。

GPT-4.5 - AI功能的飞跃

GPT-4.5 – a leap forward in AI capabilities

gpt-4.5是Openai最先进的AI,具有改进的自然语言理解,增强的情绪智力和更直观的对话。它以书面形式,集思广益和解决问题的方式出色,同时最大程度地减少AI幻觉,以获得更可靠的结果。

飞行盲人:如何在Total Darkness中导航无人机

Flying blind: How to navigate drones in total darkness

麻省理工学院的研究人员已经开发了Mifly,这是一种基于RF的低功耗系统,使无人机能够在完全黑暗,室内和低可见性条件下自定位。通过使用单个反向散射标签和双极化雷达,Mifly在不依赖视觉提示或外部基础架构的情况下导航。

Nvidia Cosmos - AI Robotics背后的秘密武器

NVIDIA Cosmos – the secret weapon behind AI robotics

nvidia cosmos通过产生逼真的3D环境来增强AI机器人技术,从而使开发人员能够在不依赖昂贵的真实世界数据的情况下训练自主系统。借助高级世界基础模型,Cosmos推动了机器人技术,自动驾驶汽车和工业自动化的创新。

视频发电的最大开源AI

The largest open-source AI model for video generation

Hunyuanvideo是视频生成的最大开源AI模型,拥有130亿个参数,以产生具有栩栩如生的运动和完美同步音频的高质量的电影视频。为AI驱动的内容创建设置新的基准,它提供了无与伦比的现实主义,精度和创造性的可能性。

SUPER 无人机双轨迹策略的妙处

The genius of SUPER drone’s two-trajectory strategy

双轨迹规划系统让 MAV 能够探索未知路径,同时始终保持安全的备用路线。借助基于 LiDAR 的感知和 CIRI 算法,无人机可以动态生成实时飞行路径,以便在不可预测的环境中实现高速导航。

从文本到 3D:NVIDIA 的 Edify 3D 背后的魔力

From text to 3D: the magic behind Edify 3D by NVIDIA

NVIDIA 的 Edify 3D 使用 AI 在 2 分钟内创建高质量的 3D 模型。通过结合多视图扩散模型和 Transformers,它可以从文本或图像快速、准确且可扩展地生成 3D,使其成为游戏、动画和设计行业的完美解决方案。

微软推出完全开放权重的Phi-4型号

Microsoft launched the Phi-4 model with fully open weights

微软在 MIT 许可下推出了具有开放权重的 Phi-4 模型,为研究人员和开发人员提供了前所未有的灵活性。凭借 140 亿个参数,Phi-4 在解决数学问题和多任务处理方面的表现优于同类产品,确保以有限的资源高效工作。

RadiologyLlama-70B:放射学报告的新语言模型

RadiologyLlama-70B: A new language model for radiology reports

RadiologyLlama-70B 是一种先进的 AI 模型,经过超过 650 万份医疗报告的训练,可增强对放射学发现的分析。该模型可以显著改善放射科医生的工作流程,在降低计算成本的同时提供卓越的准确性。

阿里巴巴 vs. OpenAI:新模型能否胜过 ChatGPT?

Alibaba vs. OpenAI: Can a new model outperform ChatGPT?

阿里巴巴的新 AI 模型 QwQ-32B-Preview 以其出色的数学和逻辑技能向 ChatGPT 发起挑战,在关键基准测试中超越竞争对手。该模型在开放许可下发布,具有高级推理能力,但在需要强大常识理解的任务中仍然举步维艰。

Anthropic 简化了 AI 对数据源的访问

Anthropic simplifies AI access to data sources

Anthropic 推出了模型上下文协议 - 一个简化 AI 与数据源和外部工具集成的开源框架。通过提供通用标准,MCP 增强了 AI 功能并消除了对定制解决方案的需求。

AI可以像人类一样控制计算机

AI can control computer just like a human

Anthropic 推出了 Claude 3.5 Sonnet,这是一种能够像人类一样控制计算机的新型 AI 模型。该模型使用桌面屏幕截图来导航应用程序并执行单击、键入和收集信息等任务。

Stable Diffusion 3.5 为数字艺术打开了新大门

Stable Diffusion 3.5 opens new doors in digital art

Stability AI 最新发布的 Stable Diffusion 3.5 引入了三种强大的模型变体,可为消费硬件提供增强的图像质量、速度和可访问性。这些模型可免费用于非商业用途,并集成了先进的安全功能以防止滥用。

有争议的科学:人工智能和诺贝尔奖

Controversial science: AI and Nobel Prizes

2024 年诺贝尔物理学奖和化学奖开创了承认人工智能对科学贡献的先例。虽然有些人可能质疑人工智能与传统学科之间的契合度,但另一些人认为这是承认现代研究跨学科性质的必要一步。

Movie Gen——AI 视频生成的未来

Movie Gen – the future of AI video generation

Meta 推出了 Movie Gen,这是一款人工智能工具,可通过简单的文本提示创建具有同步声音的高清视频。该模型提供高级视频创建和编辑功能,让用户能够更好地控制内容生成。

Google 发布针对 Gemini 机型的重大更新

Google releases major updates for Gemini models

通过降价、提高速率限制和加快输出速度,Google 推出的全新 Gemini 模型让全球开发者能够更轻松地使用高级 AI。它们可提高速度、降低成本,并增强各种文本、代码和多模式任务的性能。

自主着陆创新——无人机的新时代

Autonomous landing innovation – a new era for drones

印度专利局已授予微型无人机创新着陆系统的专利。该技术可在具有挑战性的地形上实现精确着陆,并有可能应用于军事和民用物流,包括高空交付和紧急情况。