Qudata领域信息情报检索

收集有关机器学习和人工智能开发服务的最新新闻,数据更新和研究结果。Qudata是一家于2018年从游戏开发公司崛起,并转型专注于解决复杂的机器学习和人工智能挑战的初创公司。

“智能”手杖可以帮助视障人士更轻松地完成日常任务

"Smart" walking stick can help visually impaired perform daily tasks more easily

利用人工智能的进步,科罗拉多大学博尔德分校的工程师正在研究一种新型的盲人或视障人士手杖。

神经编解码器语言模型 - VALL-E 可以从三秒的录音中重现声音

A neural codec language model - VALL-E can reproduce a voice from a three-second audio recording

文本转语音模型通常需要更长的训练样本,而 VALL-E 只需几秒钟就能创造出听起来更自然的合成语音。

喷涂式智能皮肤使用 AI 快速解释手部任务

Spray-on smart skin uses AI to swiftly interpret hand tasks

斯坦福大学的研究人员开发了一种新型可拉伸生物相容性材料,喷洒在手背上可以识别手背的动作。

OpenAI 宣布推出 Point-E — 一种用于生成 3D 对象的系统

OpenAI announces Point-E — a system for generating 3D objects

Point·E 是一种新的文本条件 3D 点云合成系统,它首先生成合成视图,然后生成以这些视图为条件的彩色点云。

使用基于深度学习的物体检测提高自动驾驶汽车的安全性

Improving Self-Driving Vehicle Safety with Deep Learning-Based Object Detection

自动驾驶汽车一直被认为是下一代交通方式。为了实现此类车辆的自主导航,需要实施多种不同的技术。

使用 AI 检测核威胁

Detection of nuclear threats with AI

太平洋西北国家实验室的新研究使用机器学习、数据分析和人工智能来识别潜在的核威胁。

AI 对零售客户服务的实际意义

The practical significance of AI for customer services in retail

研究人员发现了零售商将 AI 与店内摄像头结合使用的新方法,以更好地了解消费者行为并调整商店布局以最大化销售额。

Meta 开发了一种可以将大脑活动转化为语音的 AI 模型

Meta has developed an AI model that can convert brain activity into speech

根据大脑活动解码语音一直是神经科学家和临床医生长期以来的目标。 如今,Meta 正在研究一种人工智能模型,该模型可以从非侵入性大脑活动记录中解码语音,以帮助脑外伤患者。

看说话的好处

Benefits of the Look to Speak

Look to Speak 旨在帮助那些运动功能障碍和言语障碍患者更轻松地交流。 该应用程序允许人们用眼睛选择预先写好的短语并大声朗读出来。

声音如何模拟世界

How sound can model the world

麻省理工学院的研究人员开发了一种机器学习技术,可以精确收集和模拟某个位置的底层声学,只需有限数量的声音记录即可。

微软发布开源工具包,打造“未来农场”

Microsoft releases an open-source toolkit to build the «farm of the future»

到 2050 年,人类必须将全球粮食供应量增加近一倍,以确保地球上的每个居民都有足够的食物。随着气候变化速度的加快,水资源减少,可耕地面积减少,可持续地做到这一点对我们来说将是一个巨大的挑战。

新型 AI 模型为虚拟游戏世界创建 3D 对象和角色

New AI Model Creates 3D Objects and Characters for Virtual Game Worlds

在过去十年中,游戏行业面临的最大问题之一是 AAA 视频游戏制作成本的爆炸式增长。工作室一直在寻找可以帮助降低游戏开发成本的技术。神经图像生成模型的最新进展带来了一些希望,实现这个梦想可能并不遥远。

哲学家与变形金刚:神经网络模仿著名认知科学家

Philosophers vs Transformers: Neural net impersonates a famous cognitive scientist

计算机能思考吗?AI 模型能有意识吗?这些和类似的问题经常出现在有关自然语言模型 GPT-3、LAMDA 和其他 transformer 取得的最新 AI 进展的讨论中。尽管如此,它们仍然存在争议,处于悖论的边缘,因为关于大脑如何工作以及思考意味着什么通常存在许多隐藏的假设和误解。没有其他办法,只能明确揭示这些假设,然后探索如何让机器复制人类的信息处理。

使用神经网络修复旧照片

Old photo restoration using neural networks

现在,有了可以提高照片质量的滤镜,您就不会再感到惊讶了。 但旧肖像的修复仍有很多不足之处。旧照片往往过于模糊,因此普通的图像锐化方法对它们不起作用。

语言不再落后

No Language Left Behind

Facebook 发布了 NLLB 项目(No Language Left Behind)。 这项开发的主要特点是覆盖了两百多种语言,包括非洲和澳大利亚人民的稀有语言。 此外,Facebook 还对机器学习模型应用了一种新方法,其中翻译直接从一种语言到另一种语言进行,而无需中间翻译成英语。

虚拟形象的逼真服装动画

Photorealistic clothing animation for avatars

一群科学家利用机器学习“重新发现”了万有引力定律。动画化身早已成为我们生活的一部分。但闭合动画的逼真建模仍然是一个悬而未决的挑战。一方面,现代物理建模技术可以以交互速度生成逼真的服装几何图形。另一方面,建模逼真的外观通常需要物理渲染,这对于交互式应用程序来说太昂贵了。

利用机器学习重新发现天体力学

Rediscovering celestial mechanics with machine learning

一组科学家利用机器学习“重新发现”了万有引力定律。为此,他们训练了一个“图神经网络”,以根据 30 年的观测结果模拟太阳、行星和太阳系大卫星的动态。然后,他们使用符号回归发现神经网络隐式学习的力定律的解析表达式。

乌克兰使用 Clearview AI 识别死去的俄罗斯士兵和被杀公民

Ukraine uses Clearview AI to identify dead russian soldiers and killed citizens

乌克兰开始使用 Clearview AI 面部识别软件来识别在冲突中丧生的俄罗斯士兵和乌克兰人。该公司首席执行官 Hoan Ton-That 告诉路透社,乌克兰国防部于今年 3 月开始使用该软件。