unsplash关键词检索结果

物理学强化学习:ODE 和超参数调整

Reinforcement Learning for Physics: ODEs and Hyperparameter Tuning

使用 gymnasium 控制微分方程并优化算法超参数照片由 Brice Cooper 在 Unsplash 上拍摄如前所述,强化学习 (RL) 提供了一种强大的新工具来应对控制非线性物理系统的挑战。非线性物理系统的特点是行为复杂,输入的微小变化可能导致输出的剧烈变化,或者只有微小的输出变化可能来自大输入。解决方案可以分裂,相同条件可以产生不同的输出,甚至以路径依赖的形式具有“记忆”。我们介绍了两种将 RL 应用于非线性物理系统的不同方法:传统的基于神经网络的软演员评论家 (SAC) 和不常见的基于遗传算法的遗传编程 (GP) 方法。简而言之,SAC 使用两个神经网络,一个用于学习环境的行为方

批判性审视 AI 图像生成

A Critical Look at AI Image Generation

图像生成 AI 究竟能告诉我们关于这个世界的什么信息?照片由 Math 在 Unsplash 上拍摄我最近有机会对一个有趣的项目进行分析,而我要说的太多了,无法在一篇文章中全部涵盖,所以今天我将讨论我对它的更多想法。研究人员在这个项目中采用的方法是向不同的生成 AI 图像生成工具提供一系列提示:Stable Diffusion、Midjourney、YandexART 和 ERNIE-ViLG(由百度提供)。这些提示特别针对不同的世代——婴儿潮一代、X 世代、千禧一代和 Z 世代,并要求在不同背景下拍摄这些群体的图像,例如“与家人在一起”、“度假”或“在工作”。虽然结果非常有趣,也许揭示了一些

探索 DRESS Kit V2

Exploring DRESS Kit V2

探索最新版本 DRESS Kit 中的新功能和显著变化照片来自 Google DeepMind 在 Unsplash 上概述自最初的 DRESS Kit 于 2021 年首次发布以来,它已成功应用于少数生物医学研究项目。如果您从未听说过 DRESS Kit,那么您可能有兴趣知道它是一个完全开源、无依赖、纯 ES6 JavaScript 库,专门用于执行高级统计分析和机器学习任务。DRESS Kit 旨在为那些不是经过培训的生物统计学家且无法使用专用统计软件的生物医学研究人员提供服务。DRESS Kit 不仅被证明是一种实用有效的工具,可用于分析复杂数据集和构建机器学习模型,而且这些现实世界的经

营销组合模型 (MMM):如何避免有偏差的渠道估计

Marketing Mix Modeling (MMM): How to Avoid Biased Channel Estimates

了解在模型中应该考虑和不应该考虑哪些变量照片由 Fredrick Suwandi 在 Unsplash 上拍摄“在每个营销渠道上投资 X 美元将如何影响销售?”这是营销组合模型应该回答的因果问题,以指导公司决定未来如何分配其营销渠道预算。正如我们将看到的,这个问题的结果高度依赖于你考虑的变量:忽略重要变量或在模型中包含“错误”变量将引入偏差并导致错误的因果估计。这是一个巨大的问题,因为错误的因果估计最终会导致糟糕的营销决策和财务损失。在本文中,我想解决这个问题,并指导如何确定哪些变量应该和不应该在 MMM 中考虑,结构如下:在第 1 章中,我们将通过查看渠道估计值会根据您在模拟示例中考虑的变量

为您的数据带来结构

Bringing Structure to Your Data

使用路径模型测试假设在复杂的路径模型中,找到自己的路可能变得困难。照片由 Deva Darshan 在 Unsplash 上拍摄数据科学家经常收集大量变量并寻找它们之间的关系。在此过程中,对变量之间究竟如何相互关联做出假设和假设会很有帮助。学生为下一次考试学习的动力会影响他们的成绩吗?或者好成绩会激发学习的动力吗?激励人们表现出的行为模式究竟是什么,最终会带来好成绩?为了给上述问题提供一些结构,并提供一个工具来实证测试它们,我想在本文中解释路径模型,也称为结构方程模型 (SEM)。虽然在心理学等社会科学中路径模型很常用,但我觉得它们在数据科学和计算机科学等其他领域并不那么突出。因此,我想概述路

如何通过 AI 取得成功:结合 Kafka 和 AI 护栏

How to succeed with AI: Combining Kafka and AI Guardrails

为什么实时数据和治理对于 AI 来说是不可协商的Photo by Sid Verma on UnsplashKafka 很棒。AI 很棒。当我们将两者结合起来会发生什么?连续性。—AI 正在改变我们的效率和运营方式的许多方面:卓越的翻译、客户互动、代码生成器、驾驶汽车等。即使我们喜欢尖端的东西,我们也很难跟上它。我们往往会忘记一个巨大的问题:如果没有正确的护栏,AI 很容易脱轨。一旦发生,这不仅仅是一个技术故障,还可能给企业带来灾难性的后果。从我作为 CTO 的经验来看,我亲眼看到真正的 AI 成功不仅仅来自速度。它来自控制——控制你的 AI 消耗的数据、它的运行方式,并确保它不会提供错误的输

您的文档试图告诉您什么是相关的:使用链接更好地进行 RAG

Your Documents Are Trying to Tell You What’s Relevant: Better RAG Using Links

文档数据集已经具有结构。充分利用它。照片由 Jayne Harris 在 Unsplash 上拍摄构建检索增强生成 (RAG) 应用程序面临多层挑战。文档检索是 RAG 工作流程的重要组成部分,它本身就是一组复杂的步骤,可以根据用例以不同的方式处理。RAG 系统很难找到与细微输入提示相关的最佳文档集,尤其是在完全依赖向量搜索来找到最佳候选者时。然而,我们的文档本身通常会告诉我们应该在哪里寻找有关给定主题的更多信息——通过引文、交叉引用、脚注、超链接等。在本文中,我们将展示一种新的数据模型——链接文档——如何通过使我们能够解析和保留这些对其他文本的直接引用来解锁性能改进,使它们可供同时检索——无

动手模仿学习:从行为克隆到多模态模仿学习

Hands-On Imitation Learning: From Behavior Cloning to Multi-Modal Imitation Learning

最突出的模仿学习方法概述,并在网格环境中进行测试照片由 Possessed Photography 在 Unsplash 上拍摄强化学习是机器学习的一个分支,它涉及通过标量信号(奖励)的引导进行学习;与监督学习相反,监督学习需要目标变量的完整标签。一个直观的例子来解释强化学习,可以用一所有两个班级的学校来解释,这两个班级有两种类型的测试。第一节课解决了测试并获得了完全正确的答案(监督学习:SL)。第二节课解决了测试并只获得了每个问题的成绩(强化学习:RL)。在第一种情况下,学生似乎更容易学习正确的答案并记住它们。在第二节课中,任务更难,因为他们只能通过反复试验来学习。然而,它们的学习更加稳健,

你能从太空看到战争吗?

Can You See the War from Space?

俄乌战争案例研究照片由 Dmytro Tolokonov 在 Unsplash 上拍摄自 2024 年 2 月 24 日俄罗斯入侵乌克兰领土以来,已经过去了近三年。这场血腥的战争摧毁或以某种方式影响了冲突双方数以万计的家庭。互联网上有大量证据揭示了这场战争给人类带来的苦难和痛苦,主要数据来源之一是航空和太空图像。许多私人和军用高分辨率空间传感器正在监视该地区,以近乎实时地获取有关部队调动、基础设施和环境的关键信息。不幸的是,像我们这样的普通用户通常无法获得这种数据,但每天都有大量其他卫星飞过乌克兰,所以我们可以尝试从免费访问的数据集中提取一些有意义的信息,看看那里发生了什么。在本文中,让我们试

企业数据质量“谁做什么”指南

The “Who Does What” Guide To Enterprise Data Quality

一个答案和许多最佳实践,说明大型组织如何为现代数据平台实施数据质量程序企业数据质量“谁做什么”的答案。图片由作者提供。我曾与全球最大公司的数十位企业数据专家交谈过,最常见的数据质量问题之一是“谁做什么?”紧接着是“为什么和怎么做?”这是有原因的。数据质量就像一场接力赛。每条腿的成功——检测、分类、解决和测量——都取决于另一条腿。每次传递接力棒时,失败的几率都会飙升。照片由 Zach Lucero 在 Unsplash 上拍摄实际问题值得实际答案。然而,每个组织围绕数据的组织方式略有不同。我见过拥有 15,000 名员工的组织将所有关键数据的所有权集中起来,而规模只有他们一半的组织则决定完全联合

使用 LLM 和 TF-IDF 自动进行视频分章

Automate Video Chaptering with LLMs and TF-IDF

将原始记录转换为结构良好的文档照片由 Jakob Owens 在 Unsplash 上拍摄视频章节划分是将视频分割成不同章节的任务。除了像 YouTube 章节那样用作导航辅助之外,它还是一系列下游应用的核心,从信息检索(例如 RAG 语义分块)到引用或摘要。在最近的一个项目中,我需要自动执行此任务,但对可用的选项有限感到惊讶,尤其是在开源领域。虽然一些专业工具或付费 API 提供了此类服务,但我找不到任何提供足够强大和准确解决方案的库或教程。如果您知道任何内容,请在评论中分享!如果您想知道为什么不简单地将记录复制并粘贴到大型语言模型 (LLM) 中并要求提供章节标题,那么由于两个原因,这样做

多重共线性是否会破坏营销组合建模中的因果推断?

Is Multi-Collinearity Destroying Your Causal Inferences In Marketing Mix Modelling?

因果 AI,探索因果推理与机器学习的整合照片由 NOAA 在 Unsplash 上拍摄本系列是关于什么的?欢迎来到我的因果 AI 系列,我们将探索因果推理与机器学习模型的整合。期望探索不同业务环境中的许多实际应用。在上一篇文章中,我们介绍了使用 CUPED 和双重机器学习为实验提供动力。今天,我们将重点转移到了解多重共线性如何损害您做出的因果推断,特别是在营销组合建模中。如果您错过了上一篇关于使用 CUPED 和双重机器学习为实验提供动力的文章,请在此处查看:使用 CUPED 和双重机器学习为实验提供动力简介在本文中,我们将探讨多重共线性的破坏性,并评估我们可以用来解决它的一些方法。将涵盖以下

家庭数据科学:使用蒙特卡洛和遗传算法解决保姆时间表难题

Data Science at Home: Solving the Nanny Schedule Puzzle with Monte Carlo and Genetic Algorithms

让混乱变得有序,同时简化我们寻找完美保姆的过程作为数据科学领导者,我习惯于拥有一支能够将混乱变为清晰的团队。但是,当混乱是你自己家庭的保姆时间表时,即使是最好的计划也会出错。一想到工作会议、午睡时间和不可预测的轮班,我们的思绪就会陷入混乱——直到我意识到我可以使用解决业务问题的相同算法来解决非常个人的问题。借助蒙特卡罗模拟、遗传算法和一些父母的聪明才智,我开始了一场驯服我们疯狂时间表的旅程,每次调整一个算法。结果如何?好吧,我们只能说我们保姆的新时间表看起来非常合适。照片由 Markus Spiske 在 Unsplash 上拍摄设置舞台:伟大的时间表难题我们的家庭时间表看起来就像瓷器店里的公

参议员佩曼的巴勒斯坦立场呼应了年轻澳大利亚人的声音并发出了变革的信号

Senator Payman’s Palestine Stand Echoes Young Australians' Voices and Signals Change

Isabella Gockel | 澳大利亚外交政策研究员 图片来源于 Nikolas Gannon via Unsplash。2024 年 6 月 25 日,西澳大利亚...

澳大利亚的“原住民外交政策方法”并没有改善我们在土著问题上的声誉

Australia’s “First Nations Approach to Foreign Policy” Does Not Improve Our Reputation on Indigenous Issues

Isabella Gockel | 澳大利亚外交政策研究员图片来源于 Stuart Munro 通过 Unsplash。2023 年 3 月 7 日,澳大利亚……

达顿的核未来对澳大利亚和太平洋意味着什么?

What Would Dutton’s Nuclear Future Mean for Australia and the Pacific?

Poppy Bell | 气候与环境研究员 图片来源于 Lukáš Lehotský via Unsplash。随着下一次联邦选举临近,...

谷歌的新生成式 AI 购物功能说明

Google’s New Generative AI Shopping Features Explained

来源:Unsplash 2024 年 8 月,谷歌推出了两项人工智能功能,让客户更容易在线查​​找和比较产品。其中一项是桌面版的 Google Lens 功能,而另一项允许比较标签上打开的产品。查找...阅读更多»帖子谷歌的新生成式 AI 购物功能说明首先出现在大数据分析新闻上。

朝鲜的女性领导:进步还是宣传?

Female Leadership in North Korea: Progress or Propaganda?

Mila Olsen | 图片来源于 Thomas Evans via Unsplash。目前,朝鲜任何进步政策的迹象都是...