NumExpr: The “Faster than Numpy” Library Most Data Scientists Have Never Used
与Numpythe Post Numexpr的比较性能测试:“比Numpy更快”库,大多数数据科学家从未使用过首先使用的数据科学。
Debug and Profile NumPy Code to Identify Performance Bottlenecks
通过确定代码中的问题来查看如何改善Numpy执行过程。
Visualizing Data Directly from Numpy Arrays
正在寻找 DIY 示例以获取在 Python 中高效可视化数据的基础?那么本教程适合您。
NumPy for Simulating Random Processes and Monte Carlo Methods
了解如何使用 NumPy 进行稳健的计算模拟。
How to Make Proximity Maps with Python
快速成功数据科学Geopy 的大圆方法密西西比州立大学的距离地图(作者)您是否注意到社交媒体上的一些“距离”地图?我刚刚看到 Todd Jones 的一张地图,它显示了您在美国本土 48 个州的任何位置与国家公园的距离。这些邻近地图既有趣又有用。如果您是生存主义者,您可能希望尽可能远离潜在的核导弹目标;如果您是狂热的垂钓者,您可能希望靠近 Bass Pro Shop。我和一个对美国大学橄榄球几乎一无所知的英国人一起读研究生。尽管如此,他在我们每周的投注中表现非常出色。他的秘诀之一是,假设参赛球队实力相当,或者主队更受青睐,那么他就押注任何需要行驶 300 多英里才能比赛的球队。在这个 Quic
The Essential Guide to Effectively Summarizing Massive Documents, Part 1
文档摘要对于 GenAI 用例很重要,但如果文档太大怎么办!?继续阅读以了解我是如何解决这个问题的。“总结大量文本”——使用 GPT-4o 生成的图像文档摘要如今已成为使用现代生成式人工智能 (GenAI) 技术解决的最常见问题陈述之一(如果不是最常见问题)。检索增强生成 (RAG) 是一种用于解决该问题的常见但有效的解决方案架构。但是,如果文档本身太大以至于无法在单个 API 请求中作为一个整体发送怎么办?或者,如果它产生太多块而导致臭名昭著的“迷失在中间”上下文问题怎么办?在本文中,我将讨论我们在处理此类问题陈述时面临的挑战,并逐步介绍我使用 Greg Kamradt 在其 GitHub
Introducing NumPy, Part 1: Understanding Arrays
创建、描述和访问属性继续阅读 Towards Data Science »
Step-by-Step Guide to Creating Simulated Data in Python
一个适合初学者的教程,教你如何生成自己的数据进行分析和测试照片由 Alexandru-Bogdan Ghita 在 Unsplash 上拍摄想象一下,你刚刚编写了一个机器学习模型,需要在特定场景中对其进行测试,或者你正在发布一篇关于自定义数据科学解决方案的学术论文,但可用的数据集有版权限制。另一方面,你可能正处于机器学习项目的调试和故障排除阶段,需要数据来识别和解决问题。所有这些情况,以及更多情况,都可以从使用模拟数据中受益。通常,现实世界的数据并不容易获得、昂贵或私密。因此,创建合成数据对数据科学从业者和专业人士来说是一项有用的技能。在本文中,我介绍了一些使用 Python 从头开始创建
Building Your First Deep Learning Model: A Step-by-Step Guide
深度学习简介深度学习是机器学习的一个子集,而机器学习本身又是人工智能 (AI) 的一个子集。深度学习模型的灵感来自人脑的结构和功能,由多层人工神经元组成。这些模型能够通过称为训练的过程学习数据中的复杂模式,在此过程中,模型会进行迭代调整以最大限度地减少其预测中的错误。在这篇博文中,我们将介绍使用 MNIST 数据集构建一个简单的人工神经网络 (ANN) 来对手写数字进行分类的过程。了解 MNIST 数据集MNIST 数据集(修改后的国家标准与技术研究所数据集)是机器学习和计算机视觉领域最著名的数据集之一。它由 70,000 张从 0 到 9 的手写数字灰度图像组成,每张图像的大小为 28x28
#224 – Travis Oliphant: NumPy, SciPy, Anaconda, Python & Scientific Programming
Travis Oliphant 是一名数据科学家、企业家以及 NumPy、SciPy 和 Anaconda 的创造者。请查看我们的赞助商来支持此播客:- Novo:https://banknovo.com/lex- Allform:https://allform.com/lex 可享受 20% 的折扣- Onnit:https://lexfridman.com/onnit 可享受高达 10% 的折扣- Athletic Greens:https://athleticgreens.com/lex 并使用代码 LEX 可获得 1 个月的鱼油- Blinkist:https://blinkist.c
NumPy-style broadcasting for R TensorFlow users
广播,就像 Python 的科学计算库 NumPy 所做的那样,涉及动态扩展形状,以便可以将不同大小的数组传递给需要一致性的操作 - 例如逐元素添加或乘法。在 NumPy 中,广播的工作方式是精确指定的;同样的规则适用于 TensorFlow 操作。对于偶尔查阅 Python 代码的任何人,这篇文章都力求解释清楚。