From TF-IDF to Transformers: Implementing Four Generations of Semantic Search
语义搜索如何从简单的关键字匹配演变为现代基于转换器的语言理解?这篇实践文章使用 Python 逐步构建了四代语义搜索系统。从 TF-IDF 到 Transformers:实现四代语义搜索的帖子首先出现在 Towards Data Science 上。
Using Transformers to Forecast Incredibly Rare Solar Flares
机器学习如何针对罕见事件做出改变使用 Transformers 来预测极其罕见的太阳耀斑一文首先出现在 Towards Data Science 上。
Stochastic KV Routing: Enabling Adaptive Depth-Wise Cache Sharing
为高吞吐量的 Transformer 语言模型提供服务需要缓存键值 (KV),以避免自回归生成过程中的冗余计算。 KV 缓存的内存占用量很大,并且严重影响服务成本。这项工作旨在减少这些内存需求。虽然最近的工作主要通过沿时间轴的压缩和驱逐来减少 KV 缓存,但我们认为深度维度提供了一种正交且稳健的优化途径。尽管之前的研究表明每个层的完整缓存是多余的,但实现......
Timer-XL: A Long-Context Foundation Model for Time-Series Forecasting
探索仅解码器 Transformer 基础模型的内部工作原理后置 Timer-XL:用于时间序列预测的长上下文基础模型首先出现在 Towards Data Science 上。
IEEE Transactions on Neural Networks and Learning Systems, Volume 37, Issue 5, May 2026
1) Deep Model Fusion: A Survey 作者:W. Li, Y. Peng, M. Zhang, L. Ding, H. Hu, L. ShenPages: 2008 - 20242) Survey on Efficient Large Language Model:principles, Algorithms, Applications, and Open Issues作者:J. Cheng, H. Kang, Y. Shao, N. Li, P. Chen, R. Wang, S. Long, X. Yang, L. 页数: 2025 - 20453) 基于骨架的动作
IEEE Transactions on Artificial Intelligence, Volume 7, Issue 5, May 2026
1) 医学影像基础模型:综合综述作者:L. Jiao,J. Yang,R. Li,F. Liu,X. Liu,P. Chen,Y.Guo,L. Li,R. Shang,W. MaPages:2426 - 24462) A Systematic Japanese Review on SWOT Analysis of Prompt Engineering Techniques作者:A. Singh,N. K. Chatta,A. Ehtesham, S. Kumar, G. K. Gupta, T. T. Khoei 页数:2447 - 24613) 基因组数据分析的量子机器学习建模作者:N. S