残差关键词检索结果

M2R2:有效变压器推理的多率残差的混合物

M2R2: Mixture of Multi-Rate Residuals for Efficient Transformer Inference

残差转换增强了大语言模型(LLMS)的代表性深度和表达能力。但是,在自动回归产生中应用所有代币的静态残差转换会导致推理效率和产生忠诚度之间的次优折衷。现有方法,包括早期退出,跳过解码和深入的混合物,通过根据令牌级的复杂性调节剩余转换来解决此问题。尽管如此,这些方法主要考虑由代币通过模型层所穿越的距离,忽略了…

《复杂与智能系统》,第 11 卷,第 1 期,2025 年 1 月

Complex & Intelligent Systems, Volume 11, Issue 1, January 2025

1)IMTLM-Net:基于定位机制网络的改进型多任务转换器,用于手写英文文本识别作者:张乾锋、刘峰、宋婉如2)基于混合数据类型的系统可靠性建模因果发现与故障诊断作者:王小康、蒋思琪、王墨竹3)一种用于负荷预测的二次支持向量回归方法作者:贾彦河、周帅光、高哲明4)释放拼音的力量:利用多重嵌入和注意力机制促进中文命名实体识别作者:赵吉贵、钱玉荣、小开提艾孜买提5)CSTrans:用于无监督域自适应的跨子域转换器作者:刘俊驰、张翔、罗志刚6)煤矿设备系统的交互关系推理方法作者:曹宪刚、高嘉俊、程博阳7)一种用于高光谱异常的新型图卷积和频域滤波方法检测作者:杨丁、闫浩、阿如涵8)一种考虑残差恢复的新

IEEE 人工智能学报,第 6 卷,第 1 期,2025 年 1 月

IEEE Transactions on Artificial Intelligence, Volume 6, Issue 1, January 2025

1) 基于行业的配对交易策略与新颖的配对选择技术作者:Pranjala G. Kolapwar、Uday V. Kulkarni、Jaishri M. Waghmare页数:3 - 132) 虚假新闻云中的一线希望:大型语言模型能否帮助检测错误信息?作者:Raghvendra Kumar、Bhargav Goddu、Sriparna Saha、Adam Jatowt页数:14 - 243) 强化学习的混合环境中的多智能体协作导航与关系图学习作者:Wen Ou、Biao Luo、Xiaodong Xu、Yu Feng、Yuqian Zhao页数:25 - 364) 使用深度循环的工业物联网流​​

检测社交媒体量时间序列中的异常

Detecting Anomalies in Social Media Volume Time Series

我如何检测社交媒体量中的异常:基于残差的方法照片由 Joshua Hoehne 在 Unsplash 上拍摄在社交媒体时代,分析对话量对于了解用户行为、检测趋势以及最重要的是识别异常至关重要。了解异常发生的时间可以帮助管理层和营销部门应对危机情况。在本文中,我们将使用来自 Twitter 的真实示例,探索一种基于残差的方法来检测社交媒体量时间序列数据中的异常。对于这样的任务,我将使用 Numenta Anomaly Benchmark 的数据,它提供了 Twitter 帖子的成交量数据,其基准测试中有 5 分钟的帧窗口。我们将从两个角度分析数据:作为第一个练习,我们将使用完整数据集检测异常,然

复杂与智能系统,第 10 卷,第 5 期,2024 年 10 月

Complex & Intelligent Systems, Volume 10, Issue 5, October 2024

1) 语音-视频双模态信号驱动的 3D 面部动画作者:纪学杰、廖舟舟……毛猛页数:5951 - 59642) 一种改进的果蝇优化算法与 Q 学习相结合,用于解决分布式置换流水线调度问题作者:赵才、吴良宏……张洪强页数:5965 - 59883) 足球 1 对 1 射门情况下的最佳决策战略框架:机器学习、基于理论的建模和博弈论的综合方法作者:杨凯文、藤井圭介页数:5989 - 60084) 针对混合整数变量的昂贵约束优化问题的种群状态驱动代理辅助差分进化算法作者:刘建胜、袁斌……邱浩波页数:6009 - 60305) 一种智能 MRI 辅助诊断和治疗系统基于超分辨率的骨肉瘤识别作者:许忠,方方苟

不断发展的系统。第 15 卷,第 5 期,2024 年 10 月

Evolving Systems. Volume 15, Issue 5, October 2024

1) 边界感知残差网络在带钢产品缺陷检测中的应用作者:胡成才,马睿……龚金南页数:1649 - 16632) 基于 YOLOX 的自然环境下茶芽检测改进模型作者:李秀桐,刘瑞欣……谢本良页数:1665 - 16793) 多目标环境下基于偏好的多智能体强化学习经验共享方案作者:左宣,张璞……刘准嘎页数:1681 - 16994) 利用阿基米德优化算法赋能非洲秃鹫优化器,实现全局优化和特征选择的最高效率作者:Reham R. Mostafa,Fatma A. Hashim……Ahmed M. Khedr页数:1701 - 17315) 一种新的特征可进化学习方法流作者:Yanfei Chen、Sa

软计算,第 28 卷,第 13-14 期,2024 年 7 月

Soft Computing, Volume 28, Issue 13-14, July 2024

1) 使用广义梯形模糊数的完整排序进行多准则决策:修改后的结果作者:Raina Ahuja、Amit Kumar、S. S. Appadoo页数:7589 - 76002) 分数不确定微分方程的参数估计作者:Cheng Luo、Guo–Cheng Wu、Ting Jin页数:7601 - 76163) CL 代数上的拓扑作者:H. Khajeh Nasir、M. Aaly Kologani、R. A. Borzooei页数:7617 - 76254) 基于 Siamese capsule gorilla soldiers network 的汽车评论多模态情绪分析作者:Sri Raman Kot

基于变换的层可提高 CNN 效率和准确性,并应用于计算机视觉

Transform-Based Layers Boost CNN Efficiency and Accuracy, Applications for Computer Vision

开创性的研究引入了基于变换的层作为一种新方法来提高卷积神经网络 (CNN),特别是残差网络 (ResNets) 在计算机视觉领域的效率和准确性,可能会彻底改变...

复杂和智能系统,第 10 卷,第 3 期,2024 年 6 月

Complex and Intelligent Systems, Volume 10, Issue 3, June 2024

1) 基于深度强化学习的小天体飞越自主成像调度网络作者:Hang Hu, Weiren Wu...Jihe Wang页数:3181 - 31952) 基于通信的恶意无人机群网络中关键无人机识别作者:Min Teng, Chao Gao...Xuelong Li页数:3197 - 32113) 通过特征细化、抑制和对齐提高对抗鲁棒性作者:Yulun Wu, Yanming Guo...Liang Bai页数:3213 - 32334) 基于知识转移的多目标方法用于查找多路径循环中的错误作者:Stuart D. Semujju, Fangqing Liu...Zhifeng Hao页数:3235

视觉变换器是否像卷积神经网络一样看?

Do Vision Transformers See Like Convolutional Neural Networks?

到目前为止,卷积神经网络 (CNN) 一直是视觉数据的实际模型。最近的研究表明,(Vision) Transformer 模型 (ViT) 可以在图像分类任务上实现相当甚至更优异的性能。这提出了一个核心问题:Vision Transformer 如何解决这些任务?它们是像卷积网络一样工作,还是学习完全不同的视觉表示?通过分析 ViT 和 CNN 在图像分类基准上的内部表示结构,我们发现这两种架构之间存在显着差异,例如 ViT 在所有层上都有更统一的表示。我们探索了这些差异是如何产生的,发现了自我注意力所起的关键作用,它可以实现全局信息的早期聚合,以及 ViT 残差连接,它可以将特征从较低层强烈

报告计数数据模型的 R 平方度量

Reporting an R-Squared Measure for Count Data Models

这篇文章的灵感来自于我前段时间收到的一封电子邮件,该邮件来自一位博客读者。我认为,更“广泛”的回应可能会引起其他读者的兴趣......尽管存在许多局限性,但在报告最小二乘回归结果时,包括判定系数 (R2) 或其“调整后”的值是标准做法。就我个人而言,我认为 R2 是我们结果中包含的最不重要的统计数据之一,但我们都这样做。(请参阅上一篇文章。)如果所讨论的回归模型是线性的(在参数中)并且包含截距,并且如果参数由普通最小二乘法 (OLS) 估计,则 R2 具有许多众所周知的属性。这些包括:0 ≤ R2 ≤ 1。如果我们向模型中添加回归量,R2 的值不会减小。无论我们将这个度量定义为“解释平方和”与

七月阅读

July Reading

本月我的阅读清单与往常略有不同。我回顾了《计量经济学》和《计量经济学杂志》的往期期刊,并挑选了一些恰好发表在这些期刊 7 月期刊上的重要且有趣的论文。以下是我为您推荐的:Aigner, D.、C. A. K. Lovell 和 P. Schmidt,1977 年。《随机前沿生产函数模型的公式和估计》。《计量经济学杂志》,6,21-37。Chow, G. C.,1960 年。《两个线性回归系数集之间的相等性检验》。《计量经济学》,28,591-605。Davidson, R. 和 J. G. MacKinnon,1984 年。《logit 和 probit 模型的便捷规范检验》。计量经济学杂志,