M2R2: Mixture of Multi-Rate Residuals for Efficient Transformer Inference
残差转换增强了大语言模型(LLMS)的代表性深度和表达能力。但是,在自动回归产生中应用所有代币的静态残差转换会导致推理效率和产生忠诚度之间的次优折衷。现有方法,包括早期退出,跳过解码和深入的混合物,通过根据令牌级的复杂性调节剩余转换来解决此问题。尽管如此,这些方法主要考虑由代币通过模型层所穿越的距离,忽略了…
Complex & Intelligent Systems, Volume 11, Issue 1, January 2025
1)IMTLM-Net:基于定位机制网络的改进型多任务转换器,用于手写英文文本识别作者:张乾锋、刘峰、宋婉如2)基于混合数据类型的系统可靠性建模因果发现与故障诊断作者:王小康、蒋思琪、王墨竹3)一种用于负荷预测的二次支持向量回归方法作者:贾彦河、周帅光、高哲明4)释放拼音的力量:利用多重嵌入和注意力机制促进中文命名实体识别作者:赵吉贵、钱玉荣、小开提艾孜买提5)CSTrans:用于无监督域自适应的跨子域转换器作者:刘俊驰、张翔、罗志刚6)煤矿设备系统的交互关系推理方法作者:曹宪刚、高嘉俊、程博阳7)一种用于高光谱异常的新型图卷积和频域滤波方法检测作者:杨丁、闫浩、阿如涵8)一种考虑残差恢复的新
IEEE Transactions on Artificial Intelligence, Volume 6, Issue 1, January 2025
1) 基于行业的配对交易策略与新颖的配对选择技术作者:Pranjala G. Kolapwar、Uday V. Kulkarni、Jaishri M. Waghmare页数:3 - 132) 虚假新闻云中的一线希望:大型语言模型能否帮助检测错误信息?作者:Raghvendra Kumar、Bhargav Goddu、Sriparna Saha、Adam Jatowt页数:14 - 243) 强化学习的混合环境中的多智能体协作导航与关系图学习作者:Wen Ou、Biao Luo、Xiaodong Xu、Yu Feng、Yuqian Zhao页数:25 - 364) 使用深度循环的工业物联网流