实证分析关键词检索结果

欺骗你的多模态 LLM 有多容易?对欺骗性提示的实证分析

How Easy is It to Fool Your Multimodal LLMs? An Empirical Analysis on Deceptive Prompts

多模态大型语言模型 (MLLM) 的显著进步并未使它们免受挑战,特别是在处理提示中的欺骗性信息的情况下,因此在这种情况下会产生幻觉反应。为了定量评估这种脆弱性,我们提出了 MAD-Bench,这是一个精心策划的基准,包含 1000 个测试样本,分为 5 个类别,例如不存在的对象、对象计数和空间关系。我们对流行的 MLLM 进行了全面分析,从 GPT-4v、Reka、Gemini-Pro 到开源模型……

公民道德决定因素的实证分析:成年期收入水平 vs. 童年期社会性习得

An Empirical Analysis of the Determinants of Civic Virtue: Income level in adulthood vs. sociality acquisition in childhood

KUME Koichi(东洋大学)/ TSURU Kotaro(RIETI 教员)/ SANO Shinpei(神户大学)/ YASUI Kengo(青山学院大学)

独立自雇劳动者身份与劳动者绩效关系的实证分析

An Empirical Analysis of the Relationship between Independent Self-employed Worker Status and Worker Performance

KUME Koichi(东洋大学)/ TSURU Kotaro(RIETI 教员研究员)/ KAWAKAMI Atsushi(东洋大学)

数学能力与理工科大学入学率的性别差距实证分析

Empirical Analysis of the Gender Gap in Mathematics Proficiency and College Enrollment in Science and Engineering

佐野新平 (神户大学) / 安井健吾 (青山学院大学) / 鹤小太郎 (RIETI 教员) / 久米光一 (东洋大学)

瑞典政府债券收益率的实证分析

An Empirical Analysis of Swedish Government Bond Yields

本文对瑞典政府债券 (SGB) 收益率的动态进行了计量经济学建模。它考察了在控制了其他宏观经济和金融变量,如消费者价格通胀、工业生产增长、股票价格指数、人民币汇率等因素后,短期利率是否对长期新加坡国债收益率具有决定性影响。瑞典克朗以及瑞典中央银行瑞典央行的资产负债表。

计算最优大型语言模型训练的实证分析

An empirical analysis of compute-optimal large language model training

我们问一个问题:“对于给定的计算预算,最佳模型大小和训练令牌数量是多少?”为了回答这个问题,我们训练了各种大小和各种标记数量的模型,并根据经验估计了这种权衡。我们的主要发现是,当前的大型语言模型对于其计算预算来说太大了,并且没有在足够的数据上进行训练。

员工老龄化对创新和生产力影响的实证分析

An Empirical Analysis of the Impact of Employee Aging on Innovation and Productivity

FUKAO Kyoji(RIETI 教员)/ KIM YoungGak(专修大学)/ KWON Hyeog Ug(RIETI 教员)

成年后非认知技能会提高吗?年龄与非认知技能关系的实证分析

Do Non-cognitive Skills Improve in Adulthood? An empirical analysis of the relationship between age and non-cognitive skills

KUME Koichi(东洋大学)/ TSURU Kotaro(RIETI 教员)/ SANO Shinpei(神户大学)/ YASUI Kengo(青山学院大学)

Sigmoid 自注意力的理论、分析和最佳实践

Theory, Analysis, and Best Practices for Sigmoid Self-Attention

*主要贡献者注意力机制是 Transformer 架构的关键部分。它是一种序列到序列的映射,可将每个序列元素转换为值的加权和。权重通常作为键和查询之间的点积的 softmax 获得。最近的研究探索了 Transformer 中 softmax 注意力机制的替代方案,例如 ReLU 和 S 型激活。在这项研究中,我们重新审视 S 型注意力机制并进行了深入的理论和实证分析。从理论上讲,我们证明具有 S 形注意力机制的变换器是通用函数逼近器,并且……

劳动生产率增速大幅提升,人工智能的普及将助推劳动生产率增速提升。

労働生産性伸び率の上昇が顕著、AIの普及が上昇を後押しへ

经济体的生产率通过将经济产出与用于生产它的投入(劳动力、资本等)进行比较来衡量生产商品和服务的效率。总体而言,生产率增长已成为经济长期增长和个人生活水平大幅提高的最重要决定因素。代表生产率的指标包括劳动生产率(定义为每工作小时实际产出的比率)和全要素生产率(表示除劳动力和资本等数量生产要素的增长以外的质增长因素)。 图1显示了美国劳动生产率的同比增长情况。从2020年冠状病毒大流行期间到2022年中期,该指数一直剧烈波动,很难了解实际情况,但从2022年下半年开始,增长速度变得明显。特别是,2024年7月至9月期间为+2.0%,这是自2023年7月至9月期间连续第五个期间+2%或以上。这明显高

乳房 X 线检查异常后的后续检查自付费用及其对乳腺癌生存的影响

Out of Pocket Costs for Follow-Up Tests After Abnormal Screening Mammogram and Their Impact on Breast Cancer Survival

今天,美国癌症协会癌症行动网络发布了一份报告,题为“乳房 X 线检查异常后的后续检查自付费用及其对乳腺癌生存的影响”。实证分析由我和 FTI Consulting 的一些同事(Shanshan Wang、Shurui Zhang、Citseko Staples Miller 和 Sophia Mildred Setterberg)进行。...

应对结构性改革的危险政治经济

Navigating the treacherous political economy of structural reform

应对结构性改革的危险政治经济HectorMon, 05/27/2024 - 08:32我们利用新建的结构性经济改革数据库和 1970 年代以来的民主选举结果来研究自由化措施的经济和选举影响。数据显示,自 20 世纪 90 年代以来,发达国家、新兴市场和发展中国家的自由化步伐均显着放缓。关于经济放缓的原因引发了一场争论,其中包括改革可能无法带来包括多边金融机构在内的倡导者所鼓吹的经济利益。一些人指出,美国现任和历届政府都放弃了新自由主义政策,转而政府更多地干预经济,其影响已在全球范围内蔓延。我们的实证分析表明,自由化带来的增长红利在经济上和统计上都是显着的。很重要,但随着时间的推移,它只会慢慢显

AMM LP 无利可图:非理性、波动性溢价还是被动交易?

AMM LP Unprofitability: irrationality, volatility premium, or passive trading?

自动化做市商 (AMM) 的一个令人费解的方面是,LP 总体上亏损,但似乎没人关心。Uniswap 是这里最杰出的 AMM 开发商,目前价值 90 亿美元。Uniswap 的文档页面仅间接涉及 LP 盈利能力,指向没有数据的理论论文 (链接) 或 2019 年的轶事实证博客文章 (链接)。如果你搜索这个主题并寻找实证分析,你通常会得到一个甚至不算错的散漫分析。例如,一篇论文指出,我们对真实 Uniswap V3 流动性提供者的风险和回报的支持数据分析强调,Uniswap V3 中的流动性提供非常复杂,表现可能千差万别。这可以说是任何一个人不理解的事情。最有针对性的著名实证研究是由 Topaze

39. 精选阅读:AEID 期刊关于非洲、亚洲和太平洋的文章,2001-2024

39. Selected Readings: Articles of journal AEID on Africa, Asia and Pacific, 2001-2024

第 39 篇由西班牙计量经济学教授 Maria-Carmen Guisan 撰写,2021-2024 年关于非洲、亚洲和太平洋的文章。有关世界其他地区,请参阅本博客的第 37 和 38 篇。 AEID 第 23-2 卷(2023 年)印度汽车需求短期和长期弹性估计:1987-2020 年期间的实证分析,Rashmi Ranjan PAITAL、Subhendu DUTTA 摘要印度部门电力消耗和经济增长:1970 年至 2016 年的实证研究。Jaganath BEHERA 摘要世界发展的国际比较:1960-2000 年和 2021-2023 年期间关于教育、生产、贫困和生活质量的 2 本电子

警察使用武力:研究笔记

Police Use of Force: Notes on a Study

哈佛经济学家罗兰·弗莱尔对警察使用武力的一项新实证分析引起了全国的关注。该论文涉及致命和非致命武力,使用各种不同的数据集,其中一些是公开的,一些是由作者和他的团队精心收集的。鉴于过去一周发生的令人痛心的事件,他的枪击事件研究结果可能会引起最多的关注,但值得仔细考虑这两组研究结果。弗莱尔提供了证据表明,在警察使用非致命武力方面存在显著的种族差异,即使在依赖警察自述的数据中也是如此。利用纽约市“拦截、询问和搜身”计划的官方统计数据,他发现黑人和拉美裔比被拦截的白人更容易被抓、推、铐、喷水或殴打。即使在控制了广泛的人口、行为和环境特征后,情况仍然如此。通过使用来自全国具有代表性的平民样本的数据(不依

社交(IM)流动性

Social (im)mobility

领带读者可能会欣赏我周五在《华盛顿邮报》的Wonkblog部分上发布的文章。我对格雷格·曼基(Greg Mankiw)最近对不平等的哲学分析提出了一些问题。在此过程中,我列举了杜克社会学家丽莎·凯斯特(Lisa Keister)在2005年的《变得富有:美国的新[...]社会(IM)流动性最初出现在偶然的经济学家中的新[...],对杜克社会学家丽莎·基斯特(Lisa Keister)的代际财富流动性进行了有趣的实证分析。