Revisiting the Scaling Properties of Downstream Metrics in Large Language Model Training
虽然大型语言模型 (LLM) 的缩放法则传统上关注预训练损失等代理指标,但预测下游任务性能被认为是不可靠的。本文提出了一个直接框架来对培训预算中的基准性能扩展进行建模,从而挑战了这一观点。我们发现,对于固定的令牌与参数比,简单的幂律可以准确地描述多个流行下游任务的日志精度的缩放行为。我们的结果表明,直接方法比之前提出的两阶段程序更好地推断......
在宅勤務はどのような人が利用しているのか-属性別にみた利用状況-
■摘要 在本文中,我们根据 Nissay 研究所的独特数据,按属性对远程办公的使用状况进行了简单的统计,并确认了哪些类型的人更倾向于使用远程办公。结果显示,远程办公的使用情况并不均匀,年轻人、有孩子的人、东京地区的居民、公务员/全职员工、大公司员工、通勤时间长的人的使用比例往往较高。这些结果表明,远程办公的普及可能与企业制度发展、通勤负担、居住环境等密切相关。 ■目录1 - 简介2 - 调查概述3 - 远程办公频率4 - 各种属性的远程办公频率5 - 结论附录由于新型冠状病毒感染的传播,远程办公和远程工作迅速普及。从那时起,出现了一场重返工作岗位的运动,但现在它已成为一些公司和组织的永久工作方
Studying the properties of large language models: an interview with Maxime Meyer
在本访谈系列中,我们将与 AAAI/SIGAI 博士联盟的一些参与者会面,以了解有关他们研究的更多信息。我们与马克西姆·迈耶 (Maxime Meyer) 坐下来聊了聊他当前的研究、未来的计划以及他如何找到博士联盟的经历。您能否先自我介绍一下,您在哪里学习以及 [...]
How to do econometrics properly
始终但始终绘制您的数据。请记住,数据质量至少与数据数量一样重要。总是问自己,“这些结果是否具有经济/常识”?检查您的“具有统计显着性”的结果是否也具有“数字/经济显着性”。确保您确切地知道使用/需要哪些假设来获得与属性相关的结果 [...]
This Multidimensional Holographic Breakthrough Stores Massive Data Inside Light Itself
突破性的全息系统利用人工智能和多维光在更小的空间内存储更多的数据。研究人员创建了一种新的全息数据存储方法,通过结合光的三个关键属性:振幅、相位和偏振来捕获和检索三维信息。通过一起使用这些属性,该技术可以显着 [...]
■概要 随着医疗DX的进步,个人了解和利用自己的健康和医疗信息(PHR)变得越来越重要。然而,其利用尚未充分进展,并且认为根据个人属性和意识而存在差异。在本文中,我们利用对员工的调查结果来分析健康检查结果和病史的使用意图及相关因素。分析显示,使用该服务的意图因健康素养、健康状况和参与医疗保健的深度而异,这表明需要根据用户人口统计数据推广使用。 ■目录 1 - 简介 2 - 使用健康检查结果和病史的意愿现状 1 - 使用健康检查结果和既往病史的期望情况 2 - 希望利用的人的特征 3 - 健康信息利用的特征和建议 随着医疗领域数字化转型(医疗DX)的推进,个人了解和管理自己的健康和医疗信息(
在宅勤務の生産性評価と子育ての関係-ライフステージで異なる生産性評価-
■摘要本文采用Nissay研究所进行的一项原创调查来分析在家工作与在办公室工作时的生产力评估与有无儿童及其年龄之间的关系。结果表明,在家工作和生产力评估之间的关系并不统一,并且根据生命阶段的不同而有所不同。尤其是在有孩子与家中同住的情况下,更频繁在家工作的受访者比例更有可能感受到生产力的提高,这一趋势在最小孩子为学龄前(0-6岁)的受访者中尤为明显。另一方面,观察到了一种不同的模式,没有孩子与他们住在一起的员工由于混合工作而在家工作时往往具有更高的生产力评级。此外,评估趋势因性别和年龄组而异,表明在家工作的生产力评估可能与多种因素有关,包括与育儿、工作自由裁量权和职业阶段相关的时间限制。 ■目
▼研究员之眼☆晋升停止后,如何才能提升自己的职业生涯? 〜出自我的书《女性退休后〜金钱、工作和生活的现实》(升电社新书)☆养命酒生产的招标☆与数字“1”相关的各种话题 - 这是一个具有多种含义的基本数字,很难说什么 - ☆“断开权”的国际趋势和未来的应对☆高物价时代的新生活 - “没有财产的独居”反映了什么☆ 生物多样性保护的国际趋势与30by30的定位 - 基于爱知目标评估的新的国际框架和政策问题 - ☆ “立即”传达什么和不传达什么 - 能源价格和政策解释 ☆ AI和MBTI反映的年轻人的自我理解 - 为什么年轻人谈论自己的类型并咨询AI? ☆ 冰淇淋x自动售货机——消费的交集(14)--
通勤時間とメンタルヘルス-通勤時間が長い層ほどストレスが大きい傾向-
■摘要 本文利用 Nissay 研究所在 2025 年进行的一项员工调查(5,784 份回复)来描述性地证实通勤时间与心理健康之间的关系。以K6作为心理压力指标进行分析后发现,总体而言,通勤时间越长,心理压力的平均值越高,单程通勤时间超过90分钟的人的压力水平尤其高。虽然这种趋势普遍存在于许多属性中,例如性别、年龄组和地区,但根据属性的不同,关系的显示方式也存在一些差异。虽然这一分析是基于简单的汇总,并不表明因果关系,但确实表明通勤时间的长短可能与日常心理负担有关。 ■目录 1 - 简介 2 - 调查概述 3 - 按通勤时间划分的心理健康分布 4 - 摘要和注释 附录 长时间通勤作为影响生活质
在宅勤務の頻度とメンタルヘルス-出社と在宅勤務のハイブリッド層のストレスが大きい傾向-
■摘要本文利用日精研究所的原始调查数据(回复数:5,784,2025)描述性地整理了在家工作的频率与心理压力(K6)之间的关系。因此,与完全不在家工作的人或每天在家工作的人相比,每月一次到每周在家工作四次的人(即所谓的在家工作和在家工作相结合的混合群体)的心理压力水平往往较高。无论性别、年龄组、地区、是否有共同居住的孩子等属性,这种趋势都得到了普遍证实。这些结果表明,在家工作的频率与心理健康之间的关系可能不是简单的线性关系,即在家工作的人越多,他们就越好(或更差)。这可能是由于心理健康状况可能影响在家工作的频率,或者是工作日与工作日之间的日常节奏差异造成的“远程办公时差”负担。但需要注意的是,
11 Books Every Data Scientist Must Read In 2024
虽然统计和编程知识是每个数据科学家的必备知识,但非技术技能也可以帮助您完成这项工作。一个特别有用的属性是具有商业头脑,正如我们的文章“数据科学家最需要的 5 种技能”中所证明的那样。现在,您可能会问如何才能获得如此广泛的技能? […]Artykuł 2024 年每位数据科学家必读的 11 本书 pochodzi z serwisu DLabs.AI。
コロナ前後で女性の通勤時間は本当に増えたのか-構成変化とパネル分析による検証-
■摘要 在理化学研究所的一封题为“冠状病毒前后平均通勤时间的变化是否存在男性、女性和年龄组之间的差异?”的信中日精研究所最初的问卷调查分析显示,从2019年到2025年,无论地区如何,女性的通勤时间都呈增加趋势。本文探讨了这种变化是由于受访者的变化还是就业类型构成的变化所致。按就业类型进行的分析以及使用相同受访者的面板分析表明,女性通勤时间的增加不能仅用这些构成变化来解释,而可能反映了实际通勤行为的变化。 ■目录 1 - 简介 2 - 确认就业类型构成的变化 3 - 按就业类型进行分析 4 - 使用面板数据进行确认 5 - 结论 NRI Letter 2 的“2020 年女性平均通勤时间增加的
「推される体験」の商品化-「推しになりたい」という同一化欲求とは
■概要 随着“押”一词的普及和“押胜”的普及,我们的消费方式也在发生变化。本文以新冠病毒大流行引发的促销活动扩张为切入点,认为现代消费正在被重组,不是从事物或事件本身的角度,而是从“人”的角度,即“与谁联系在一起”。此外,我们将重点关注这样一个事实:支持自己喜欢的人的行为与认同自己崇拜的对象和自我展示的愿望有关。此外,近年来出现了一些服务,不仅可以让用户体验推送者的角色,还可以体验被推送的人。本文以涩谷的卡拉 OK 舞台和酒吧 VSING 为案例,探讨了审批和支持的组成部分由系统设计并作为一种体验商业化的现状。 ■目录 1 - 新冠疫情推动的押活动的扩大 2 - 以“人”为媒介的消费 3 -