‘Sycophantic’ LLMs like GPT fail to challenge illogical medical queries
大型语言模型 (LLM) 旨在提供帮助,但不能以牺牲诚实为代价。他们生成的信息必须事实准确、逻辑合理并与既定知识相符。这在医学等高风险领域尤其重要,因此可能不具备临床知识的患者在他们的[...]
Analyzing Dialectical Biases in LLMs for Knowledge and Reasoning Benchmarks
大型语言模型 (LLM) 在现代自然语言处理中无处不在。然而,之前的研究表明,代表性不足的英语方言的法学硕士成绩有所下降。我们分析了将“标准”美式英语问题典型化为非“标准”方言变体对多项选择题回答任务的影响,发现准确率降低了 20%。此外,我们还调查了非“标准”英语问题中表现不佳的语法基础。我们发现各个语法规则对性能有不同的影响,但有些更……
The Adjustment from Student to Articling Student
我连续 20 年都是全日制学生。随着时间的推移,我找到了一种舒适的生活习惯,并享受了学术生活的节奏——尤其是暑假。毫无疑问,作为一名学生,我最喜欢的部分是灵活的日程安排。法学院放大了这种灵活性:有些日子我可以睡懒觉,而其他日子我有很长的间隙,可以让我在城市里散步或见面
MIT researchers propose a new model for legible, modular software
编码框架使用模块化概念和简单的同步规则,使软件更清晰、更安全、更易于法学硕士生成。
TDS Newsletter: The Theory and Practice of Using AI Effectively
当我们遇到一项新技术(例如法学硕士申请)时,我们中的一些人往往会卷起袖子立即投入其中,迫不及待地开始修补。其他人则更喜欢更谨慎的方法:阅读一些相关的研究论文,或浏览一堆博客文章,目的是了解这些工具的背景[…]TDS 时事通讯:有效使用人工智能的理论和实践首先出现在走向数据科学上。
450-Year legacy arrives to Dubai: Queen Elizabeth’s school to open in August 2026
伊丽莎白女王学校巴尼特是英国最负盛名的公立文法学校之一,将于 2026 年 8 月在迪拜体育城开设其第一家国际分校。450 年后的遗产抵达迪拜:伊丽莎白女王学校将于 2026 年 8 月开放,最先出现在《PIE 新闻》上。
Justice J. Michael Luttig Denounces SCOTUS for Failing to Condemn Death Threats to Judges
J. Michael Luttig 法官于 1991 年被乔治·H·W·布什总统任命为第四巡回上诉法院法官。他在布什总统任职至2006年。他是一位著名的保守派法学家,但对特朗普政权感到排斥,尤其是特朗普对宪法和法治的蔑视。他成为最 [...]
Let’s teach children how to cook first | Brief letters
核心科目 | DWP 糊涂|裸露手臂的权利 |日照时间短|酷卫报的来信作者关于课程中的核心科目(报告,11 月 4 日),我在 1950 年代上过一所女子文法学校,没有家庭科学教学,因为我们被告知:“你将获得一个好学位,然后找到一份好工作,或者一个富有的丈夫。”当我在一所继续教育学院教授生活技能时,我确保年轻人至少能做两到三顿饭,比如spag bol。这可能比抵押信息更有用?Liz ThompsonOxford• 我最近收到一封来自 DWP 的信,通知我,我将第一次收到冬季燃油付款。但小字上写着,如果我的收入超过一定金额,它将通过我的税码索回。当然,如果它有足够的信息来判断我赚得太多并索回,那
Pennsylvania reelects Supreme Court justices, maintaining Democratic majority
周二寻求连任的所有三名宾夕法尼亚州最高法院法官都将获得连任,确保民主党法学家在总统战场州最高法院保持多数席位。
Policy Maps: Tools for Guiding the Unbounded Space of LLM Behaviors
人工智能政策为人工智能模型的可接受行为设定了界限,但这在大型语言模型 (LLM) 的背景下具有挑战性:如何确保覆盖广阔的行为空间?我们引入了政策地图,这是一种受物理地图制作实践启发的人工智能政策设计方法。政策地图不是以全面覆盖为目标,而是通过有意识的设计选择来帮助有效导航,了解哪些方面要捕获,哪些方面要抽象。借助政策投影仪(一种用于设计法学硕士政策地图的交互式工具),人工智能从业者可以调查模型的情况……
推理已成为大型语言模型 (LLM) 的核心范式,不断提高各种基准的准确性。然而,它是否适合精度敏感的任务仍不清楚。我们提出了第一个在严格的低误报率(FPR)制度下分类任务推理的系统研究。我们的分析涵盖两项任务——安全检测和幻觉检测——使用标准法学硕士和大型推理模型(LRM)在微调和零样本设置下进行评估。我们的结果揭示了一个明显的权衡:Think On(推理增强)生成改进......
Will Climate Change Push Some People into Statelessness?
在“气候变化、移民变化”播客的这一集中,国际法学者马克·内维特讨论了如果气候变化导致一些太平洋小岛国的国家无法居住,其国民将成为无国籍的前景。
How big a deal is California’s Proposition 50?
加州大学洛杉矶分校法学教授和投票权专家 Rick Hasen 对国会重新划分选区的措施发表了看法。