人类价值观及其衡量是一个长期存在的跨学科研究。人工智能的最新进展引发了人们对这一领域的新兴趣,大型语言模型 (LLM) 既是价值衡量的工具,也是价值衡量的主题。这项工作引入了价值观的生成心理测量学 (GPV),这是一种基于 LLM 的数据驱动价值测量范式,理论上以文本揭示的选择性感知为基础。其核心思想是将非结构化文本动态地解析为类似于传统心理测量中的静态刺激的感知,衡量它们揭示的价值取向,并汇总结果。将 GPV 应用于人类撰写的博客,我们证明了它的稳定性、有效性以及相对于先前心理工具的优越性。然后,将 GPV 扩展到 LLM 价值测量,我们通过 1)一种基于可扩展和自由形式输出来测量 LLM 价值的心理测量方法推进当前技术,从而实现特定于上下文的测量;2)测量范式的比较分析,表明先前方法的反应偏差; 3)尝试将 LLM 价值观与安全性联系起来,揭示不同价值体系的预测能力以及各种价值观对 LLM 安全性的影响。通过跨学科的努力,我们的目标是利用人工智能实现下一代心理测量,并利用心理测量实现与价值观一致的人工智能。1
经过几十年的失望之后,人工智能 (AI) 进入了快速发展的新时代,这些能力可能会提高生产力并重塑企业和行业内部和跨行业的劳动力需求。由于缺乏有关 AI 创新的详细企业级数据,准确衡量这些影响一直很困难。我们通过使用机器学习算法组合来解析美国专利授权文本并评估它们与 AI 相关的程度来解决这一挑战。这种方法表明,与 AI 相关的发明比以前的分析所表明的更为普遍。我们将 AI 专利数据与收集的美国人口普查创新公司的微观数据相匹配。然后,我们使用这些匹配的数据进行事件研究,以衡量这些创新对企业劳动力需求和企业增长的影响。我们发现 AI 相关创新与企业增长呈正相关,因为拥有 AI 相关创新的公司的就业增长比同类公司快 25%,收入增长快 40%。我们还发现证据表明,AI 相关创新似乎提高了每位工人的产出并增加了企业内部的工资不平等。
摘要 大脑内源性活动模式反映了对神经元状态空间的随机探索,这种探索受到神经元底层组装组织的限制。然而,还有待证明的是,神经元及其组装动力学之间的这种相互作用确实足以生成全脑数据统计数据。在这里,我们同时记录了斑马鱼幼虫中约 40,000 个神经元的活动,并表明数据驱动的神经元组装相互作用生成模型可以准确再现其自发活动的平均活动和成对相关统计数据。该模型,即组合受限玻尔兹曼机 (cRBM),揭示了约 200 个神经组件,它们组成神经生理回路,其各种组合形成连续的大脑状态。然后,我们进行了计算机扰动实验,以确定区域间功能连接,该连接在个体动物之间是保守的,并且与结构连接有很好的相关性。我们的研究结果展示了 cRBM 如何捕捉斑马鱼大脑的粗粒度组织。值得注意的是,这种生成模型可以轻松部署来解析通过其他大规模记录技术获得的神经数据。
NTPC 绿色能源是领先的可再生能源发电 PSU 之一,拥有太阳能和风能发电资产,同时更加关注水电资产和电力存储计划。它将通过在水电项目上的额外活动成为该领域的领导者。该公司的目标是到 2025 财年、2026 财年和 2027 财年将其运营能力从截至 2024 年 9 月的 3.3 吉瓦分别提高到 6、11、9 吉瓦。根据上限价格区间 ₹ 108/- 的估值分析,该发行要求的市值为 ₹ 910000 百万,基于 2025 财年的年化收益和完全稀释的 IPO 后实收资本,该公司要求的市值为 4.96 倍,市盈率为 259.56 倍,这个价格似乎很有竞争力。但考虑到其目前的既定产能和未来扩大的产能,这是一个纯粹的长期故事。该公司凭借其强大的母公司(NTPC)、低运营成本以及多元化的产能组合和较低的资本成本,处于有利地位,能够抓住可再生能源产能增加带来的顺风。因此,我们认为,此次发行可能是为了其长期增长。因此,我们给予此次 IPO“长期认购”评级。
Teaching Experience 2024 Fall Lead Instructor , Introduction to Statistical Computing (CMU - 36-350) 2023 Fall Lead Instructor , Introduction to Statistical Computing (CMU - 36-350) 2023 Spring Lead Instructor , Introduction to Statistical Computing (CMU - 36-350) 2021 Fall Guest lecture , Advanced Computational Genomics (Princeton - COS 597D ) 2020 Fall Guest lecture , Computational Biology of Single Cells (普林斯顿 - COS 597F)2018年秋季助教,应用回归(哈佛-BST 210)等级作业,保持办公时间,并教每周一次的实验室部分。2018年夏季联合教师,STATSTART(哈佛)统计计划,针对代表性不足的高中生。在图形数据和回归方面提供了两个交互式讲座。2017年秋季助教,应用贝叶斯分析(哈佛-BST 228)等级作业,提供解决方案并保持办公时间。2017年夏季首席教师,数据科学简介(Parse Ltd.)非营利组织,为期一周的高中生统计计划。开发了课程材料,并使用R. 2017春季助教,应用纵向分析(哈佛-BST 226)等级家庭作业并保持办公时间的时间。2016年秋季助教,统计方法介绍(哈佛-BST 201)等级作业,提供解决方案,保持办公时间和每周实验室部分。2016年夏季项目导师,为期不足的本科生的生物统计学计划(哈佛大学)计划。指导三名学生进行药物基因组学数据分析。2016春季助教,费率和比例(哈佛-BST 210)等级家庭作业,提供解决方案,保持办公时间和每周一次的实验室部分。
摘要 — 与电子设备对话并在最短时间内获取所需信息已成为当今的常态。尽管人工智能对话代理已经渗透到商业市场,但它们在公共环境中的使用仍在不断发展。我们假设在灾害多发地区部署聊天机器人可以有利于在危机期间观察、监控和警告人们。此外,成功实施这种技术可以挽救生命。在这项工作中,我们讨论了部署一个名为 FloodBot 的实时洪水监测聊天机器人。我们收集、注释和视觉解析潜在危险区域的图像。我们通过堆叠深度学习模型(例如卷积神经网络 (CNN)、单次多框物体检测 (SSD))来检测洪水状况并识别危险物体。然后,我们将图像内容输入到我们的人工智能 FloodBot 的知识库中,并使用端到端内存网络探索其 AI 对话能力。我们还展示了跨领域迁移学习和模型融合技术的强大功能。索引词 — 聊天机器人、深度学习、计算机视觉、深度自然语言处理、移动计算
简单总结:基因组编辑应研究基因组中编码的所有基因的功能。基因组编辑技术可以加速昆虫基因功能分析的研究。目前,我们对基因功能信息的了解仍然不完整,而一个生物体的基因组测序已经完成。功能信息仅基于从以前的生物学研究结果中获得的信息进行注释。然而,这些信息对于确定基因组编辑的目标基因非常重要。特别是,这些信息以机器可读的形式存在非常重要,因为计算机程序主要解析这些信息以了解生物系统。在本文中,我们描述了一种基于工作流的昆虫基因功能注释方法,该方法利用转录序列信息以及参考基因组和蛋白质序列数据库。使用开发的工作流程,我们注释了日本竹节虫和家蚕的功能信息,包括基因表达以及序列分析。该工作流程获得的功能注释信息将极大地扩展利用基因组编辑进行昆虫学研究的可能性。
在这项工作中,我们将Phishllm作为一种新型的基于参考的网络钓鱼检测器,无明确的预定参考列表。我们的理由在于,现代LLM的编码比任何预定义的列表都更广泛的品牌域信息。此外,检测许多网页语义(例如获得资格意图分析)更像是语言问题,但现在它们被作为视觉问题进行处理。因此,我们设计了Phishllm来解码(或检索)从LLM中解码(或检索)域品牌关系,并有效地解析网页的凭证意图,而无需维护和更新外部参考列表的成本。此外,为了控制LLMS的幻觉,我们引入了基于搜索引擎的验证机械,以消除错误信息。我们的广泛经验表明,菲什洛姆(Phishllm)的表现明显优于诸如西犬和属施氏菌(Phishpedia and Phishintention)等先进的解决方案,将召回率提高了21%,至66%,而精度为昂贵。我们的现场研究表明,Phishllm涵盖(1)零日网页的6倍,即与现有方法(例如?thimintention)相符的零日网页,(2)即使是王朝增强的零日网页网页,也要多2倍。我们的代码可在https://github.com/code-philia/phishllm/上找到。
大多数安全漏洞是由不安全的输入处理引起的。这些讲义讨论了用于安全输入处理的模式和反图案,也讨论了输出处理,因为某些输入问题实际上是输出问题。一个常见的误解是,我们应该简单地验证或消毒输入以防止输入问题。可能需要输入验证或缺乏疗法,但也可能是解决一些输入问题的完全错误的方法。此外,即使它们在根本上是非常不同的概念,也通常会发现(或困惑)验证和缺乏症。使事情变得更糟,许多(近)同义词 - 过滤,编码,逃脱,中和引用 - 加剧了混乱。我们将从解析的角度来研究输入处理。典型的应用必须解析多种语言,格式和协议。大多数安全问题是由于这些语言的不安全,错误或意外解析所致。在这里,这些讲义很大程度上归功于Langsec方法对不安全输入处理的根本原因的见解。解析提供了一个有用的观点,可以在结构上防止输入处理问题:Langsec构建安全解析器的方法以及不容易受到注射攻击的键入和“安全” API。
文本对视频模型在机器人决策中表现出了实质性的潜力,从而使未来的现实计划以及准确的环境模拟实现了现实计划的想象。但是,此类模型中的一个主要问题是一般化 - 模型仅限于综合视频,但受到与培训时间相似的语言指令约束的视频。这在决策中严重限制,我们寻求一个强大的世界模型来综合对象和行动的不显示的计划,以便在新环境中解决以前看不见的任务。为了解决此问题,我们介绍了Robodreamer,这是一种通过分配视频生成来学习组成世界模型的创新方法。我们利用语言的自然组成性将说明解析为一组低级原始词,我们调节一组模型以生成视频。我们通过允许我们制定新的自然语言教学作为先前看到的组成部分的组合来说明这种分解如何自然地实现组成的重新化。我们进一步展示了这样的分解如何使我们能够添加附加的多模式目标,从而使我们能够指定一个我们希望同时给定自然语言指令和目标图像生成的视频。我们的AP-PRACH可以成功地合成RT-X中看不见的目标的视频计划,在仿真中成功执行机器人,并且在视频生成方面实质上优于单片基线方法。