人类已经依靠机器将过多的信息减少到可管理的代表。但是可以滥用这种依赖 - 战略机器可能会制作来操纵用户的表示。用户如何根据战略表示做出好选择?我们将其形式化为学习问题,并追求算法进行决策,这些算法是可靠的。在我们关注的主要设置中,系统将项目的属性表示给用户,然后决定是否消耗。我们通过策略分类的镜头对这种相互作用进行建模(Hardt等人2016),反转:学习,首先播放的用户;响应的系统排名第二。系统必须以揭示“除了真理”但不必透露整个真理的表示形式做出响应。因此,用户面临着在战略子集选择下学习设置功能的问题,该问题呈现出不同的算法和统计范围。我们的主要结果是一种学习算法,尽管具有战略性代表,但可以最大程度地减少错误,而我们的理论分析阐明了学习工作和操纵性的知名度之间的权衡。
记忆回忆和自愿行为通常被认为是与外部刺激无关的自发产生。尽管它们是我们神经元的产物,但在神经元层面上很少在人类身上出现。在这里,我回顾了从独特的神经外科手术机会中收集到的见解,这些机会记录和刺激了能够表达自己的想法、记忆和愿望的人的单神经元活动。我讨论了人类回忆的主观体验和自愿行为的主观体验来自两个内部神经元发生器的活动的证据,前者来自内侧颞叶再激活,后者来自额顶叶预激活。我描述了这些发生器及其相互作用的特性,从而能够灵活地招募基于记忆的行动选择以及招募基于行动的计划以在记忆中表示概念知识。这两个内部发生器都以令人惊讶的明确但不同的神经元代码运行,这些代码似乎伴随着不同的单神经元活动而出现,通常在参与者报告有意识之前观察到。我讨论了基于这些代码的行为预测及其调节的潜力。通过增强、开始或删除特定的、选定的内容来编辑人类记忆和意志的前景带来了治疗可能性和伦理问题。
记忆回忆和自愿行为通常被认为是与外部刺激无关的自发产生。尽管它们是我们神经元的产物,但在神经元层面上很少在人类身上出现。在这里,我回顾了从独特的神经外科手术机会中收集到的见解,这些机会记录和刺激了能够表达自己的想法、记忆和愿望的人的单神经元活动。我讨论了人类回忆的主观体验和自愿行为的主观体验来自两个内部神经元发生器的活动的证据,前者来自内侧颞叶再激活,后者来自额顶叶预激活。我描述了这些发生器及其相互作用的特性,从而能够灵活地招募基于记忆的行动选择以及招募基于行动的计划以在记忆中表示概念知识。这两个内部发生器都以令人惊讶的明确但不同的神经元代码运行,这些代码似乎伴随着不同的单神经元活动而出现,通常在参与者报告有意识之前观察到。我讨论了基于这些代码的行为预测及其调节的潜力。通过增强、开始或删除特定的、选定的内容来编辑人类记忆和意志的前景带来了治疗可能性和伦理问题。
摘要“表征”的概念在整个神经科学中被广泛使用并且没有争议,与它在心灵哲学和认知科学中的高度争议地位形成鲜明对比。在本文中,我首先讨论了该术语在神经科学中的使用方式,特别是描述了表征在经验上的特征的策略。然后,我将神经科学中的表征概念与机器学习领域中发展起来的概念联系起来(特别是通过最近的深度学习或“表征学习”方面的工作)。我认为,人工神经网络在视觉对象识别等某些任务上取得的成功反映了这些系统(如生物大脑)在多大程度上表现出反映物理世界结构的固有归纳偏差。我进一步认为,任何要在世界上表现智能的系统都必须包含反映世界结构的表征;否则,系统必须执行不受约束的函数逼近,而这种逼近注定会因维数灾难而失败,其中世界可能状态的数量随着可能输入空间的维数呈指数增长。根据关于表征本体论地位的哲学辩论对这些概念的分析表明,在生物和人工神经网络中识别的表征都符合一级表征的条件。
Diana Cristobal Olave 是一名建筑师和学者,目前正在普林斯顿大学建筑系攻读博士学位。她的研究兴趣集中在现代时期的建筑、媒体、政治和技术基础设施的交叉领域,特别关注计算技术和信息可视化。在她的论文中,她对 20 世纪 60 年代和 70 年代统治西班牙和葡萄牙的法西斯政权期间算法的兴起进行了理论分析,并追溯了算法在现代建筑和城市设计中的应用和影响。Diana 在 ETSABarcelona 接受了建筑师培训,并以富布赖特奖学金获得者的身份毕业于哥伦比亚大学建筑、规划和保护研究生院的 MSAAD。她是集体 KnitKnot Architecture 的创始合伙人,也是巴纳德学院和纽约城市学院的兼职助理教授。
戴安娜·克里斯托巴尔·奥拉夫 (Diana Cristobal Olave) 是一名建筑师和学者,目前正在普林斯顿大学建筑系攻读博士学位。她的研究兴趣集中在现代时期的建筑、媒体、政治和技术基础设施的交叉领域,特别关注计算技术和信息可视化。在她的论文中,她对 20 世纪 60 年代和 70 年代统治西班牙和葡萄牙的法西斯政权期间算法的兴起进行了理论分析,并追溯了算法在现代建筑和城市设计中的应用和影响。戴安娜在 ETSABarcelona 接受了建筑师培训,并以富布赖特奖学金获得者的身份毕业于哥伦比亚大学建筑、规划和保护研究生院的 MSAAD。她是集体 KnitKnot Architecture 的创始合伙人,也是巴纳德学院和纽约城市学院的兼职助理教授。
2月5日,星期三(15H45)在B4.233室 +组织(14')2月6日,星期四(15h45)动机(72')2月11日,星期二(15H45)介绍(15H45)介绍(170')2月12日,星期三(170')在2月19日(星期三)(15h45)在P3E11开会1(2月24日)开始作业1(于2月24日);开始家庭作业2(在3月3)2月20日,星期四(15H45)建模(106')2月26日,星期三(15H45)在B4.233举行的会议;讨论家庭作业1 2月27日,星期四(15H45)语言(128'),星期二,3月。4(15H45)3月,3月。5(15H45)在B4.233举行的会议;讨论家庭作业2,开始作业3(将于3月 23)3月,星期三 12(15H45)在B4.233举行的会议; 3月13日(15H45)的开始项目工作(119')5(15H45)在B4.233举行的会议;讨论家庭作业2,开始作业3(将于3月23)3月,星期三12(15H45)在B4.233举行的会议; 3月13日(15H45)的开始项目工作(119')12(15H45)在B4.233举行的会议; 3月13日(15H45)的开始项目工作(119')
在为人提供服务时,机器人需要优化与最终用户偏好保持一致的奖励。由于机器人将依靠原始的感知输入,因此他们的奖励将不可避免地使用视觉表示。最近,使用预训练的视觉模型的表示形式引起了人们的兴趣,但是在机器人技术中使这些工作的关键是微调的,这通常是通过动力学预测或执行时间周期矛盾的代理任务来完成的。但是,所有这些代理任务绕过了人类对他们重要的事物的输入,加剧了弹性相关性,并最终导致行为与用户偏好不一致。在这项工作中,我们建议机器人应利用人类的反馈将其视觉表示与最终用户保持一致,并解散该任务的内容。我们提出了representation-基于P参考的L奖(RAPL),这是一种通过基于偏好的学习和最佳运输的镜头来解决视觉表示对准问题和视觉奖励学习问题的方法。在X魔术和机器人手术中的实验中,我们发现Rapl的奖励始终产生具有较高样品效率的首选机器人行为,并在从不同的体现中学到与机器人的实现时显示出强烈的零光概括。