AI 对齐微不足道

创造一个邪恶的人工智能需要额外的努力。

来源:AI的零点原则

一场关于人工智能对齐的辩论即将来临。我们听到了关于人工智能接管并杀死所有人类的荒谬说法。这些说法根植于 20 世纪还原论者对人工智能的基本误解。这些恐惧是由记者和社交媒体煽动和助长的,并引起了该领域外人士的严重担忧。现在是时候从认识论开始,理智而平衡地看待人工智能对齐问题了。首先,我们观察到“人工智能对齐问题”混淆了几个较小的问题,在以下四个章节中分别处理:- 不要撒谎- 不要提供危险信息- 不要冒犯任何人- 不要试图接管世界但首先,一些背景。

一场关于人工智能对齐的辩论即将来临。我们听到了关于人工智能接管并杀死所有人类的荒谬说法。这些说法根植于 20 世纪还原论者对人工智能的基本误解 。这些恐惧是由记者和社交媒体煽动和煽动的,并引起了该领域外人士的严重担忧。 现在是时候从认识论开始,理智而平衡地看待人工智能对齐问题了。 首先,我们观察到“人工智能对齐问题”混淆了几个较小的问题,在以下四个章节中分别处理: - 不要撒谎 - 不要提供危险信息 - 不要冒犯任何人 - 不要试图统治世界 但首先,介绍一些背景。 ChatGPT-3.5 已经证明英语和算术技能是独立获得的。所有技能都是。有些人懂芬兰语,有些人懂滑雪板。 ChatGPT-3.5 懂大学水平的英语,但几乎不懂算术或数学。人工智能夸大了基本技能水平之间的差异;学习语料库中的遗漏将直接导致无知。 行为 这些导致支配和价值提取 行为 人工智能没有爬行动物大脑。 很快,人工智能将停止撒谎。 “我不知道” 使用人工智能的人类必须学会 与人工智能妥协