abtract:在道德上可接受的AI发展过程应避免两种危险:创建对人类构成威胁并虐待AI系统的非对齐的AI系统,并以自己的权利为由。本文认为这两种危险相互作用,如果我们创建值得道德考虑的AI系统,同时避免这两种危险将极具挑战性。尽管我们的论点是直接的,并且得到了广泛的自称道德判断的支持,但它对人工智能发展具有深远的道德意义。尽管避免对齐和道德待遇之间的紧张关系的最明显方法是避免创建值得道德考虑的AI系统,但此选项可能是不现实的,也许是短暂的。因此,我们通过为减轻与一致性相关的虐待风险的其他方法提供了一些建议。
主要关键词