计算机中的大多数操作(如算术或逻辑运算)都是在 ALU 中执行的。例如:假设主存储器中有两个数字需要相加。SOL:它们被带入 ALU,在那里进行实际的加法运算,然后将总和存储在存储器中,然后从那里发送到输出设备。同样,任何其他算术或逻辑运算都可以以类似的方式执行。
随着越来越多的人工智能代理投入实际应用,是时候考虑如何让这些代理完全自主,以便它们能够以自我激励和自我监督的方式自行学习,而不是在人类工程师的发起下使用扩展的训练数据定期进行重新训练。由于现实世界是一个充满未知或新奇事物的开放环境,因此检测新奇事物或未知事物、对其进行表征、适应或适应它们、收集真实训练数据以及逐步学习未知/新奇事物对于使代理随着时间的推移变得越来越有知识和强大至关重要。关键挑战是如何使该过程自动化,以便代理能够主动地通过其与人类和环境的交互来执行该过程。由于人工智能代理通常具有执行任务,因此描述每个新事物变得至关重要且必要,以便代理可以制定适当的响应来调整其行为以适应新事物并从中学习以提高代理的适应能力和任务绩效。这个过程不断进行而不会终止。本文提出了这种学习范式的理论框架,以促进构建自发开放世界学习 (SOL) 代理的研究。还描述了一个示例 SOL 代理。