我们提出了一种人工智能介导的 3D 视频会议系统,该系统可以使用消费级计算资源和最少的捕获设备重建并自动立体显示真人大小的说话头部。我们的 3D 捕获使用一种新颖的 3D 提升方法,将给定的 2D 输入编码为用户的高效三平面神经表示,可以从新颖的视点实时渲染。我们基于人工智能的技术大大降低了 3D 捕获的成本,同时以传统 2D 视频流为代价在接收端提供高保真的 3D 表示。我们基于人工智能的方法的其他优势包括能够同时容纳照片级和风格化的化身,以及能够在多向视频会议中实现相互目光接触。我们演示了我们的系统,使用跟踪立体显示器提供个人观看体验,并使用光场显示器提供房间规模的多观众体验。