机器智能与人类利益对齐的代理基础

技术研究议程亚博体育官网


机器智能研究所的任务是确保创造比人类更智能的机器智能具有积极的影响。亚博体育官网虽然这样的系统可能要几十年才亚博体育苹果app官方下载能实现,尽早开始调查是明智的:在安全和可靠性工作中涉及的技术挑战看起来是巨大的,以及独特的结果。

我们的技术议程讨论了六个研究领域,我们认为今天的基础研究可以使未来更容亚博体育官网易开发与人类利益可靠一致的超智能系统。亚博体育苹果app官方下载由于对这种系统的设计或实现细节知之甚少,亚博体育苹果app官方下载下面描述亚博体育官网的研究集中于AI对齐研究的正式代理基础——即,在开发基本概念工具和理论时,这些工具和理论最有可能对将来构建健壮有益的系统有用。亚博体育苹果app官方下载

我们的议程概述文件由六份文件支持,依次激发每个主题。许多易于处理的开放问题贯穿始终,我们希望它能够为渴望在人工智能对准方面进行早期工作的研究人员提供指导。亚博体育官网该信息包最后附有附有注释的目录,总结了每个领域(截至2015年1月)最近的研究。亚博体育官网


机器智能与人类利益对齐的代理基础
Nate Soares和Benja Fallenstein(2014)


现实世界模型的两个问题形式化
Nate Soares(2015)
走向理想化决策理论
Nate Soares和Benja Fallenstein(2015)
逻辑不确定性下的推理问题
Nate Soares和Benja Fallenstein(2015)
文根反射:自改性剂的可靠推理
本杰·法伦斯坦和内特·苏亚雷斯(2015)
正确性
内特·苏亚雷斯,本杰·法伦斯坦,尤多夫斯基,斯图尔特·阿姆斯特朗(2015)
价值学习问题
Nate Soares(2015)

将超智能与人类利益结合起来:
注释书目

Nate Soares(2015)