嵌入式代理是写了由亚伯兰Demski和Scott Garrabrant,可在AI对准论坛这里。还有的岗位作为一个较短的版本手绘序列,和轻改写版本上的arXiv

我们在下面提供了链接和参考,按照它们在相关主题/部分中出现的顺序列出。


一般

文字简介-图鉴介绍———米里博客后记-后记不清

延伸阅读:“安全心态与普通妄想症“;“机器智能与人类利益协调的Agent基础


决策理论

文字版-画报版本


嵌入式世界模型

文字版-画报版本

延伸阅读:“艾西的问题


强大的代表团

文字版-画报版本

延伸阅读:“全面更新尊重的问题


子系统亚博体育苹果app官方下载对齐

文字版-画报版本

  • 埃利泽·尤多科斯基。2017年“非对抗性原则“。任意
  • 斯科特Garrabrant。2018年“规模稳健性“。少错
  • 埃利泽·尤多科斯基。2015年“万能试验AI安全“。任意
  • 伊恩·古德费洛,让POUGET - 阿巴迪,梅迪·米尔扎,丙戌,大卫·沃德 - 法利,Sherjil Ozair,亚伦库维尔和约书亚·本焦。2014年“生成对抗性篮网“。在神经信息处理系统研究进展亚博体育苹果app官方下载(NIPS)27。
  • 埃利泽·尤多科斯基。2016年“优化后台程序“。任意
  • 埃文Hubinger,克里斯·范·Merwijk,弗拉基米尔Mikulik,Joar Skalse,和斯科特Garrabrant。即将出版。“内层序列问题”。草案。
  • 达里奥Amodei,克里斯·奥拉,雅各布·斯坦哈特,保罗·克里斯蒂,约翰·舒尔曼,和丹鬃毛。2016年“在AI安全的具体问题“。的arXiv:1606.06565 [cs.AI]。