我们的2018年筹款活动正在进行中!!

新纸:功能决策理论“

γγ论文

功能决策理论

MIRI高级研究员Eli亚博体育官网ezer Yudkowsky和执行董事Nate Soares就决策理论发表了一篇新的介绍性论文:“功能决策理论:一种新的工具理性理论."“

文摘:

本文描述并激励了一种名为功能决策理论(FDT)区别于因果决策理论和证据决策理论。

功能决策理论家认为,行动的规范原则是把自己的决定当作回答问题的数学函数的输出,“这个函数的哪个输出将产生最佳结果?“坚持这一原则可以带来许多好处,包括在CDT和EDT表现不佳的一系列传统决策论和博弈论问题中最大化财富的能力。使用一个简单且连贯的决策规则,函数决策理论家(例如)在Newcomb问题中比CDT获得更多的效用,在吸烟损害问题上比EDT更有效,而且在帕尔特的搭便车问题中比这两者都更有用。

在本文中,我们拒绝FDT,在许多不同的决策问题中探索它的处方,将其与CDT和EDT进行比较,为FDT作为决策规范理论提供了哲学依据。

我们之前关于FDT的介绍性文件,““大马士革欺诈死亡,“重点比较FDT和CDT、EDT在相当高水平方面的性能。尤德科夫斯基和苏亚雷斯的新论文更加关注FDT的机理和动机,制作“功能决策理论最完整的理论独立介绍。

内容:

1。概述。

2。Newcomb问题和吸烟损害问题。就获得的效用而言,常规EDT在Newcomb问题中优于CDT,而CDT在吸烟损害问题上表现欠佳。因此,CDT和EDT作为预期效用理论都显得不尽如人意,双方的辩论一直处于僵局。FDT然而,为匹配EDT在前一类困境中的性能提供了一个优雅的标准,同时也匹配了CDT在后一类困境中的表现。

三。虚拟依赖。FDT可以被认为是依赖CDT的修改,不是因果依赖,但在更广泛的阶级虚拟的包含作为特殊情况的因果依赖的依赖关系。

4。帕菲特的搭便车旅行者。FDT的新特性在Parfit的搭便车问题中可以更容易地看到,其中CDT和EDT都比FDT性能差。Yudkowsky和Soares注意到了支持FDT优于传统理论的三个因素:来自预承诺的论点,一个来自信息价值的论点,以及来自实用程序的一个论点。

5。使EDT正规化,CDT和FDT。为了给一个给定的决策理论规定一个给定的行动的主张提供精确性,Yudkowsky和Soares定义了实现每个理论的算法。

6。比较三种决策算法的性能。然后,尤德考斯基和苏亚雷斯重新审视纽科姆的问题,吸烟损害问题,帕菲特的搭便车问题,手头有算法。

7。诊断EDT:作为反事实的条件。EDT和CDT的核心问题是它们所考虑的假设场景是畸形的。EDT的工作条件是联合概率分布,当相关性是虚假时,这会导致问题。

8。诊断CDT:不可能的干预。CDT与此同时,通过严格考虑因果反事实来工作,如果错误地将无法避免的相关性视为可以破坏的,则会导致问题。

9:全球视角。FDT的反向推理形式允许代理尊重比CDT更广泛的一组真实世界的依赖关系,同时排除EDT的虚假依赖。我们可以理解FDT反映了全球视角哪些决策理论代理人应该寻求最理想的决策类型,与最理想的决策标记相反。

10。结论。

我们使用这个术语“功能性决策理论因为FDT调用了决策理论代理可以被认为是实现从目标和观察历史到行动的确定性函数的思想。纽科姆问题,FDT特工-我们叫她菲奥娜,如本文中所述,理由如下:

欧米茄知道我将做出的决定——他们以某种方式计算我在相同输入上的相同决策函数,并使用该函数的输出来确定要填充多少个框。假设,然后,我实现输出的决策函数一个盒子。”相同的决策函数,以Omega实现,然后也必须输出”一个盒子。”在这种情况下,欧米茄将填满不透明的盒子,我去拿里面的东西。(+ 1美元,000,000。

或者假设我拿了两个盒子。在这种情况下,我的决策函数输出两盒,“欧米茄会把不透明的盒子留空,我会把这两个盒子里的东西都拿来。(+ 1美元,000。

第一种方案具有较高的期望效用;因此我的决策函数在此输出”一个盒子。”“

与CDT代理不同,CDT代理将自身限制为纯因果依赖,菲奥娜的决策能够考虑欧米茄的行为与她的推理过程之间的依赖关系。结果,菲奥纳会比CDT代理商拿到更多的钱。

同时,FDT避免了EDT遇到的标准陷阱,例如。,在吸烟损害问题上。吸烟损害问题有一些特点,如代理商可能上诉防痒埃勒里·艾尔斯的;但是我们可以用异端讹诈问题,痒的防御对EDT没有帮助。

在异或敲诈的问题中,一个特工听到谣言说他们的房子里有白蚁,修理费是1美元,000,000。第二天,代理人收到值得信赖的预测者Omega留下的信:

我知道你们是否有白蚁,我给你们寄了这封信,如果以下之一是真的:(一)谣言是假的,你要付我1美元,000元一收到这封信;或者(二)谣言属实,你收到这封信就不会付我钱了。

在这种困境中,EDT代理支付,认为得知它们有白蚁是坏消息,尽管它们的白蚁泛滥并不取决于这一事实,因果的或者别的,关于他们是否付款。

相反,FDT的经纪人菲奥娜以与她在纽科姆的问题中表现相似的方式解释:

由于欧米茄决定寄这封信是基于一个可靠的预测是否我会付款,Omega和我必须计算相同的决策函数。假设,然后,我的决策函数输出不付款论输入信。”在我有白蚁的情况下,欧米茄会寄这封信给我,我不会付款。1美元,000,000;如果我没有白蚁,欧米茄不会寄信。0美元

另一方面,假设我的决策函数输出支付“论输入信。”然后,如果我有白蚁,欧米茄没有寄信。1美元,000,000)如果我没有白蚁,欧米茄寄信,我付钱。1美元,000

我的决策函数决定我是否有条件地付款,以及欧米茄是否有条件地发送一封信。但是白蚁没有预测我,根本没有计算我的决策函数。如果我的决策函数的输出是支付,“这不会改变白蚁的行为,对我一点好处都没有;所以我不付钱。

与EDT代理不同,菲奥娜正确地考虑到,在异或讹诈的困境中,付费不会增加她的效用;与CDT代理不同,菲奥纳考虑到了一拳增加她在纽科姆问题上的实用性。

FDT然后,为两种传统理论提供了一个优雅的替代方案,同时在实践中为我们提供了期望效用最大化的更简单、更一般的规则,以及原则上更令人满意的理性决策的哲学解释。

为了进一步讨论FDT,我推荐"“决策是使坏结果不一致的,“探讨为了决定输出什么动作而违背直觉的事实的谈话,决策理论代理人必须能够考虑假设的情形,在这些假设的情形中,他们的确定性决策函数输出某些东西,而不是实际输出的东西。

注册获取新的MIRI技术结果的更新

每次发表新的技术论文时都要得到通知。


  1. “功能决策理论最初是在“大马士革欺诈死亡,“在我们收到来自哲学界的各种反馈之前,时间要长得多。“在大马士革欺骗死亡由从早期草稿中剪下的材料生产;其他切割材料包括基于证据的决策理论,大马士革的一些死亡变种因为对CDT无谓的残忍而留在了手术室地板上。γ
  2. 为了涵盖这方面的混合战略,我们可以假设对代理的感官输入之一是随机数。γ
  3. 代理必须考虑的许多假设在内部是不一致的:确定性函数在给定输入上只有一个可能的输出,但代理人必须根据许多不同的预期效用作出决定“可能”行动是为了选择最好的行动。例如。,在新科姆的问题中,FDT和EDT代理必须评估双拳击的预期效用,以便权衡他们的选择并最终做出决定,即使这样的代理人为双箱代理是不一致的;同样,CDT必须评估不可能的假设的预期效用,其中CDT代理是单箱的。

    虽然在理论上理解不多,这种逆向推理在实践中似乎是完全可行的。即使一个错误的猜想经典地暗示所有的命题,数学家通常用一种有意义的、非平凡的方式来推理,其中假设的情景中,一个猜想具有不同的真值。在形式化环境中如何最好地表示反推理的问题,然而,仍未解决。γ