7月2021年新闻通讯

||新闻稿

6月2021年6月通讯

||新闻稿

有限的因素集

||文件

这是谈话引入有限因子集的编辑成绩单。对于大多数读者来说,它可能是学习因素集的最佳起点。

视频:

(轻微编辑)幻灯片://www.jayrazon.com/files/Factored-Set-Slides.pdf


(第1部分,标题幻灯片)···有限的因素集




(第1部分,动机)··一些背景


斯科特:所以我想从一些上下文开始。对于尚未熟悉我的工作的人:

  • 我的主要动机是降低存在的风险。
  • 我试着去弄清楚怎么做对齐先进的人工智能。
  • 我试着去做这个试图成为不那么困惑关于情报,优化,代理和集群中的各种东西。
  • 我这里的主要策略是制定一种代理理论嵌入式在他们优化的环境中。我认为这样做有很多打开的艰难问题。
  • 这让我做了一堆奇怪的数学和哲学。这次演讲将会是一些奇怪的数学和哲学的例子。

对于那些已经熟悉我的工作,我只是想说根据我的个人美学,这个谈话的主题就像令人兴奋逻辑归纳也就是说,我对此感到非常兴奋。我对这些观众感到非常兴奋;我很高兴现在能做这个演讲。

阅读更多»

2021年5月通讯

||新闻稿

节省时间

||分析

注:这是有限因子集的序言,我将在接下来的几周发布这个序列。这个周日太平洋时间中午,我将做一个Zoom演讲(关联)介绍了有限因子集,我认为这个框架在技术上和逻辑归纳一样有趣。

更新5月25日:现在提供有限因子集的视频和博客文章这里.)


在过去的几年里,我的大部分研究动机已经旨在节省时间保存的概念,例如,从决策理论问题创建亚博体育官网的所有奇怪的因果环。这篇文章希望解释为什么我非常关心时间,以及我认为需要修复的。

为什么时间?

我在简短描述的最佳尝试是那个时间是因果关系.例如,在珍珠贝叶斯网中,您将边缘从早期节点绘制到更高版本。在我们想考虑因果关系的范围内,我们需要了解时间。

重要的,时间是学习和承诺发生的基础.当代理商学习时,他们会随着时间的推移学习。时间的流逝就像一个仪式机会被摧毁,创造了知识.而且我认为许多学习模式都巧妙地混淆了,因为它们是基于困惑的时间概念。

时间对思考代理也至关重要。我最好的短语定义是那个机构是时间旅行.代理是一种机制,未来能够影响过去。代理模拟其行动的未来后果,并根据这些后果选择行动。在这种意义上,后果原因那个行动尽管该行动在标准物理意义上提前出现了这一事实。

问题:时间是愚蠢的

时间出现问题的主要是“掠夺”。

纽科姆的问题最让人困惑的地方在于,我们总是认为自己的决定是在填满盒子之前做出的,尽管实际上它是在填满盒子之后做出的。这暗示着,除了物理时间,也许我们还想理解其他一些“逻辑”时间。

然而,当我们尝试这样做的时候,我们会遇到两个问题:首先,我们不知道这个逻辑时间可能来自哪里,或者如何学习它,其次,我们会遇到一些明显的时间循环。

我打算把第一个问题放在一边,把重点放在第二个问题上。

最简单的方法看看我们遇到时间循环的原因是注意到它似乎是物理时间至少有一点点与逻辑时间纠缠在一起。

想象一下,有人运行Newcomb问题的物理模拟,并跟踪所有原子的所有细节。从那个角度来看,似乎有一种有用的意义,其中盒子填充到代理人的一个盒子或双箱的决定。然而,与此同时,这些原子撰写了一个不应该做出决定的代理商,尽管它无助地改变任何东西。

也许这里的解决方案是想到有许多不同类型的“之前”和“之后”,“原因”和“效果”等,我们可以说x从代理首先透视图之前是y之前,但是y来自物理学的X.第一透视。

我认为这是对的,我们希望在那里思考许多不同的时间系统(希望可预测地互连)。亚博体育苹果app官方下载但我不认为这会解决整个问题。

考虑一对FAIRBOT.成功执行Löbian握手的代理商在开源囚犯的困境中合作。我想说每个代理商的合作导致其他代理人在某种意义上的合作。我可以说,相对于每个代理的因果的因果/时间顺序是不同的方式,但我认为循环是这种情况下结构的重要组成部分。(我也不肯定我想要与哪个代理商关联的时间。)

我们也旨在以其他原因在我们的时间/因果关系中放回循环。例如,当在持续时间持续存在的系统中建模反馈回路时,我们可能会绘制看起来很像贝叶斯网的结构,但不是亚博体育苹果app官方下载acclic(例如,pomdp)。我们可以将此视为另一个系统的投影,其中包含时间额外的时间,但它是一个有用的投影。亚博体育苹果app官方下载

解决方案:抽象

我的主要希望恢复连贯的时间概念和解开这些时间循环是通过抽象的。

在代理基于其后果选择措施的示例中,我认为有一个抽象模型的后果,这些后果可能会在选择之前出现在实际的身体后果之前。

在Newcomb的问题中,我想说,在填充盒子之前,有一个抽象的动作模型。

在开源囚犯的困境中,我想说有一个抽象的合作证明,在代理的实际程序痕迹之前会因果上出现。

所有这些都指向相同的方向:我们需要粗略抽象版本的结构在不同的时间内与相同结构的更精细的版本不同。也许当我们正确允许不同的不同级别的因果链中具有不同的链接时,我们可以解开所有时间循环。

但如何?

不幸的是,我们对时间的最佳理解是珍珠因果关系,而珍珠因果关系与抽象不好。

Pearl的贝叶斯网有很多变量,但当其中一些变量是其他变量的粗糙抽象版本时,我们就必须考虑决定论,因为我们的一些变量将是彼此的决定论函数;《珍珠》的精华部分与决定论格格不入。

但问题比这更深。如果我们在确定性函数的方向上绘制箭头,我们将从更精细地绘制时间的时间箭头到该结构的较粗糙版本,这与我们所有示例的相反方向。

也许我们可以避免将这个箭头从更精细的节点绘制到更粗糙的节点,而是使用一条从更精细的节点到更精细的节点的路径。然后我们可以复制粗糙节点的另一个副本,它肯定位于更精细节点的下游,不添加新的自由度。那么是什么阻止我们交换粗糙节点的两个副本呢?

总的来说,在我看来,Pearl还没有准备好让一些节点成为其他节点的抽象版本,我认为为了节省时间,需要对这些节点进行修复。


讨论:胜败

我们的全时最大的捐赠,以及Vitalik Buterin的主要Crypto支持

||消息

我很激动到Miri宣布两项重大捐款!

首先,长期支持者在迄今为止提供了Miri,我们最大的捐款:未来四年每年250万美元,2025年额外〜560万美元

这种匿名捐赠来自加密货币投资者以前捐赠了yabo体育官网下载ios2017年ETH到Miri $ 1.01米。他们令人惊讶的新捐款以3001 MKR,治理代币的形式提供Makerdao.,Ethereum区块链上的Stablecoin项目。收到后,MIRI将捐赠的MKR换算为15yabo体育官网下载ios,592,829美元。通过这种捐款,匿名捐赠者成为我们最大的历史支持者。

这项捐赠受时间限制,MIRI可以在未来四年(2021-2024年)的每一年最多花费250万美元。剩余的5,592,829美元将在2025年提供。

其次,在其他惊人的消息中,昨天弗里纳姆的Impereum,Vitalik·帕特林的发明者和联合创始人给了我们令人惊讶的捐款1050年的欧洲人体,价值4378159美元

这是迄今为止对MIRI研究项目的第三大贡献,仅次于开放慈善亚博体育官网2020年津贴〜7700万美元和上面的匿名捐款。

Vitalik先前捐赠了超过100万美元的Miyabo体育官网下载iosri,包括我们2017年筹款司机的主要支持。

我们无法感谢这两个前所未有的个体礼物!两个捐助者都感谢你的衷心感谢。

2021年4月通讯

||新闻稿

2021年3月通讯

||新闻稿