有限因素套装

||分析

这是谈话引入有限因子集的编辑成绩单。对于大多数读者来说,它可能是学习因素集的最佳起点。

视频:

(轻编辑)幻灯片://www.jayrazon.com/files/Factored-Set-Slides.pdf


(第一部分,标题幻灯片)···有限因素套装




(第一部分,动机)···一些背景


斯科特:所以我想从一些上下文开始。对于尚未熟悉我的工作的人:

  • 我的主要动机是减少生存风险。
  • 我试图通过试图弄清楚如何做到这一点对齐先进的人工智能。
  • 我努力做到通过努力成为不那么困惑关于智能和优化和机构以及该集群中的各种事物。
  • 我的主要策略是发展一种关于嵌入式在他们优化的环境中。我认为这样做有很多打开的艰难问题。
  • 这让我做了一堆奇怪的数学和哲学。这个谈话将成为一些奇怪的数学和哲学的一个例子。

对于那些已经熟悉我的工作,我只是想说根据我的个人美学,这个谈话的主题就像令人兴奋逻辑归纳也就是说,我真的很兴奋。看到这些观众,我真的很兴奋;我很高兴现在能做这个演讲。


(第1部分,目录)···要修理谈话


此谈话可以分为2部分:

第1部分,简短的纯数学组合谈话。

第2部分,一个更适用和哲学的主要谈话。

这个谈话也可以分裂5.零件用颜色差异:标题幻灯片动机目录主体, 和例子.把这些组合起来,我们得到了10个部分(其中一些不是连续的):

第1部分:短暂的谈话 第二部分:主要谈话
标题幻灯片 有限因素套装 主谈(这是关于时间)
动机 一些背景 珍珠范式
目录 要修理谈话 我们可以做得更好
主体 设置分区, 等等。 时间和正交性, 等等。
例子 枚举因素 生活游戏, 等等。


(第1部分,主体)···设置分区


好吧。这是一些背景数学:

  • 一种分区一个集合\(s \)是\(s \)的非空子集的集合\(x \),调用部分,使每个\(s∈s\)在\(X\)中存在包含\(s\)的唯一部分。
  • 基本上,\(s \)的分区是将\(s \)视为不相交的联盟的方法。我们有彼此不相交的部件,他们将联合在一起形成\(s \)。
  • 我们将为\(s \)的所有分区集编写\(\ mathrm {part}(s)\)。
  • 我们会说分区\(x \)是不重要的如果它恰好有一个部分。
  • 我们将使用括号表示法,\([S] _ {x} \),以表示包含\(s \)的\(x \)中的唯一部分。所以这就像给定元素的等价类。
  • 然后我们将使用符号\(s〜{x} t \)来说,两个元素\(s \)和\(t \)在同一部分中\(x \)。

您也可以将分区视为与set \(s \)上的变量相同。以这种方式观看,分区\(x \)的值对应于元素所在的部分。

或者你可以想到\(x \)作为一个问题您可以询问有关泛型元素的\(S\)。如果我有一个\(S\)元素,它对你是隐藏的,你想问一个关于它的问题,每个可能的问题对应一个分区,根据不同的可能的答案分割\(S\)。

我们也将使用晶格结构分区:

  • We’ll say that \(X \geq_S Y\) (\(X\) is finer than \(Y\), and \(Y\) is coarser than \(X\)) if \(X\) makes all of the distinctions that \(Y\) makes (and possibly some more distinctions), i.e., if for all \(s,t \in S\), \(s \sim_X t\) implies \(s \sim_Y t\). You can break your set \(S\) into parts, \(Y\), and then break it into smaller parts, \(X\).
  • \(x \ vee_s y \)(\(x \)和\(y \)的常见细化是比\(x \)和\(y \)更精细的粗糙分区。这是唯一的分区,它使得\(x \)或\(y \)所做的所有区别,而且没有其他区别。这是明确的,我不会在这里展示。

希望这主要是背景知识。现在我想展示一些新东西。


(第1部分,主体)···设置accipizations.


一种分解一个集合\(s \)是一个\(s \)的非活动分区的集合\(b \),调用因素,使每一种从\(B\)中的每个因子中选择一个部件的方法,在这些部件的交点中存在唯一的\(S\)元素。

所以这可能有点密集。我的简短标记线是:“\(s \)的分解是一种观看\(s \)作为产品的方法,以与分区是一种观看\(s \)作为一个方法不相交联盟。“

如果你从第一次演讲中得到一个定义,它应该是因式分解的定义。我会试着从不同的角度来解释它,以帮助传达这个概念。

if \(b = {b_0,\ dots,b_ {n} \} \)是\(s \)的分解,那么存在\(s \)和\(b_0 \ times \ dots \之间的两突发\(s \ mapsto([s] _ {b_0},\ dots,[s] _ {b_ {n}})给出的次数b_ {n})。该双射将从\(s \)的元素发送到只有包含该元素的部件组成的元组。并且由于这种自由度,\(| s | = \ prod_ {b \ in b} | b | \)。

因此,我们真的将\(s \)视为这些个体因素的产品,没有额外的结构。

虽然我们不会在这里证明这一点,但您可以验证的其他东西是一个因子中的所有部分都必须具有相同的大小。

我们将为\(s \)的所有acchiachiation集合编写\(\ mathrm {事实}(s)\),我们会说一个有限的成分集是一对\((s,b)\),其中\(s \)是一个有限集和\(b \ in \ mathrm {suf} \)。

请注意,\(s \)和\(b \)之间的关系有点循环。如果我想定义一组因子,我可以使用两种策略。我可以首先介绍\(s \),并将其分为因素。或者,我可以首先介绍\(b \)。任何当我有一个有限集合(B)的有限集合时,我可以取它们的乘积,从而产生一个(S),对退化情况取模其中一些集合是空的。所以\(S\)可以是任意有限集合的有限集合的乘积。

对我的眼睛来说,这种因素的概念非常自然。它基本上是集分区的乘法模拟。我真的想推动那一点,所以这是另一种推动这一点的尝试:

一种分区是一个设置\(x \)非空的
子集\(s \)这样明显的
功能不相交的联盟
\(x \)的元素\(S\)是双射词。
一种分解的集合是什么非琐碎
分区\(s \)这样明显的
功能产品
\(b \)的元素\(S\)是双射词。

我可以从之前的分区定义进行略微修改的版本,并在一系列单词中进行两种单词,并取出设置的分解定义。

希望你们现在相信这是一个非常自然的概念。

安德鲁·克克:斯科特在一个意义上,您将“子集”视为双重分区,我认为是有效的。然后在另一个意义上,你将“分解”视为双重分区。那些都有效,但也许值得谈论两种二元性。

斯科特:是的。我认为有什么样的方法可以查看分区。您可以将分区视为“双向子集的分区”,并且您也可以将分区视为从子集中建立的内容。这两个不同的观点在双重化时会做出不同的事情。

Ramana Kumar:我正要去检查:你说你可以从一个任意的\(B\)开始,然后从它构建\(S\)。它可以是任意的集合,然后总是有一个\(S\)…

斯科特:如果其中没有一个是空的,则是,您可以采取一系列是任意元素的集合。您可以拍摄其产品,您可以识别一个设置投影到该元素的产品子集的每个元素。

Ramana Kumar:啊。所以\(s \)在那种情况下只会是元组。

斯科特:这是正确的。

布伦丹方:斯科特,给定了一套,我发现很容易提出分区。但我发现患者难以容易提出。你有什么技巧吗?

斯科特:为此,我应该继续前进。

发言人1:在你这样做之前,我可以问一件事吗?您允许因素在其中有一个元素吗?

斯科特:我说“不动性”,这意味着它没有一个元素。

发言人1:“非动力”意味着“没有一个元素,而不是没有元素”?

斯科特:不,空集有分区(没有零件),我会称之为不动的。但空套的东西并非如此至关重要。

我现在要继续一些例子。


(第1部分,实施例)···枚举因素


锻炼!SET的适应性是什么?(\ {0,1,2,3 \} \)?

扰流器空间:

首先,我们要做一个平凡的因式分解

\(\{开始分裂 } \{ \ \ \{ \{ 0 \} \ {1 \} \ \ {2}, {3 \} \} \ \ \} \ {{分裂}\开始分裂结束 } \ \ \ \ \ 强调{\ 0 1 \ \ \ \ \ \ 2 \ \ 3 \ \}\{分裂}\)结束

我们只有一个因子,这个因子就是离散分割。你可以对任何集合这样做,只要你的集合至少有两个元素。

回想一下,在分解的定义中,我们希望为从每个因素选择一个部分的方式,我们在这些部分的交叉点中有一个唯一的元素。由于我们这里只有一个因素,满足定义只需要从离散分区选择一个部分,因此存在于该部分中的唯一元素。

然后我们想要一些较少的琐碎的因素。为了有一个分解,我们将需要一些分区。我们分区的基数的产物将不得不等于我们集合的基数,即4。

将4表示为非平凡乘积的唯一方法是将它表示为\(2 \乘以2\)。因此我们要寻找有两个因子的因式,每个因子有两部分。

我们之前注意到,一个因子中的所有部件必须是相同的尺寸。我们要找两个分区每个分区都能把4个元素的集合分成2个大小为2的集合。

So if I’m going to have a factorization of \(\{0,1,2,3\}\) that isn’t this trivial one, I’m going to have to pick 2 partitions of my 4-element set that each break the set into 2 parts of size 2. And there are 3 partitions of a 4-element sets that break it up into 2 parts of size 2. For each way of choosing a pair of these 3 partitions, I’m going to get a factorization.

\(\ begin {split} \ begin {bmatrix} \ \ \ \ {\ {0,1 \},\ {2,3 \} \},\ \\ \ {\ {0,2 \},\ {1那3.\}\} \end{Bmatrix} \end{split} \begin{split} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \begin{array} { |c|c|c|c| } \hline 0 & 1 \\ \hline 2 & 3 \\ \hline \end{array} \end{split}\)

\(\ begin {split} \ begin {bmatrix} \ \ \ \ \ {\ {0,1 \},\ {2,3 \} \},\ \\ \ {\ {0,3 \},\ {1那2\}\} \end{Bmatrix} \end{split} \begin{split} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \begin{array} { |c|c|c|c| } \hline 0 & 1 \\ \hline 3 & 2 \\ \hline \end{array} \end{split}\)

\(\ begin {split} \ begin {bmatrix} \ \ \ \ {\ {0,2 \},\ {1,3 \} \},\ \\ \ {\ {0,3 \},\ {1那2\}\} \end{Bmatrix} \end{split} \begin{split} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \begin{array} { |c|c|c|c| } \hline 0 & 2 \\ \hline 3 & 1 \\ \hline \end{array} \end{split}\)

因此,将有4个要素设置的4个要素。

一般来说,你可以问,“有多少尺寸尺寸\(n \)?”。这是一个小图表,显示\(n \ LEQ 25 \)的答案:

\(| s | \) \(| \ mathrm {事实}(s)| \)
0. 1
1 1
2 1
3. 1
4. 4.
5. 1
6. 61.
7. 1
8. 1681.
9. 5041
10. 15121.
11. 1
12. 13638241
13. 1
14. 8648641.
15. 1816214401
16. 181880899201.
17. 1
18. 45951781075201
19. 1
20. 3379365788198401
21 1689515283456001
22 14079294028801
23 1
24 4454857103544668620801
25 538583682060103680001

你会注意到,如果\(n \)是素数,则会有一个单一的分解,希望有意义。这是只有一个因素的分解。

一个让我非常惊讶的事实是这个序列没有出现oeis.,这是该数据库,该数据库组合用于检查他们的序列是否已经在之前研究过,并查看与其他序列的连接。

对我来说,这感觉就像乘法版本贝尔号码.Bell数计算一组大小为\(n\)的分区的数量。OEIS的110号序列号超过30万;这个序列根本就不会出现,即使我调整它,删除退化的情况等等。

我对这个事实非常困惑。对我来说,沉思似乎是一个极其自然的概念,在我看来看起来并没有真正研究过。

这是我的短组合谈话的结束。

Ramana Kumar:如果您愿意这样做,我会感谢刚刚介绍要素和定义的一个例子,因为这对我来说很新。

斯科特:是的。让我们经历第一个非\(\ {0,1,2,3 \} \)的非活动分解:

\(\ begin {split} \ begin {bmatrix} \ \ \ \ {\ {0,1 \},\ {2,3 \} \},\ \\ \ {\ {0,2 \},\ {1那3.\}\} \end{Bmatrix} \end{split} \begin{split} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \begin{array} { |c|c|c|c| } \hline 0 & 1 \\ \hline 2 & 3 \\ \hline \end{array} \end{split}\)

在定义中,我表示,一个分解应该是一组分区,使得对于从每个分区选择一个部分的方式,这些部分的交叉点将存在唯一的元素。

在这里,我有一个分隔小数字和大数字的分区:\(\{\{0,1\},\{2,3\}\)。我还有一个分隔偶数和奇数的分区:\(\{\{0,2\},\{1,3\}\)。

重点是,对于每一种选择“小”或“大”或选择“偶数”或“奇数”的方法,都会有一个唯一的元素,即这两个选择的结合。

在另外两个非平凡因子分解中,我用“内部和外部”的区别代替了“小和大”或“偶和奇”。

David Spivak:对于分区和许多事情,如果我知道集合\(a \)的分区和set \(b \)的分区,那么我知道一些\(a + b \)的分区(不相交的union)或者我知道一些\(a \ times b \)的分区。您是否知道要素的任何事实?

斯科特:是的。如果我有两个因子集,我可以在它们的乘积上得到一个因子集,这有点像是将这两个因子集合分离并集。对于加法运算,你不会得到这样的结果因为质数集没有任何非平凡因子分解。

好吧。我想我要进入主题了。


(第2部分,标题幻灯片)···主谈(这是关于时间)




(第2部分,动机)···珍珠范式


没有谈论,我们无法谈论时间珍珠因果推断.我想首先说我认为珍珠范式很棒。这给了我一些裂缝点,但我会说这是我们对爱因斯坦以来的时间的理解是最好的。

我不会在这里进入珍珠范例的所有细节。我的谈话在技术上不会依赖它;它在这里是为了动力。

鉴于这些变量的变量集合和联合概率分布,珍珠可以推断变量之间的因果/时间关系。(在这个谈话中,我将互换使用“因果”和“颞”,但在这里可能有更有趣的事情哲学。)

珍珠可以从统计数据推断时间数据,这是违背“相关性并不意味着因果关系”的格言。这就像珍珠正在采取相关性的组合结构,并使用它来推断出来,我认为这真的很棒。

Ramana Kumar:我可能错了,但我认为这是假的。或者我认为这并非所有珍珠需求 - 只是对变量的联合分布。他还没有使用干预分布吗?

斯科特:在本书中第二章中描述的理论中因果关系,他并不真正使用其他东西。珍珠在其他地方建立了这种更大的理论。但是你有一些强有力的能力,也许假设简单或任何(但不是假设您可以访问额外信息),以获取变量的集合和这些变量的联合分布,并从相关性推断出来。

安德鲁·克克:Ramana,它取决于潜在因果图的结构。对于一些因果图,您实际上可以唯一的恢复,没有干预措施。只需要具有零测量异常的假设,这真的很强大。

Ramana Kumar:对,但是你用的信息是图像。

安德鲁·克克:不你不是。只是联合分布。

Ramana Kumar:哦好的。对不起,继续前进。

安德鲁·克克:这re exist causal graphs with the property that if nature is generated by that graph and you don’t know it, and then you look at the joint distribution, you will infer with probability 1 that nature was generated by that graph, without having done any interventions.

Ramana Kumar:知道了。那讲得通。谢谢。

斯科特:凉爽的。

不过,我打算(稍微)反对这一点。我要去认领珍珠在制作此推断时的作弊。我要指出的是,在句子中,在“给定变量的集合和这些变量上的联合概率分布,珍珠可以推断变量之间的因果/时间关系。”,给定集变量之间的单词是实际上隐藏了很多工作。

强调通常符合联合概率分布,但珍珠不是单独从统计数据推断出时间数据。他从统计数据推断出时间数据和分解数据:世界如何分解为这些变量。

我认为这个问题还与未能充分处理抽象和决定论有关。为了说明这一点,我们可以这样说:

“好吧,如果我拍摄了珍珠问题的变量,我怎么办我只是忘记那个结构?我可以拍摄我给出的所有这些变量的产物,并考虑我所赋予的变量产品的所有分区的空间;每个分区中的每个分区都将是自己的变量。然后我可以尝试在这大珠子的因果推断下,我通过忘记给我的变量的结构而得到的所有变量。“

问题是,当你这样做的时候,你有一堆相互之间具有确定性的函数的东西,你实际上不能用Pearlian范式来推断东西。

所以在我看来,这种作弊与Pearl的范例并不适合处理抽象和决定论这一事实纠缠在一起。


(第2部分,目录)···我们可以做得更好


我们将在这次谈话中做的主要事情是我们将介绍一个不依赖于分解数据的珍珠的替代品,因此随着抽象和决定论更好地工作。

如果珍珠被赋予了一系列变量,我们将考虑给定集的所有分区。珍珠揭开了一条定向的无循环图,我们将推断有限的成分集。

在珍珠世界,我们可以看看图表并读取时间和正交/独立性的属性。节点之间的定向路径对应于在另一个节点之前,如果它们没有公共祖先,则两个节点是独立的。同样,在我们的世界中,我们将能够读取有限因素集的时间和正交。

(正交和独立性都很相似。当我谈论一个组合概念时,我会使用“正交性”这个词,当我谈论概率概念时,我会使用“独立”。)

在珍珠的世界里,D.-分离,你可以从图上读出来,它对应于所有概率分布的条件独立性,你可以把它放到图上。我们将得到一个基本定理它基本上说的是同样的事情条件正交对应于条件独立性在所有的概率分布中我们可以放到因式集合中。

在珍珠的世界里,D.-Separation将满足组成石膏公理。在我们的世界中,我们只是为了满足组成的半极光道公理。第五条石膏公理是我声称您甚至不应该迄今为止的意义。

珀尔做因果推理。我们将讨论如何使用这种新的范式进行时间推断,并推断一些珀尔的方法无法做到的基本时间事实。(请注意,Pearl有时也可以推断时间关系我们无法 - 但仅从我们的角度来看,因为珍珠正在进行额外的分解假设。)

然后我们会讨论一些应用。

珍珠 这个演讲
一个给定的变量集合 给定集的所有分区
有向无环图 有限的因素集
节点之间的定向路径 “时间”
没有共同的祖先 “正交性”
D.- “有条件的正交性”
成分Graphoid 组成半映射
D.- 分子↔有条件独立性 基本的定理
因果推断 时态推理
许多应用程序 许多应用程序

除了动机、目录和示例部分外,这个表还可以作为两个演讲的大纲。我们已经讨论了集合划分和有限因式集合,现在我们要讨论时间和正交性。


(第二部分,主体)···时间和正交性


我认为如果从谈话的第二部分捕获一个定义,那应该是这个。鉴于一个有限的因素集作为上下文,我们将定义分区的历史记录。

设\(F = (S,B)\)是一个有限因子集。设\(X, Y)中的\(Part}(S)\)是\(S)的分区。

历史\(x \),写入\(h ^ f(x)\),是最小的因素集\(h \ subseteq b \),使得所有\(s,t \在s \中),如果\(s \ sim_b t \)对于所有\(b \ in h \),然后\(s \ sim_x t \)。

\ (X \)的历史,然后,是最小的一组因素\ (H \)所以,\ B \)——的最小子集,如果我把一个元素\(\)我从你隐藏它,你想知道哪一部分\ (X \)在,只要我告诉你它是哪一部分的每个因素\ (H \)。

所以历史记录\(H)是\(S)的因子集合,知道\(H)中所有因子的值就足以知道\(X)的值,或者知道给定元素在\(X)中的哪个部分。我很快会给出一个例子,可能会让这个更清楚。

然后我们来定义时间来自历史。我们会说\(x \)是弱之前\(y \),写入\(x \ leq ^ f y \),if \(h ^ f(x)\ subseteq h ^ f(y)\)。我们会说\(x \)是严格之前\(y \),写入\(x <^ f y \),if \(h ^ f(x)\ subset h ^ f(y)\)。

我们可以做一个类比,这些历史就像时空中某个点过去的光锥。当一个点在另一个点之前,那么前面一点的后光锥将是后面一点的后光锥的子集。这有助于说明为什么“before”可以像子集关系。

我们也将从历史上定义正交性。我们会说两个分区\(x \)和\(y \)是正交写\ (X \补^ \)财政年度,如果他们的历史是不相交的:\ (h ^ F (X) \帽h ^ F (Y) = \{\} \)。

现在我要经历一个例子。


(Part 2, example)·····生活游戏


让\(s \)是从\([ - n,n] \ times [-n,n] \)板开始的所有生命游戏的集合。

Let \(R=\{(r,c,t)\in\mathbb{Z}^3\mid0\leq t\leq n,\ \) \(|r|\leq n-t,\ |c|\leq n-t\}\) (i.e., cells computable from the initial \([-n,n]\times[-n,n]\) board). For \((r,c,t)\in R\), let \(\ell(r,c,t)\subseteq S\) be the set of all computations such that the cell at row \(r\) and column \(c\) is alive at time \(t\).

(Minor footnote: I’ve done some small tricks here in order to deal with the fact that the Game of Life is normally played on an infinite board. We want to deal with the finite case, and we don’t want to worry about boundary conditions, so we’re only going to look at the cells that are uniquely determined by the initial board. This means that the board will shrink over time, but this won’t matter for our example.)

\(s \)是所有生活游戏的集合,但由于生命游戏是确定性的,所以所有计算的集合都与所有初始条件的集合相对应。所以\(| s | = 2 ^ {(2n + 1)^ {2}} \),初始板状态的数量。

这也为我们提供了对所有生命游戏集合的一个很好的分解。For each cell, there’s a partition that separates out the Game of Life computations in which that cell is alive at time 0 from the ones where it’s dead at time 0. Our factorization, then, will be a set of \((2n+1)^{2}\) binary factors, one for each question of “Was this cell alive or dead at time 0?”.

正式:\ ((r、c、t) \ r \),让\ (L_ {(r、c、t)} = \{\魔法(r、c、t), S \ setminus \厄尔(r、c、t) \} \)。让\ (F =(年代,B) \),在那里\ (B = \ {L_ {(r、c、0)}\ n \ leq中期r c \ leq n \} \)。

我们还可以在这组所有生命游戏计算中讨论其他分区。例如,您可以取一个单元格和一个时间(t)并说,“这个单元格在时间(t)时是活的吗?”,将会有一个分区将计算单元在第\(t)时刻是活的计算和在第\(t)时刻是死的计算分开。

这里有一个例子:

最低网格显示初始板状态的一部分。

上板上的蓝色,绿色和红色方块是(细胞,时间)对。每个方块都对应于所有生命游戏集合的分区,“在给定的时间\(t \)存在或死亡是\(t \)?”

该分区的历史将是初始板中所有计算单元在时间\(t\)时是活的还是死的单元。它是计算细胞状态所涉及的一切。例如,知道第一块板中9个浅红色细胞的状态总是能告诉你第二块板中红色细胞的状态。

在该示例中,对应于红小区状态的分区是严格地在与蓝单元对应的分区之前。红色细胞是否活着或死亡的问题是在蓝色细胞活着或死亡的问题之前。

同时,红细胞是否活着或死亡的问题将是正交对于绿色细胞是否活着或死亡的问题。

和蓝色细胞是否活着或死亡的问题是不是与绿色细胞是活着还是死的问题,因为它们与青色细胞相交。

概括点,修复\(x = l _ {(r_x,c_x,t_x)},y = l _ {(r_y,c_y,t_y)} \),其中\((r_x,c_x,t_x),(r_y,c_y,t_y)\在r \)。然后:

  • \(h ^ {f}(x)= \ {l _ {(r,c,0)} \ in b \ mid | \ leq t_x,| c_x-c | \ leq t_x \} \)。
  • \(x \ᐸ^ {f} \ y \)如果才可\(t_x \ᐸ\ t_y \)和\(| r_y-r_x |,| c_y-c_x | \ leq t_y-t_x)。
  • \ (X \ F补^ Y \)当且仅当\ (| r_Y-r_X | > t_Y + t_X \)或\ (| c_Y-c_X | > t_Y + t_X \)。

我们还可以看到蓝色和绿色细胞的样子几乎正交。如果我们在历史交叉口中的两个青色细胞的值,然后蓝色和绿色分区变得正交。这就是我们接下来要讨论的事情。

David Spivak:先验,这将是一个巨大的计算 - 能够告诉我你理解那种生命游戏的分解结构。那么你用什么能够制作那种索赔的直觉,所以它具有你暗示在那里的分解结构?

斯科特:我已经定义了因式分解结构。

David Spivak:你已经给了我们一定的分解。所以不知何故,你有一个非常好的直觉历史, 我猜。也许这就是我询问的。

斯科特:是的。所以,如果我没有给你分解,那么你可以在这里放在这里的这种讨厌的因素数量。然后对于历史,我正在使用的直觉是:“我需要知道什么,以计算这个值?”

我在《生命的游戏》中做了一个小装置来确保我在这里,每个细胞在某些情况下都能影响这些细胞。但是,我的直觉主要是关于计算中的信息。而是"我能不能构造一个情境如果我知道这个事实,我就能计算出这个值?如果我不能,那么它可以取两个不同的值。”

David Spivak:好的。我认为导出从定义中的直觉是我缺少的东西,但我不知道我们是否有时间通过​​它。

斯科特:是啊,我想我不会去的。


(第二部分,主体)···条件正交性


所以,只是为了设置你的期望:每次我向某人解释珍珠因果推论,他们都这么说D.-分离是他们记不住的事情。D.- 比珍珠中珍珠中的“没有任何共同祖先”和“没有任何共同祖先之间的指向的路径更复杂的概念;同样,条件正交性比我们范例中的时间和正交性更复杂。虽然我确实认为有条件的正交性具有比较简单更简单的定义D.- 酸化。

我们将从条件历史的定义开始。我们再次拥有固定的有限集作为我们的上下文。让\(f =(s,b)\)是一个有限的因子集,让\(x,y,z \ in \ text {part}(s)\),让\ \(e \ subseteq s \)。

已知\(E\)的\(X\)条件历史,写成\(h^F(X|E)\),是满足以下两个条件的最小因子\(h \subseteq B)的集合:

  • 对于所有\(s,t \在e \)中,如果\(s \ sim_ {b} t \)所有\(b \ in h \),那么\(s \ sim_x t \)。
  • 所有\ E (s t \ \) \ (r \ s \),如果\ (r \ sim_ {b_0} \)为所有\ (H b_0 \ \)和\ (r \ sim_ {b_1} t \)为所有\ (b_1 \ B \ setminus H \),然后\ (E r \ \)。

第一个条件很像我们在我们对历史的定义中的条件,除了我们将假设我们处于\(e \)。So the first condition is: if all you know about an object is that it’s in \(E\), and you want to know which part it’s in within \(X\), it suffices for me to tell you which part it’s in within each factor in the history \(H\).

我们的第二个条件实际上并没有提及\(x \)。这将是\(e \)和\(h \)之间的关系。它说,如果要弄清楚\(s \)的元素是否处于\(e \),则足以并行化并提出两个问题:

  • “如果我只查看\(h \)中的因素的值,就是'这一点是\(e \)'与该信息兼容?”
  • “如果我只看看\(b \ setminus h \)中的因素的值,那么'这一点是\(e \)'与该信息兼容吗?”

如果这两个问题都返回“是”,那么点必须处于\(e \)。

我不会给出一个直观的解释为什么这需要成为定义的一部分。我要说的是,如果没有第二个条件,条件历史甚至无法定义,因为它在交点下不会闭合。所以我不能在子集排序中取最小的因子集合。

我不是通过解释它背后的直觉来证明这个定义,而是通过使用它并诉诸于它的结果来证明它。

我们将使用条件历史来定义条件正交性,就像我们使用历史来定义正交性。我们说\(x \)和\(y \)是正交给出\(e \ subseteq s \),写入\(x \ perp ^ {f} y \ mid e \),如果给定的\(x \)历史记录\(e \)与\(y的历史记录是不相交的给定\(e \):\(h ^ f(x | x | e)\ cap h ^ f(y | e)= \ {\} \)。

我们说\(x \)和\(y \)是正交给出\(z \ in \ text {part}(s)\),写入\(x \ perp ^ {f} y \ mid z \),if \(x \ perp ^ {f} y \ mid z \)for所有\(z \ z \)。所以在给定分区的情况下,它意味着正交的是什么,鉴于分区可能是分区的每个单独的方式,每个单独的方式都是正交。

我已经做了一段时间了,我觉得这很自然,但我没有一个好的方法来推动这种情况的自然。所以,我还是想诉诸于结果。


(第二部分,主体)···成分Semigraphoid公理


条件正交性满足成分semigraphoid公理,这意味着有限的成分集是相当良好的。

设\(F=(S,B)\)是一个有限因子集,设\(X,Y,Z,W)在\text{Part}(S)\)中是\(S)的分区。然后:

  • 如果\(x \ perp ^ {f} y \ mid z \),那么\(y \ perp ^ {f} x \ mid z \)。(对称
  • 如果\ (X \补^ {F} Z中期(Y \ vee_S W) \ \),然后\ (X \补^ {F} Y中期\ Z \)和\ (X \补^ {F} W \ Z中期\)。(分解
  • 如果\(x \ perp ^ {f}(y \ vee_s w)\ mid z \),那么\(x \ perp ^ {f} y \ mid(z \ vee_s w)\)。(弱盟
  • 如果\(x \ perp ^ {f} y \ mid z \)和\(x \ perp ^ {f} w \ mid(z \ vee_s y)\),那么\(x \ perp ^ {f}(y\ vee_s w)\ mid z \)。(收缩
  • 如果\(x \ perp ^ {f} y \ mid z \),如果\(x \ perp ^ {f} w \ mid z \),那么\(x \ perp ^ {f}(y \ vee_s w)\ mid z \)。(作品

此处的前四个属性构成了半映射公理,略微修改,因为我正在使用分区而不是变量集,所以联盟被常用的细化替换。还有另一个石灰石公理,我们不会满足;但我认为我们不想满足它,因为它与决定论没有很好。

第五个性质,复合,可能是最不直观的,因为它不完全满足概率独立性。

分解和组成是彼此的相互关系。在整个\(z \)上的调节,他们说\(x \)与\(y \)和\(w \)正交,如果\(x \)与常用改进\(x \)是正交的\(y \)和\(w \)。


(第二部分,主体)···基本的定理


除了表现良好,我还想表明条件正交性很强大。我想要做到这一点的方式是通过显示条件正交性完全对应于您可以放在有限因子集中的所有概率分布中的条件独立性。因此,很像D.在Pearlian图中,条件正交性可以被认为是概率独立性的组合版本。

一种有限因子集的概率分布\(f =(s,b)\)是\(s \)上的概率分布\(p \),可以被认为是从一堆独立概率分布的\(b \)。所以\(p(s)= \ prod_ {b \中的b} p([s] _b)\)所有\(s \中的s \)。

这实际上意味着你的概率分布因数与集合因数相同:任何给定元素的概率是它在每个因数中的每个单独部分的概率的乘积。

有限因子集的基本定理说:让\(f =(s,b)\)是一个有限的因子集,让\(x,y,z \ in \ text {part} \)是\(s \)的分区。然后\(x \ perp ^ {f} y \ mid z \)如果且仅在\(f \)上的所有概率分布\(p \),并且所有\(x \中),\(y\在y \)中,\(z \在z \中),我们有\(p(x \ cap z)\ cdot p(y \ cap z)= p(x \ cap y \ cap z)\ cdot p(z)\)。即,\(x \)与\(z \)of \(z \)在所有概率分布中满足时\(z \)。

对我来说,这个定理有点不可能证明。我不得不通过定义与子集相关的某些多项式,然后在这些多项式的空间中处理独特的分解;我认为证据是八页或其他东西。

基本定理允许我们从概率数据中推断出正交数据。如果我有一些经验分布,或者我有一些贝叶斯分发,我可以使用它来推断一些正交性数据。(我们还可以想象来自其他来源的正交性数据。)然后我们可以使用这种正交性数据来获得时间数据。

所以接下来,我们将讨论如何从正交数据获取时间数据。


(第二部分,主体)···时态推理


我们从一个有限集合开始,也就是我们的样本空间。

您可能认为我们会尝试做的一个天真的事情是推断出\(\ omega \)的分解。我们不会那样做,因为这将过于限制性。我们想要允许\(\ omega \)来隐藏我们的一些信息,因为有一些潜在结构和这样。

可能存在一些情况下明确而不是在\(\ omega \)中没有明显。So instead, we’re going to infer a factored set model of \(\Omega\): some other set \(S\), and a factorization of \(S\), and a function from \(S\) to \(\Omega\).

\(\ omega \)模型是一对\((f,f)\),其中\(f =(f =(f =(s,b)\)是一个有限的因子集和\(f:s \ lightarrow \ omega \)。(\(f \)不需要是注射或形状的。)

然后,如果我有一个\(\ omega \)的分区,我可以在\(f \)后向后向后发送此分区并获得\(s \)的唯一分区。如果\(x \ in \ text {parts}(\ omega)\),则\(f ^ { - 1}(x)\ in \ text {east}(s)\)由\(s \ sim_{f ^ { - 1}(x)} t \ leftrightarrow f(s)\ sim_x f(t)\)。

然后我们要做的是占据一堆关于\(\ omega \)的正交事实,我们将尝试找到一个捕获正交事实的模型。

我们将采取正交数据库在\(\ omega \)上,这是一对\(d =(o,n)\),其中\(o \)(对于“正交”)和\(n \)(for“not正交”)是\(\ omega \)分区的每组三级\((x,y,z)\)。我们将认为这些是关于正交性的规则。

它意味着模型\((f,f)\)来满足数据库\(d \)是:

  • f \ (^ {1} (X) \补^ {f} f ^ {1} (Y) \ f中期^ {1}(Z) \)每当\ (O (X, Y, Z) \ \),和
  • \ (\) \ (\ lnot (f ^ {1} (X) \补^ {f} f ^ {1} (Y) \ f中期^ {1}(Z)) \)每当\ ((X, Y, Z) \ N \)。

因此,我们有这些正交规则我们想要满足,我们希望考虑与这些规则一致的所有模型的空间。即使虽然总是有多种与我的数据库一致的模型,但如果至少有一个是 - 你可以始终添加更多信息,然后用\(f \)删除 - 我们希望有时会推断这对于满足数据库的所有模型,\(f ^ {-1}(x)\)是\(f ^ { - 1}(y)\)。

这就是推断时间我们打算的意思。如果与数据库\(d \)一致的所有模型\((f,f)\)满足关于时间\(f ^ { - 1}(x)\ᐸ^ f \ f ^ { -1}(Y)\), we’ll say that \(X \ ᐸ_D \ Y\).


(Part 2, example)·····两个二进制变量(珍珠)


所以我们已经建立了这种漂亮的组合概念的时间推断。明显的下一个问题是:

  • 我们是否可以使用这种方法推断有趣的事实,或者是空虚的吗?
  • 这个框架和Pearlian的时间推断有什么区别?

Pearlian的时间推断非常有力;如果有足够的数据,它可以推断出各种情况下的时间序列。通过比较,有限因子集方法有多强大?

为了解决这个问题,我们将去一个例子。让(x \)和\(y \)是两个二进制变量。珍珠问:“是\(x \)和\(y \)独立?”如果是,则两者之间没有路径。如果否,则可能存在从\(x \)到\(y \)的路径,或从\(y \)到\(x \),或者从第三变量到\(x \)和\(y \)。

无论哪种情况,我们都不能推断出任何时间关系。

对我来说,这似乎就是谚语“相关性并不意味着因果关系”的由来。Pearl确实需要更多的变量,以便能够从更丰富的组合结构中推断时间关系。

然而,我声称这个Pearlian的本体论,在你手中的这些变量集合蒙蔽了我们的下一个明显的问题,即:\(X\)是独立于\(X\ \ mathmath {XOR} \ Y\)吗?

在珍珠世界,\(x \)和\(y \)是我们的变量,\(x \ \ mathrm {xor} \ y \)只是对这些变量的一些随机操作。在我们的世界中,\(x \ \ mathrm {xor} \ y \),而是在与\(x \)和\(y \)相同的基座上的变量。我用我的变量\(x \)和\(y \)做的第一件事是我拍摄产品\(x \ times y \),然后我忘记了标签\(x \)和\(y \)。

所以有这个问题,“是\(x \)独立于\(x \ \ mathrm {xor} \ y \)?”如果\(x \)独立于\(x \ \ mathrm {xor} \ y \),我们实际上将能够得出结论\(x \)是\(y \)!

So not only is the finite factored set paradigm non-vacuous, and not only is it going to be able to keep up with Pearl and infer things Pearl can’t, but it’s going to be able to infer a temporal relationship from only two variables.

所以让我们经历它的证明。


(Part 2, example)·····两个二进制变量(因子集)


让(\ omega = \ {0001,10,11 \} \),并让\(x \),\(y \),\(z \)是分区(/ questions):

  • \(x = {\ {0001 \},\ {10,11 \} \} \)。(第一次是什么?)
  • \(y = \ {\ {00,10 \},\ {01,111 \} \} \)。(第二位是什么?)
  • \(z = \ {00,111 \},\ {01,10 \} \} \)。(比特匹配吗?)

让\ (D = (O, N) \),在那里\ (O = \ {(X, Z \{\ω\})\}\)和\ (N = \ {(Z, Z, \{\ω\})\}\)。如果我们从概率分布中得到这个正交性数据库,那么我们就不止有两条规则了,因为我们会观察到更多的正交性和非正交性。但是时间推断对于添加更多的规则来说是单调的,所以我们可以使用证明所需的最小规则集。

第一个规则说\(x \)与\(z \)正交。第二条规则说,\(z \)没有正交,这基本上只是说\(z \)是非确定性的;这就是说,\(z \)中的两个部分都是可能的,两者都是在函数\(f \)下的支持。\(\ {\ omega \} \)表示我们没有任何条件。

由此,我们将能够证明\(x \ᐸ_d \ y \)。

证明。首先,我们将显示\(x \)之前略微略微\(y \)。让((f,f)\)满足\(d \)。让\(h_x \)为\(h ^ f(f ^ {-1}(x))\),同样让\(h_y = h ^ f(f ^ {-1}(y))\)和(h_z = h ^ f(f ^ {-1}(z))\)。

因为\((x,z,\ \ \ oomga \})\在o o \)中,我们有那个\(h_x \ cap h_z = \ {\} \);从n \)中((z,z,\ \ oomga \})\以来,我们有那个\(h_z \ neq \ {\} \)。

因为\(x \ leq _ {\ omega} y \ vee _ {\ oomega} z \) - 因为可以从\(y \)与\(z \) - \(h_x)一起计算\(x \) - \(h_x\ subseteq h_y \ cup h_z \)。(因为分区的历史记录是计算该分区所需的最小因素。)

而且(h_x \ cap h_z = \ {\} \),这意味着\(h_x \ subseteq h_y \),所以\(x \)在\(y \)之前弱。

为了证明严格不等式,我们将假设\(H_X\) = \(H_Y\)。

请注意,\(Z)可以由\(X)和\(Y)一起计算,即\(Z\leq_{\Omega} X\vee_{\Omega} Y\),因此\(H_Z\subseteq H_X\cup H_Y)(即\(H_Z\subseteq H_X\))。由此可以得出\(H_Z = (H_X\杯子H_Y)\cap H_Z=H_X\cap H_Z\)。但是由于\(H_Z\)也是与\(H_X\)不相交的,这意味着\(H_Z = \{\}\)是一个矛盾。

因此\(h_x \ neq h_y \),所以\(h_x \ subset h_y \),所以\(f ^ { - 1}(x)\ᐸ^ f \ f ^ { - 1}(y)\),所以\(x \ᐸ_d \ y \)。□

当我用有限因子集做时间推断的时候,我基本上有这样的证明。我们收集了一些关于各种布尔组合变量历史的空性或非空性的事实,并用这些来总结更多关于变量历史的事实,这些变量彼此之间是子集。

我有一个更复杂的例子它使用了条件正交性,而不仅仅是正交性;我就不讲了。

我想在这里做一个有趣的一点是我们正在做时间推断 - 我们推断出\(x \)之前\(y \) - 但我声称我们也在做概念推断。

假设我有一个比特,它是0或1,它是蓝色或绿色。这两个事实是原始的,是独立产生的。我还有另一个概念,“是蓝色的还是bleen的?”,它是蓝色/绿色和0/1的\(\mathrm{XOR}\)。

有一种感觉,我们推断\(x \)是之前\(y \),并且在这种情况下,我们可以推断出在养殖之前的蓝色。并且这指出了蓝色更加原始的事实,脾气是派生的财产。

在我们的验证中,\(x \)和\(z \)可以被认为是这些原始属性,\(y \)是我们从中获得的派生属性。所以我们不仅仅是推断的时间;我们推断出关于什么是好的自然概念的事实。我认为,这有一些希望这对该本体可以为“你不能真正区分蓝色和金黄”的声明,珍珠可以对发表的说法做些什么“关联并不意味着因果关系”。


(第二部分,主体)···应用/未来工作/猜测


未来的工作我最兴奋的是有限因子集中化为三个粗略类别:推理(涉及更多计算问题),无限(更多数学)和嵌入式机构(更哲学)。

亚博体育官网与推论相关的研究主题:

  • 暂时推理的可解锁性
  • 有效时间推理
  • 概念推断
  • 来自原始数据的时间推断和较少的本体假设
  • 基于确定性关系的时间推理
  • 没有正交性的时间
  • 条件因素集

有很多关于问题的研究方向,如“我们如何亚博体育官网在这个范式中会在这个范式中进行高效推论?”。这里的一些问题来自于我们的假设比珍珠更少,并且在某种意义上就越来自原始数据。

然后我有关于将因式集扩展到无限情况的应用:

  • 将定义扩展到无限案例
  • 有限维考间集的基本定理
  • 连续时间
  • 物理学新镜头

我在这次演讲中所展示的一切都是基于有限的假设。在某些情况下,这是不必要的——但在很多情况下,这实际上是必要的,我没有引起注意。

我认为基本定理可以推广到有限维分解集(即,其中\(|b |\)是有限的分解集),但不能推广到任意维分解集。

然后,我真正感兴趣的是嵌入式代理的应用:

  • 嵌入式观察
  • 制裁性
  • 笛卡尔框架接班人
  • 解开因果环
  • 条件时间
  • 逻辑归纳法中的逻辑因果关系
  • 正交性,简化了决策的假设
  • 条件正交作为抽象的需要

我在这次演讲中关注的是有限因子集的时间推断方面,因为它是具体和有形的,我们可以说"啊,我们可以做皮尔式的时间推断,只是我们有时可以推断更多的结构我们依赖更少的假设"

但是,我很兴奋的很多应用程序都涉及使用因子集合到模型情况,而不是从数据中推断因子集。

我们目前在任何地方模拟使用图形的图形的情况,即表示信息流或因果关系,我们可能会使用因子来模拟情况;这可能允许我们的模型与抽象更加良好。

我想在建模agent与事物交互时,或者在建模信息流时,构建因子集本体作为图形的替代。我对这个方向感到很兴奋。

你喜欢这篇文章吗?你可以享受我们的其他分析帖子,包括: