dynamic编程和记忆：自下而上和自上而下的方法

我不确定自己是否正确理解了自上而下的方法。

自下而上：是你首先看“小”子问题的地方，然后使用小问题的解决scheme来解决更大的子问题。

自上而下：以自然的方式解决问题，并检查是否已经计算出子问题的解决scheme。

我有点困惑。有人可以解释吗？有什么区别？

rev4：用户Sammaron的一个非常雄辩的评论指出，也许这个答案以前混淆了自上而下和自下而上。虽然原来这个答案（rev3）和其他答案都说“自下而上”是记忆（也就是“假设子问题”），也可能是倒数（也就是说，“自上而下”可能是“假设子问题”和“自下而上“可能是”构成子问题“）。之前我已经读过memoization是一种不同types的dynamic规划，而不是dynamic规划的子types，所以引用了尽pipe没有订阅这个观点。我已经重写了这个答案是不可知的术语，直到在文献中find适当的参考，并将这个答案转换为社区维基。请select学术来源。参考文献列表：{Web： 1,2 } {Literature： – }

概括

dynamic编程都是以避免重新计算重复工作的方式对您的计算进行sorting。你有一个主要问题（你的子树的根）和子问题（子树）。 子问题通常会重复和重叠 。

例如，考虑你最喜欢的Fibonnaci例子。这是子问题的完整树，如果我们做了一个简单的recursion调用：

TOP of the tree fib(4) fib(3)...................... + fib(2) fib(2)......... + fib(1) fib(1)........... + fib(0) fib(1) + fib(0) fib(1) fib(1) fib(0) fib(1) fib(0) BOTTOM of the tree

（在其他一些罕见的问题中，这棵树在某些分支中可能是无限的，代表不终止，因此树的底部可能是无限大的，而且在一些问题中，你可能不知道完整的树看起来像什么时间，因此你可能需要一个策略/algorithm来决定揭示哪些子问题。）

备忘录，制表

至less有两种dynamic编程的主要技术，它们不是相互排斥的：

记忆 – 这是一种自由放任的方法：你假设你已经计算了所有的子问题。你不知道最佳的评估顺序。你通常从根节点执行recursion调用（或者一些迭代等价的），或者希望你能够接近最优的评估顺序，或者你有一个certificate你会得到最优的评估顺序。您确保recursion调用从不重新计算子问题，因为您caching结果，因此重复的子树不会重新计算。
- 例如：如果你正在计算Fibonacci序列fib(100) ，你可以称之为fib(100)=fib(99)+fib(98) ，这将会调用fib(99)=fib(98)+fib(97) ，…等等，这将调用fib(2)=fib(1)+fib(0)=1+0=1 。然后它将最终解决fib(3)=fib(2)+fib(1) ，但不需要重新计算fib(2) ，因为我们将其caching起来。
- 这从树的顶部开始，并且评估叶子/子树中的子问题返回到根。
制表 – 您也可以将dynamic编程视为“表格填充”algorithm（虽然通常是多维的，但在非常罕见的情况下，该表格可能具有非欧几里德几何）。这就像记忆但更加活跃，并且需要一个额外的步骤：您必须提前准确地select您的计算顺序（这并不意味着顺序必须是静态的，而是您有更多的灵活性比记事）。
- 例如：如果做斐波那契，你select按照这个顺序计算数字： fib(2) ， fib(3) ， fib(4) …caching每个值，以便您可以更容易地计算下一个值。你也可以把它看作填充表格（另一种forms的caching）。
- 我个人从来没有听过“制表”这个词，但这是一个很好的词汇。有些人认为这是“dynamic规划”。
- 在运行algorithm之前，程序员考虑整个树，然后编写一个algorithm来按照特定的顺序来评估这些子问题，通常填充一个表。
- *脚注：有时“表”不是一个具有网格状连接本身的矩形表格，而是可能具有更复杂的结构，例如：树或特定于问题域的结构（例如飞行距离内的城市在一个地图上），或者一个网格图（虽然网格状，连接结构不是上下左右）等。例如，user3290797链接了一个dynamic规划的例子，在树中查找最大独立集，这相当于填充树中的空白。

（在最一般的情况下，在“dynamic编程”中，我会说程序员会考虑整个树，然后编写一个algorithm来实现一个评估子问题的策略（它优化你想要的任何属性，通常是时间复杂度和空间 – 复杂度），这个策略必须从某个地方开始，某个特定的子问题，也许根据这些评估的结果进行自我调整，在最一般意义上的“dynamic规划”中，你通常试图caching这些子问题（更一般地说，重新审视子问题……或许在图表的情况下有微妙的区别）在各种数据结构中，这些数据结构常常是像数组或表格一样的核心，如果我们不再需要它们，那么子问题的解决scheme就可以被抛弃。）

[以前这个答案是关于自上而下和自下而上术语的陈述; 显然存在两种主要的方法，称为记忆和制表，可能在双向注射这些术语，但不完全。大多数人使用的通用术语仍然是“dynamic编程”，有些人则说“Memoization”是指dynamic编程的特定子types。这个答案拒绝说自上而下，自下而上，直到社区可以在学术论文中find适当的参考。最终理解这个区别而不是术语是很重要的。]

优点和缺点

易于编码

记忆是非常容易的代码（你通常可以*写一个“记事本”注释或包装function，自动为你做），应该是你的第一线的方法。制表的缺点是你必须拿出一个订单。

*（实际上，如果您自己编写函数，并且/或者使用不纯的/非函数式的编程语言进行编码，这实际上是很简单的…例如，如果有人已经编写了预编译的函数，它必然会对自身进行recursion调用，你不能神奇地memome函数没有确保这些recursion调用调用你的新的memoized函数（而不是原始的unmemoized函数））

recursion

请注意，自顶向下和自下而上都可以通过recursion或迭代表填充来实现，尽pipe这可能并不自然。

实际问题

通过记忆，如果树非常深（比如fib(10^6) ），你将会用完堆栈空间，因为每个延迟的计算必须放在堆栈上，而你将有10 ^ 6个堆栈空间。

最优

如果您发生（或尝试）访问子问题的顺序不是最优的，那么两种方法都可能不是最佳的，特别是如果有多种方法来计算子问题（通常高速caching将解决这个问题，但理论上可能的情况是caching可能不是在一些异国情况下）。记忆通常会增加你复杂的空间复杂性（例如用制表符你可以放弃计算，比如使用带有Fib的制表可以使用O（1）空间，但是用Fib记忆使用O（N）堆栈空间）。

高级优化

如果你也在做一个非常复杂的问题，你可能别无select，只能做制表（或者至less在指导你想要的记忆中扮演更积极的angular色）。此外，如果您处于优化是绝对关键的情况，而且您必须进行优化，那么制表可以让您执行优化，否则记忆本不会让您以一种理智的方式进行优化。在我看来，在正常的软件工程中，这两种情况都没有出现，所以我只是使用memoization（“caching它的答案的函数”），除非某些东西（如堆栈空间）使得列表必要。尽pipe从技术上来说，为了避免堆栈爆炸，你可以1）增加允许它的语言的堆栈大小限制，或者2）吃一个额外工作的常量因子来虚拟化你的堆栈（ick），或者3）以连续传递的方式编程，这实际上也是虚拟化你的堆栈（不确定这个的复杂性，但基本上，你将有效地从堆栈大小为N的延迟调用链，事实上坚持在N个连续嵌套的thunk函数…虽然在某些语言没有尾呼优化，你可能不得不蹦床的事情，以避免堆栈井喷）。

更复杂的例子

在这里，我们列举了一些特别感兴趣的例子，这些例子不仅仅是普通的DP问题，而且还有趣地区分了记忆和列表。例如，一种公式可能比另一种公式容易得多，或者可能有一个基本上需要列表的优化：

计算编辑距离的algorithm[ 4 ]，作为二维表格填充algorithm的一个不重要的例子

DP自上而下和自下而上是解决同样问题的两种不同的方式。考虑计算斐波纳契数字的记忆（自上而下）与dynamic（自下而上）编程解决scheme。

 fib_cache = {} def memo_fib(n): global fib_cache if n == 0 or n == 1: return 1 if n in fib_cache: return fib_cache[n] ret = memo_fib(n - 1) + memo_fib(n - 2) fib_cache[n] = ret return ret def dp_fib(n): partial_answers = [1, 1] while len(partial_answers) <= n: partial_answers.append(partial_answers[-1] + partial_answers[-2]) return partial_answers[n] print memo_fib(5), dp_fib(5)

我个人发现memoization更自然。你可以使用一个recursion函数，并通过一个机械过程来记忆它（caching中的第一个查找答案，如果可能的话返回它，否则recursion计算，在返回之前，将答案保存在caching中），而自底向上的dynamic编程需要编码计算解决scheme的顺序，以便在它所依赖的较小问题之前不计算大问题。

dynamic编程的一个关键特征是存在重叠的子问题 。也就是说，你试图解决的问题可以被分解成多个子问题，其中很多子问题都是子问题。这就像“分而治之”，但是你最终会做很多次同样的事情。我从2003年开始教授或解释这些问题时使用过一个例子：您可以recursion地计算斐波纳契数。

 def fib(n): if n < 2: return n return fib(n-1) + fib(n-2)

使用你最喜欢的语言，并尝试运行它的fib(50) 。这将需要很长很长的时间。大致和fib(50)本身一样多！然而，很多不必要的工作正在完成。 fib(50)会调用fib(49)和fib(48) ，但是这两个都会调用fib(47) ，即使值相同。事实上， fib(47)将被计算三次：通过fib(49)的直接调用，通过fib(48)的直接调用fib(48) ，以及另一个fib(48)的直接调用fib(48) ，通过计算fib(49) …所以你看，我们有重叠的子问题 。

好消息：没有必要多次计算相同的值。一旦你计算一次，caching结果，并在下一次使用caching的值！这是dynamic编程的本质。你可以把它称为“自上而下”，“memoization”，或任何你想要的。这种方法非常直观，很容易实现。首先写一个recursion的解决scheme，在小testing上testing，添加记忆（caching已经计算的值），以及—宾果！ —你完成了。

通常你也可以编写一个自下而上的等价迭代程序，无需recursion。在这种情况下，这将是更自然的方法：从1到50循环计算所有的斐波纳契数字。

 fib[0] = 0 fib[1] = 1 for i in range(48): fib[i+2] = fib[i] + fib[i+1]

在任何有趣的情况下，自下而上的解决scheme通常更难以理解。然而，一旦你明白了，通常你会得到一个更清晰的algorithm如何工作的大图。在实践中，当我解决平凡的问题的时候，我build议先写自上而下的方法，然后用小的例子进行testing。然后写下自下而上的解决scheme，并比较两者，以确保你得到同样的东西。理想情况下，自动比较两个解决scheme。写一个小程序，会产生大量的testing，理想情况下 – 所有小到一定大小的testing – 并validation两个解决scheme给出相同的结果。之后，在生产中使用自下而上的解决scheme，但保留自上而下的代码，注释。这会让其他开发人员更容易理解你在做什么：即使你自己写了，自下而上的代码也是很难理解的，即使你确切地知道你在做什么。

在许多应用程序中，由于recursion调用的开销，自下而上的方法稍微快一点。堆栈溢出也可能是某些问题的一个问题，请注意，这可能非常依赖于input数据。在某些情况下，如果您不能很好地理解dynamic编程，则可能无法编写导致堆栈溢出的testing，但总有一天可能会发生。

现在有自顶向下的方法是唯一可行的解决scheme，因为问题空间太大，不可能解决所有的子问题。然而，“caching”仍然在合理的时间内运行，因为你的input只需要解决一小部分子问题—但是明确定义这个问题太棘手，你需要解决哪些子问题，解决scheme。另一方面，有些情况下，你知道你需要解决所有的子问题。在这种情况下，继续使用自下而上。

我个人会使用自顶向下的段落优化方法，也就是Word包装优化问题（查找Knuth-Plass破解algorithm;至lessTeX使用它，而Adobe Systems的一些软件使用类似的方法）。我会使用自下而上的快速傅立叶变换。

让我们以斐波那契系列为例

 1,1,2,3,5,8,13,21.... first number: 1 Second number: 1 Third Number: 2

另一种说法是，

 Bottom(first) number: 1 Top (Eighth) number on the given sequence: 21

在前五斐波那契数字的情况下

 Bottom(first) number :1 Top (fifth) number: 5

现在让我们来看一个recursion的斐波那契数列algorithm

 public int rcursive(int n) { if ((n == 1) || (n == 2)) { return 1; } else { return rcursive(n - 1) + rcursive(n - 2); } }

现在，如果我们用下面的命令执行这个程序

 rcursive(5);

如果仔细观察algorithm，为了生成第五个数字，需要第三个和第四个数字。所以我的recursion实际上是从顶部（5）开始，然后一直到底部/底部的数字。这种方法实际上是自上而下的方法。

为了避免多次执行相同的计算，我们使用dynamic编程技术。我们存储以前计算的值并重新使用它。这种技术被称为memoization。还有更多的dynamic编程，然后memoization这是不需要讨论当前的问题。

自上而下

让我们重写我们原来的algorithm，并添加memoized技术。

 public int memoized(int n, int[] memo) { if (n <= 2) { return 1; } else if (memo[n] != -1) { return memo[n]; } else { memo[n] = memoized(n - 1, memo) + memoized(n - 2, memo); } return memo[n]; }

我们执行这个方法如下

  int n = 5; int[] memo = new int[n + 1]; Arrays.fill(memo, -1); memoized(n, memo);

这个解决scheme仍然是自顶向下的，因为algorithm从最高价值开始，每走一步都要到最低价位。

自下而上

但是，问题是，我们能否从底层开始，像从第一个斐波纳契数字开始，然后走上前去。让我们重写它使用这种技术，

 public int dp(int n) { int[] output = new int[n + 1]; output[1] = 1; output[2] = 1; for (int i = 3; i <= n; i++) { output[i] = output[i - 1] + output[i - 2]; } return output[n]; }

现在，如果我们看看这个algorithm，它实际上是从较低的值开始，然后到最高。如果我需要第五斐波那契数我实际上是计算第一，然后第二，然后第三所有的方式来第五号。这种技术实际上被称为自下而上的技术。

最后两点，algorithm充满了dynamic规划的要求。但一个是自上而下，另一个是自下而上。两种algorithm具有相似的空间和时间复杂度。

dynamic编程通常被称为Memoization！

1.Memoization是自顶向下的技术（通过分解来解决给定的问题），dynamic规划是一种自下而上的技术（从平凡的子问题开始解决，直到给定的问题）

2.DP从基本情况开始寻找解决scheme并向上工作。 DP解决了所有的子问题，因为它是自下而上的

不像Memoization，它只解决了所需的子问题

DP有可能将指数时间蛮力解转化为多项式时间algorithm。
DP可能效率更高，因为它是迭代的

相反，Memoization必须支付由recursion引起的（经常是重要的）开销。

为了更简单，Memoization使用自上而下的方法来解决问题，即从核心（主要）问题开始，然后将其分解成子问题并类似地解决这些子问题。在这种方法中，同样的子问题可能会发生多次，消耗更多的CPU周期，从而增加了时间复杂度。而在dynamic编程中，相同的子问题不会被多次解决，而是使用前面的结果来优化解决scheme。

简单地说，自顶向下的方法使用recursion调用一次又一次的子问题
在哪里自下而上的方式使用单一而不需要调用任何一个，因此效率更高。

以下是自上而下编辑距离问题的基于DP的解决scheme。我希望这也将有助于理解dynamic规划的世界：

 public int minDistance(String word1, String word2) {//Standard dynamic programming puzzle. int m = word2.length(); int n = word1.length(); if(m == 0) // Cannot miss the corner cases ! return n; if(n == 0) return m; int[][] DP = new int[n + 1][m + 1]; for(int j =1 ; j <= m; j++) { DP[0][j] = j; } for(int i =1 ; i <= n; i++) { DP[i][0] = i; } for(int i =1 ; i <= n; i++) { for(int j =1 ; j <= m; j++) { if(word1.charAt(i - 1) == word2.charAt(j - 1)) DP[i][j] = DP[i-1][j-1]; else DP[i][j] = Math.min(Math.min(DP[i-1][j], DP[i][j-1]), DP[i-1][j-1]) + 1; // Main idea is this. } } return DP[n][m]; }

你可以在家里想到它的recursion实现。如果你以前没有解决过这样的问题，这是非常好的和具有挑战性的。

C＃用任意数量的参数记忆函数

dynamic编程和记忆：自下而上和自上而下的方法

概括

备忘录，制表

优点和缺点

易于编码

recursion

实际问题

最优

高级优化

更复杂的例子

在Haskell中记忆？

为什么要调用vector.reserve（required + 1）比vector.reserve（required）要快？

这个fibonacci函数是如何记忆的？

Data.MemoCombinators如何工作？

R中的caching/记忆/散列选项

如何使用dynamic规划确定最长的增长子序列？

如何确定内存是否alignment？（testingalignment，不alignment）

caching和Memoization有什么区别？

什么是memoization，我怎样才能在Python中使用它？

这是一个在C中释放内存的好方法吗？

dynamic编程和记忆：自下而上和自上而下的方法

概括

备忘录，制表

优点和缺点

易于编码

recursion

实际问题

最优

高级优化

更复杂的例子

在Haskell中记忆？

为什么要调用vector.reserve（required + 1）比vector.reserve（required）要快？

这个fibonacci函数是如何记忆的？

Data.MemoCombinators如何工作？

R中的caching/记忆/散列选项

如何使用dynamic规划确定最长的增长子序列？

如何确定内存是否alignment？ （*testing*alignment，不alignment）

caching和Memoization有什么区别？

什么是memoization，我怎样才能在Python中使用它？

这是一个在C中释放内存的好方法吗？

如何确定内存是否alignment？（testingalignment，不alignment）