Scalaz(35)- Free :運算-Trampoline,say NO to StackOverflowError

来源:http://www.cnblogs.com/tiger-xc/archive/2016/03/25/5321101.html
-Advertisement-
Play Games

在前面幾次討論中我們介紹了Free是個產生Monad的最基本結構。它的原理是把一段程式(AST)一連串的運算指令(ADT)轉化成數據結構存放在記憶體里,這個過程是個獨立的功能描述過程。然後另一個獨立運算過程的Interpreter會遍歷(traverse)AST結構,讀取結構里的運算指令,實際運行指令 ...


   在前面幾次討論中我們介紹了Free是個產生Monad的最基本結構。它的原理是把一段程式(AST)一連串的運算指令(ADT)轉化成數據結構存放在記憶體里,這個過程是個獨立的功能描述過程。然後另一個獨立運算過程的Interpreter會遍歷(traverse)AST結構,讀取結構里的運算指令,實際運行指令。這裡的重點是把一連串運算結構化(reify)延遲運行,具體實現方式是把Monad的連續運算方法flatMap轉化成一串Suspend結構(case class),把運算過程轉化成創建(construct)Suspend過程。flatMap的表現形式是這樣的:flatMap(a => flatMap(b => flatMap(c => ....))),這是是明顯的遞歸演算法,很容易產生堆棧溢出異常(StackOverflow Exception),無法保證程式的安全運行,如果不能有效解決則FP編程不可行。Free正是解決這個問題的有效方法,因為它把Monad的遞歸演算法flatMap轉化成了一個創建數據結構實例的過程。每創建一個Suspend,立即完成一個運算。我們先用個例子來證明Monad flatMap的遞歸演算法問題:

 1 ef zipIndex[A](xa: List[A]): List[(Int,A)] =
 2   xa.foldLeft(State.state[Int,List[(Int,A)]](List()))(
 3     (acc,a) => for {
 4       xn <- acc
 5       s <- get[Int]
 6       _ <- put[Int](s+1)
 7     } yield ((s,a) :: xn)
 8   ).eval(1).reverse                               //> zipIndex: [A](xa: List[A])List[(Int, A)]
 9 
10 zipIndex(1 |-> 10)                                //> res6: List[(Int, Int)] = List((1,1), (2,2), (3,3), (4,4), (5,5), (6,6), (7,7), (8,8), (9,9), (10,10))
11 zipIndex(1 |-> 10000)                             //> java.lang.StackOverflowError

在這個例子里我們使用了State Monad。我們知道for-comprehension就是flatMap鏈條,是一種遞歸演算法,所以當zipIndex針對大List時就產生了StackOverflowError。

我們提到過用Trampoline可以heap換stack,以遍曆數據結構代替遞歸運算來實現運行安全。那麼什麼是Trampoline呢?

1 sealed trait Trampoline[+A] 
2 case class Done[A](a: A) extends Trampoline[A]
3 case class More[A](k: () => Trampoline[A]) extends Trampoline[A]

Trampoline就是一種數據結構。它有兩種狀態:Done(a: A)代表結構記憶體放了一個A值,More(k: ()=>Trampoline[A])代表結構記憶體放的是一個Function0函數,就是一個運算Trampoline[A]。

我們先試個遞歸演算法例子:

 1 def isEven(xa: List[Int]): Boolean =
 2   xa match {
 3     case Nil => true
 4     case h :: t => isOdd(t)
 5   }                                               //> isEven: (xa: List[Int])Boolean
 6 def isOdd(xa: List[Int]): Boolean =
 7   xa match {
 8     case Nil => false
 9     case h :: t => isEven(t)
10   }                                               //> isOdd: (xa: List[Int])Boolean
11 
12 isOdd(0 |-> 100)                                  //> res0: Boolean = true
13 isEven(0 |-> 10000)                               //> java.lang.StackOverflowError

可以看到isEven和isOdd這兩個函數相互遞歸調用,最終用大點的List就產生了StackOverflowError。

現在重新調整一下函數isEven和isOdd的返回結構類型:從Boolean換成Trampoline,意思是從返回一個結果值變成返回一個數據結構:

 1 def even(xa: List[Int]): Trampoline[Boolean] =
 2   xa match {
 3     case Nil => Done(true)
 4     case h :: t => More(() => odd(t))
 5   }                                               //> even: (xa: List[Int])Exercises.trampoline.Trampoline[Boolean]
 6 def odd(xa:  List[Int]): Trampoline[Boolean] =
 7   xa match {
 8     case Nil => Done(false)
 9     case h :: t => More(() => even(t))
10   }                                               //> odd: (xa: List[Int])Exercises.trampoline.Trampoline[Boolean]
11   
12 even(1 |-> 123001)                                //> res0: Exercises.trampoline.Trampoline[Boolean] = More(<function0>)

現在我們獲得了一個在heap上存放了123001個元素的數據結構More(<function0>)。這是一個在記憶體heap上存放的過程,並沒有任何實質運算。
現在我們需要一個方法來遍歷這個返回的結構,逐個運行結構中的function0:

 

1 sealed trait Trampoline[+A] {
2   final def runT: A =
3     this match {
4       case Done(a) => a
5       case More(k) => k().runT
6     }
7 }
8 
9 even(1 |-> 123001).runT                           //> res0: Boolean = false

 

由於這個runT是個尾遞歸(Tail Call Elimination TCE)演算法,所以沒有出現StackOverflowError。

實際上scalaz也提供了Trampoline類型:scalaz/Free.scala

  /** A computation that can be stepped through, suspended, and paused */
  type Trampoline[A] = Free[Function0, A]
...
object Trampoline extends TrampolineInstances {

  def done[A](a: A): Trampoline[A] =
    Free.Return[Function0,A](a)

  def delay[A](a: => A): Trampoline[A] =
    suspend(done(a))

  def suspend[A](a: => Trampoline[A]): Trampoline[A] =
    Free.Suspend[Function0, A](() => a)
}

Trampoline就是Free[S,A]的一種特例。S == Function0,或者說Trampoline就是Free針對Function0生成的Monad,因為我們可以用Free.Return和Free.Suspend來實現Done和More。我們可以把scalaz的Trampoline用在even,odd函數里:

 1 import scalaz.Free.Trampoline
 2 def even(xa: List[Int]): Trampoline[Boolean] =
 3   xa match {
 4     case Nil => Trampoline.done(true)
 5     case h :: t => Trampoline.suspend(odd(t))
 6   }                                               //> even: (xa: List[Int])scalaz.Free.Trampoline[Boolean]
 7 def odd(xa:  List[Int]): Trampoline[Boolean] =
 8   xa match {
 9     case Nil => Trampoline.done(false)
10     case h :: t => Trampoline.suspend(even(t))
11   }                                               //> odd: (xa: List[Int])scalaz.Free.Trampoline[Boolean]
12   
13 even(1 |-> 123001).run                            //> res0: Boolean = false

語法同我們自定義的Trampoline差不多。

那麼我們能不能把Trampoline用在上面的哪個zipIndex函數里來解決StackOverflowError問題呢?zipIndex里造成問題的Monad是個State Monad,我們可以用State.lift把State[S,A升格成StateT[Trampoline,S,A]。先看看這個lift函數:scalaz/StateT.scala 

 

 def lift[M[_]: Applicative]: IndexedStateT[({type λ[α]=M[F[α]]})#λ, S1, S2, A] = new IndexedStateT[({type λ[α]=M[F[α]]})#λ, S1, S2, A] {
    def apply(initial: S1): M[F[(S2, A)]] = Applicative[M].point(self(initial))
  }

這個函數的功能等於是:State.lift[Trampoline] >>> StateT[Tarmpoline,S,A]。先看另一個簡單例子:

1 def incr: State[Int, Int] =  State {s => (s+1, s)}//> incr: => scalaz.State[Int,Int]
2 incr.replicateM(10000).eval(0) take 10            //> java.lang.StackOverflowError
3 
4 import scalaz.Free.Trampoline
5 incr.lift[Trampoline].replicateM(100000).eval(0).run.take(10)
6                                                   //> res0: List[Int] = List(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)

上面這個例子也使用了State Monad:函數incr返回的是State,這時用replicateM(10000).eval(0)對重覆對10000個State進行運算時產生了StackOverflowError。我們跟著用lift把incr返回類型變成StateT[Trampoline,S,A],這時replicateM(10000).eval(0)的作用就是進行結構轉化了(State.apply:Trampoline[(S,A)]),再用Trampoline.run作為Interpreter遍歷結構進行運算。用lift升格Trampoline後解決了StackOverflowError。

我們試著調整一下zipIndex函數:

 1 def safeZipIndex[A](xa: List[A]): List[(Int,A)] =
 2   (xa.foldLeft(State.state[Int,List[(Int,A)]](List()))(
 3     (acc,a) => for {
 4       xn <- acc
 5       s <- get[Int]
 6       _ <- put(s + 1)
 7     } yield (s,a) :: xn
 8   ).lift[Trampoline]).eval(1).run.reverse         //> safeZipIndex: [A](xa: List[A])List[(Int, A)]
 9   
10   safeZipIndex(1 |-> 1000).take(10)               //> res2: List[(Int, Int)] = List((1,1), (2,2), (3,3), (4,4), (5,5), (6,6), (7,7), (8,8), (9,9), (10,10))

錶面上來看結果好像是正確的。試試大一點的List:

1  safeZipIndex(1 |-> 10000).take(10)   //> java.lang.StackOverflowError
2                                       //| at scalaz.IndexedStateT$$anonfun$flatMap$1.apply(StateT.scala:62)
3                                       //| at scalaz.IndexedStateT$$anon$10.apply(StateT.scala:95)
4                                       //| at scalaz.IndexedStateT$$anonfun$flatMap$1.apply(StateT.scala:62)
5 ...
6  

還是StackOverflowError,看錯誤提示是State.flatMap造成的。看來遲點還是按照incr的原理把foldLeft運算階段結果拆分開來分析才行。

以上我們證明瞭Trampoline可以把連續運算轉化成創建數據結構,以heap記憶體換stack,能保證遞歸演算法運行的安全。因為Trampoline是Free的一個特例,所以Free的Interpreter也就可以保證遞歸演算法安全運行。現在可以得出這樣的結論:FP就是Monadic Programming,就是用Monad來編程,我們應該儘量用Free來生成Monad,用Free進行編程以保證FP程式的可靠性。

 

 

 

 


 

 

 

 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 根據《ACM程式設計》寫的,用實例展示vector用法。 方法:push_back(), insert(), erase(), clear(), size(), empty(); 演算法:reverse(), sort(). ...
  • 系統啟動一個線程的成本是比較高的,因為它涉及到與操作系統的交互,使用線程池的好處是提高性能,當系統中包含大量併發的線程時,會導致系統性能劇烈下降,甚至導致JVM崩潰,而線程池的最大線程數參數可以控制系統中併發線程數不超過次數。 一、Executors 工廠類用來產生線程池,該工廠類包含以下幾個靜態工 ...
  • 1、定義一個方法並且調用,這樣會很方便,大大減少不必要的浪費。但定義方法之前首先得明確該方法最後的結果想要執行什麼?還要明確在該方法中是否需要一些參數(形參) 例如下麵的代碼片段: 1 // 進入租車系統 2 public void YesOrNo() { 3 System.out.println( ...
  • 刪除文檔也算是常用的操作了...如果把Elasticsearch當做一款普通的資料庫,那麼刪除操作自然就很常用了。如果僅僅是全文檢索,可能就不會太常用到刪除。 Delete API 刪除API,可以根據特定的ID刪除文檔。 會返回下麵的消息: 版本 每個索引都通過版本來維護。當想要刪除某個文檔的時候 ...
  • 1 #include <stdio.h> 2 #include <stdlib.h> 3 4 #define N 15 5 6 int chessboard[N + 1][N + 1] = { 0 }; 7 8 int whoseTurn = 0; 9 10 void initGame(void); ...
  • 1. 創建一個context processor函數 新建一個文件命名為custom_processors.py,把它放到項目app文件夾(例如我的blog文件夾),添加一個返回字典的函數,其代碼如下: from sets import Set from django.db.models impor ...
  • 從今天起, 我會每天把閱讀tiny_cnn的閱讀心得提交到博客園中希望大家在這個平臺上可以多多交流; 關於如果閱讀代碼? 抓住重點,忽略細節 首先打開從github上下載的文件: 通過csdn和網上搜索一番會知道這個文件的各個目錄存放的是什麼; 我用${root} 代表到tiny-cnn-maste... ...
  • 命名空間提供了一種從邏輯上組織類的方式,防止命名衝突。 幾種常見語言 C++ 命名空間是可以嵌套的 嵌套的命名空間是指定義在其他命名空間中的命名空間。嵌套的命名空間是一個嵌套的作用域,內層命名空間聲明的名字將隱藏外層命名空間聲明的同名成員: C++ int x = 20; namespace out ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...