應用深度學習模型

在還沒變成AI專家之前, 讓深度學習發揮效益

AI 人工智慧這樣的俗稱, 很容易神化最近幾年關於機器學習或更具體的深度學習的能力與門檻. 如果把深度學習到底核心技術在哪裡搞明白了, 我們就很容易依照自己的核心能力與興趣擬定策略, 讓深度學習專案得以發揮效益.

首先我個人覺得可以參考台大李弘毅老師的兩堂課, 讓自己有概略的認識機器學習與深度學習的本質數學原理.

這兩堂課一言以蔽之: 機器學習其實根源於數學最佳化問題, 而且通常最常用的最佳化方法論是 Gradient Descent (梯度下降). 如果再多講幾句:

  • 那就是它三個步驟來完成:

    1. 定義帶有未知參數的函數; 用數個 ReLu (或是 Sigmoid) 函數的組合可逼近目標函數. 設定數量的 ReLu越多越能趨近.

    2. 定義預測值與實際值差異的損失函數

    3. 最佳化, Gradient Descent 能幫忙找到足夠好的解.

  • 多疊幾層函數後的深度模型大有機會增加預測的準確度, 命名為深度學習

如同課堂上用一個簡單的預測明日影片觀看人數來做練習, 很明顯的如果我們手中正有一個問題要解決, 例如要預測所經營餐廳明天的來客數; 或者工廠下個月的訂單量, 好決定需要備料多少. 我們就可以用上面影片的範例來試試看.

事實上這類問題, 很可能用 Multivariate Time Series Regression 相關模型來解, 會比較容易找到更準確的模型, 但是我們何不先用最簡單的模型動手試試看, 再逐步探索更厲害的技術?