儘早嘗試收集模型訓練所需的數據


如何不花千金買到早知道?

進行專案與參加考試兩者最佳策略的差異在於: 考試時是一開始就盡可能把所有簡單的題目做完, 然後再攻有挑戰的題目.

但是進行專案時, 比較保險的是先識別出高風險項目, 嘗試規避或是緩解, 萬一真無解, 提早與業主或是利益相關人員商量對策. 這樣就不會發生專案時程或成本預算都快花光了, 兩手一攤...

有發生過專案距離結案日不遠, 但是除了兩手一攤, 似乎還可以多講兩句 ??

通常一個專案啟動前後, 有一個相當重要的作業: 可行性分析. 深度學習專案要啟動, 前述的風險識別與可行性分析也同樣不可或缺.

絕大多數的深度學習技術, 無論是監督或非監督式學習, 成功的要件就是要有足夠的訓練數據, 其差異在於需不需要額外動用人力去標示數據. 如果無法在預算內完成數據採集, 幾乎可宣告此專案不可行.

現今合格的深度學習專家供不應求, 我們可以先諮詢為達到專案目標, 必須採擷哪些數據? 數據大約需要多少量? 然後嘗試在可取得的工作環境下, 評估需要額外投資哪些數據採擷設備? 是否需要額外的人力? 由於產線效率的要求下, 光學影像取得這方面的投資很可能是此專案固定資產占比最高的一部分, 提早面對此問題, 進行成本效益分析, 以避免過度樂觀.

我們繼續以 AOI 專案為例: 第一選項當然是從舊有設施中盤查看看是否已有AOI設備可沿用? 如果之前投資了, 現今是因為準確度不足? 光學檢視範圍未能覆蓋重點部位? 速度等等問題, 而重新考慮深度學習技術?

在面對上述的問題, 我們就順帶的設立了專案的目標.

如果所需的設備在市面上可取得的 AOI 產品無法滿足, 這時候便需要訂製, 這很可能需要啟動一個子專案來管理. 這值得費很大的心力在此, 可設想未來上線後, 除了週期性的檢討模型性能以決定是否需要再重新訓練更適合的模型, 此圖像採擷設備的維護與運作成本會是最大支出.