文章目錄
本篇文章將說明如何使用 Python 程式,透過機器學習的三個步驟(收集資料、進行訓練、預測評估)來完成初學者第一個影像辨識的 AI 程式。我們將利用無程式碼機器學習平台 AI Playground 所提供的 Python 範例程式進行說明。讀者可參考這篇機器學習三大步驟介紹。
開始介紹 Python 如何實作前,先簡單快速介紹一下在不寫程式的情況下如何完成影像辨識。
1. 先備知識:使用「無程式碼機器學習」實作訓練 AI 模型
- 使用環境:AI Playground (無程式碼機器學習平台)
- 機器學習三大步驟:
- 參考文章:輕鬆認識機器學習三大步驟 – 以辨識貓、狗為例
- 參考影片:為了讓大家實際了解運作過程,可參考下面這個影片介紹
讀者經過上述實際操作後,將可以透過視覺化的過程輕鬆認識機器學習三大步驟。接著我們將讓讀者可以實際利用 Python 程式碼來了解實際運作,並完成自己第一個 Python 的 AI 程式。
2. 使用 Python 程式碼實作 AI 影像辨識模型
本文先不著重在 Python 相關語法,而是讓初學者能夠從視覺化的無程式碼機器學習環境中所認識的三大步驟,將其應用在 Python 程式當中,並進而讓初學者可以實際利用 Python 來完成影像辨識。不僅可以讓初學者熟悉機器學習,更能利用 Python 實作自己的作品。現在就讓我們手把手帶大家來完成吧!
本篇介紹所使用的環境將利用 Google Colab,因為可以省去許多安裝程序,對初學者學習門檻比較不高,相關使用的介紹可以參考下面文章。
Step 1. 開啟 Google Colab 雲端開發環境
登入自己的 Google 雲端硬碟,並在空白處按滑鼠右鍵選擇已安裝好的 Google Colab。
進入後的畫面如下。
Step 2. 複製 Python 範例程式
開啟瀏覽頁的分頁,並連到 AI Playground 平台。選擇左側「影像辨識」服務後,將可看到下圖中的 Python 範例。
點擊後會看到下面的 Python 範例程式,點擊右上角複製圖示可以複製整個範例程式。
再到剛剛的 Google Colab 頁面貼上 Python 範例程式。
Step 3. 準備訓練資料
若想要使用 GPU 或 TPU,可以在選單中點擊【執行階段】→【變更執行階段類型】後會出現如下方畫面,讀者可以選擇 GPU 來執行程式,處理速度會快一些。通常在執行大量數據的資料科學或機器學習專案時,比較會有明顯效能差異,讀者可以試玩看看。
我們可以透過 Colab 主畫面左側檔案區(如下圖)來建立資料夾,並上傳所需訓練圖片資料。因為要配合 Python 範例程式,所以建立方式需要留意一下,筆者將在下一步驟說明。讀者理解後也可以改寫為自己的方式。
Step 4. Python 程式碼架構說明
AI Playground 所提供的影像辨識 AI 範例程式,我們可以將其分為三大步驟,分別是收集資料、進行訓練及預測評估,並且利用下圖對應程式區塊。如果已經熟習此平台的初學者,應該對此步驟不陌生,將可協助裡寫此 Python 架構。
下圖左側為在 Google Colab 建立的資料夾結構,其中最上層的資料夾名稱 Datasets 只要跟範例程式「收集資料」步驟對應區塊中的 src_dir 位置一致就可以(但要注意相對路徑及絕對路徑用法)。
下一層的 cat 及 dog 資料夾,則是預計訓練機器認識的類別名稱,同時會將對應的貓及狗的訓練圖片上傳至這兩個資料夾內。這一個動作就有點像是在 AI Playground 平台上建立的類別名稱,以及將圖片上傳至對應類別當中一樣(如下圖右下角),讓機器學習圖片特徵與類別名稱當中的關聯性。這也是為何會讓許多初學者或中小學生,先熟悉無程式碼機器學習的重要性,對未來的 AI 學習很有幫助。
如果你想讓機器學習多辨識其它類別(例如兔子),那你可以在此階層新增 rabbit 資料夾,並將你想要機器學習的兔子圖片放入此資料夾,再重新訓練一次,你的 AI 模型將可以多辨識一種動物囉。
而 AI 模型訓練所需要的測試資料,Python 程式預設是取放在與 cat 及 dog 資料夾同一層的檔案,例如上圖的 test1~test6。這部分要注意對應程式碼的路徑及檔名(含副檔名)必須正確。
Step 5. 開始訓練
資料都準備好了以後,可以點擊程式碼區塊前的箭頭圖示來執行 Python 程式,下圖中顯示程式在進行訓練的過程。範例程式預設跑 10 個訓練時期 (Epoch),讀者若想要改變 Epoch ,可以在範例程式碼裡有關「進行訓練」步驟區塊的模型訓練部分來調整 Epoch 的數字即可。
Step 6. 預測評估
由於我們提供訓練後 AI 模型測試的圖片是 test1.png,其測試結果顯示此影像辨識模型可以正確判斷出照片是 cat,並且有很高的信心值。
我們在程式碼中修改預測圖片為 test4.png,此影像辨識模型可以正確判斷出此照片為 dog,且也具有很高的信心值。
以上就是利用 AI Playground 提供的 Python 範例程式所做的使用說明,對於初學者認識機器學習的基本工作原理與步驟非常有幫助。當然,程式碼中還有一些參數及指令的使用,都必須在了解多一點 Python (Numpy、keras等等) 及機器學習概念後才能較為熟悉,這一部分未來我們也會提供多一點介紹,但對初學者來說會是一個很好的入門經驗。
看完上面介紹後,讀者也可以實際觀看影片來實際操作看看並熟悉流程。
如果你喜歡這篇文章歡迎訂閱、分享(請載名出處)與追蹤,並持續關注最新文章。同時 FB 及 IG 也會不定期提供國內外教育與科技新知。
2 comments
[…] 我們將解縮後的檔案及資料夾上傳至 Google Colab 檔案區 (可參考 Google Colab 介紹及使用 Python 程式實作影像辨識),同時也將測試圖像資料上傳(如下圖)。 […]
[…] 根據前一篇機器學習的文章,教大家如何透過機器學習三大步驟進行兩種實作方式。 […]