簡介
在前一篇大致上介紹AI Yolo的標註種類、格式、工具後,當然是要實際操作一下。我們先從標註工具來著手,這次介紹LabelImg這套簡易的標註工具。當然還有很多工具可以來替代本工具,但我們先打通任督二脈,先求有(深度)再求好(廣度)。
下載並安裝
前提:這套軟體下載安裝方式很多,但其實有一個方法可以適用Windows與Mac版本,當然你使用Anaconda來安裝會比較乾淨一點,且在未來要訓練Yolo時也可以先熟悉一下。
請先開啟得的『命令提示字元』或是『CMD』或是『終端機』,你可以在電腦資料夾中先建立一個專屬AI的資料夾,並進入到該目錄下。
這裡再提一下假如你不是使用Anaconda的人就必須先安裝python了,因為這個吹簡單的方法需要用到一個關鍵字叫『pip』,再保險一點你可能要安裝『pyqt5』,安裝python這邊就不多贅述。請依照下列字串依序填入終端機後,即可打開LabelImg的Tool。
pip3 install labelimg
//不行的話請換下列
sudo pip3 install labelimg
介面介紹
大家通常到她官方Github下載到的都是英文版的,但我使用mac安裝後打開是中文版的,其實介面是長一樣的。這邊我就依序介紹最常用的功能,其他的大家可以去摸索一下。
- 你再標注前請先整理好你要標注的所有圖片在一個資料夾中,並點選該按鈕指定該資料夾,如此一來工作流程比較快速並不會亂。
- 更改你的標註完產出的DateSet位置,DataSet會有兩個類別,一個是圖片另一個是Yolo要判斷的文字檔,也就是上一篇提到的格式。
- 此區塊的功能是能讓你快速標記玩快速切換下一張圖片。
- 切換你的DataSet的文字檔格式,LabelImg有提供VOC與Yolo這兩種格式,VOC是xml檔案,而Yolo是txt檔案,Yolo兩種都可以吃。
- 這是最重要的功能,當你編輯區有你挑選好的圖片時,要進行標註圖片中的訓練特徵區塊會用到的功能,在下面會帶大家操作一次。
- 這是你所建立的標註類別,例如:蘋果、橘子、番茄,在你進行5的功能時就會要求你輸入類別名稱,該區快就會自動記錄。
- 這是你所有圖片路徑顯示區塊,你亦可點選某張圖片進行標記。
實際操作
當你讀取你所建立的資料夾後,就如上面列的,所有的圖片會在(6)區塊中顯示,並且可以透過上下張圖片切換。這邊稍微提一下該軟體的快捷鍵:
W ==>建立Bounding box
A ==>上一張
D ==>下一張
Ctril+S ==> 存XML檔
接下來請點下創建區塊(5),把你想要讓機器學習訓練的物件標註起來。他會出現如上圖所示的黑十字,你在照片上拖曳並放開就完成第一步了。
完成標註後,記得幫你標注的物件作命名的動作,標註完成後他會有以顏色區分不同的標註區塊,而你輸入的標註名稱也會在(6)顯示。
當然一張圖片可以標註非常多種的物件,讓你訓練出的Model辨識廣度越廣,假如你要辨識率越高的話,就要下很多苦功夫去找非常非常多的圖片來標注訓練。
標註完後,請記得按下儲存檔案,如上圖,假如你選擇VOC格式會出現XML檔案,而你可以仔細看到幾個項目。
圖片資料區塊一:該區塊是告訴電腦我的圖片叫什麼名字,在什麼資料夾,路徑在哪。
圖片資料區塊二:該區塊是高速電腦我這個圖片的詳細資料,長度寬度等。
標註資料區:就如上面標註程序中,我標註了兩個物件,RoadLight與RoadSign,在<object>中有列出標註的類別名稱、<x , y , width , height>,並且你可以看到我標註兩個物件而object就有兩個。
小結
上述所帶大家做過安裝並實際完成標注一張圖片,而AI的訓練是要不斷的餵資料,不斷的監督,不斷的增強學習,讓訓練出來的Model能精確地完成辨識,各位手動的先進真的是辛苦了,在未來還有很長的路要走,在下一篇會介紹你再進入Yolo訓練之前要準備的素材與安裝Yolo環境。