High Altitude Oolong: Yolov1 筆記

2024/10/19

Yolov1 筆記

ref:

Yolo V1 (Pascal VOC) | Simplistic Pytorch Implementation from scratch

原來yolov1 的 label 是： object 的中心是否在這個方格中心 ?
所以不是物件影像包含的方格，label 都會有值。
只有包含物件中心點的方格，label 會有值。

然後 label 的內容，就是：

物件中心的位置
物件的寬和高
物件的種類

在 pytorch 2.4.1 上測試 ref 的 code 會有Error，所以修改了，放在

yolov1.ipynb

從這個實作可以看到，yolov1 的converlution layer 用了 resnet50 的，也就是普通的CNN，後面用兩個 fully connection layer 轉成 output.
train 的時候直接用 pretain 好的 CNN 層，甚至 fix 住，不做grade, 只靠兩個 fully connection layer，就要生出設計的 label 格式:

yolov1 設計的 output 的表示方式:

7 x 7 的方塊
每個方塊有一個 outputlabel 資料
output label 的內容是...

然後就把 VOC 的label Data轉成自己規定的格式，用這個格式去 train，讓中間的兩格 converlution layer train 出他要的結果。

所以可以說，yolo 的精隨，就是他發明的output labeling.
雖然只用了兩層 fully connection layer 就完成他要的轉換。但是這兩層各有 512 個 cell....

High Altitude Oolong

2024/10/19

Yolov1 筆記

沒有留言:

張貼留言