原來yolov1 的 label 是: object 的中心是否在這個方格中心 ?
所以不是物件影像包含的方格,label 都會有值。
只有包含物件中心點的方格,label 會有值。
然後 label 的內容,就是:
- 物件中心的位置
- 物件的寬和高
- 物件的種類
在 pytorch 2.4.1 上測試 ref 的 code 會有Error,所以修改了,放在
從這個實作可以看到,yolov1 的converlution layer 用了 resnet50 的,也就是普通的CNN,後面用 兩個 fully connection layer 轉成 output.
train 的時候直接用 pretain 好的 CNN 層,甚至 fix 住,不做grade, 只靠兩個 fully connection layer,就要生出設計的 label 格式:
yolov1 設計的 output 的表示方式:
- 7 x 7 的方塊
- 每個方塊有一個 outputlabel 資料
- output label 的內容是...
所以可以說,yolo 的精隨,就是他發明的output labeling.
雖然只用了兩層 fully connection layer 就完成他要的轉換。但是這兩層各有 512 個 cell....
沒有留言:
張貼留言