2024/10/19

Yolov1 筆記

ref:
原來yolov1 的 label 是: object 的中心是否在這個方格中心 ?
所以不是物件影像包含的方格,label 都會有值。
只有包含物件中心點的方格,label 會有值。

然後 label 的內容,就是:
  • 物件中心的位置
  • 物件的寬和高
  • 物件的種類

在 pytorch 2.4.1 上測試 ref 的 code 會有Error,所以修改了,放在
從這個實作可以看到,yolov1 的converlution layer 用了 resnet50 的,也就是普通的CNN,後面用 兩個 fully connection layer 轉成 output.
train 的時候直接用 pretain 好的 CNN 層,甚至 fix 住,不做grade, 只靠兩個 fully connection layer,就要生出設計的 label 格式:

yolov1 設計的 output 的表示方式:
  • 7 x 7 的方塊
  • 每個方塊有一個 outputlabel 資料
  • output label 的內容是...
然後就把 VOC 的label Data轉成自己規定的格式,用這個格式去 train,讓中間的兩格 converlution layer train 出他要的結果。

所以可以說,yolo 的精隨,就是他發明的output labeling.
雖然只用了兩層 fully connection layer 就完成他要的轉換。但是這兩層各有 512 個 cell....

沒有留言:

張貼留言