2025/2/3

Fast RCNN

ref: Fast-RCNN 是一種 2stages 的 object detection network。
  • stage 1 : 把image 經過conv 變成 feature map,再用 RPN 把 feature map 上的region (包含物件的區域) 都找出來
  • stage 2 : 把所有regsion 都從 feature map 上切割出來,辨識它們的種類和位置大小
Stage 1 中,找出物件區域的方法,是 Anchor Box.
自己決定feature map 以每個格點為中心,都有N個 anchor box.
這N個 anchor box 的大小和長寬比例都不一樣。

然後再 feature map 上,針對每個格點上的每個 anchor box,判斷他是哪一個 class,或是都不是,就指定他是 background class。
所以RPN 的輸出是 class 和 regression(box 的 w,h).
然後每個featuer map 的格點都有 N 個 anchor box 對應的 class 和 regbox 值。
class : W, H, anchor_number, 2
Regre : W, H, anchor_numbwe, 4

沒有留言:

張貼留言