旗胜V3论坛 >
YOLO v1深入理解
回复
返回列表
12345 /5页
发帖
回复

查看: 回复:90

YOLO v1深入理解

\"收藏此主题\"

小车成市

 
 
注册:
2007-03-15
  • 0粉丝
  • 0精华
  • 864帖子
小车成市 发表于 56楼
想问一下,最后一层卷积出来的feature map是经过flatten拉平后(和分类网络同样的操作),再接全连接层的吗?
感谢!
 
回复本楼

车世Bo?爵の

 
 
注册:
2007-03-30
  • 0粉丝
  • 0精华
  • 989帖子
感谢博主,帮助很大,有一点小疑问:confidence是根据IOU来计算的,即Confidence = P(object) * IOU。但是在预测阶段没有GT,那么这个时候confidence该怎么计算呢?
 
回复本楼

雁南飞东方

 
 
注册:
2008-01-21
  • 0粉丝
  • 0精华
  • 691帖子
车世Bo?爵の 发表于 59楼
感谢博主,帮助很大,有一点小疑问:confidence是根据IOU来计算的,即Confidence = P(object) * IOU。但是在预测阶段没有GT,那么这个时候confidence该怎么计...
预测时网络输出就是confidence
 
回复本楼

bbcll

 
 
注册:
2008-03-05
  • 0粉丝
  • 0精华
  • 629帖子
nb!!
 
回复本楼

第七乐章

 
 
注册:
2008-04-13
  • 0粉丝
  • 0精华
  • 569帖子
我想问一下,两个bounding box 是先知道对象的位置预测出来的吗?还是对每个grid预测的,一开始标签应该是怎样的,两个bounding box的位置咋填还是在网络的过程中生成的,标准的bounding box有是如何获得的 
 
回复本楼

網事如煙

 
 
注册:
2008-03-17
  • 0粉丝
  • 0精华
  • 910帖子
简单明了,赞
 
回复本楼

煜辈子ai着u

 
 
注册:
2007-01-20
  • 0粉丝
  • 0精华
  • 630帖子
楼主写的十分明白,而且细节给的很全面,太感谢了
 
回复本楼

无锡手超骊威

 
 
注册:
2008-01-03
  • 0粉丝
  • 0精华
  • 469帖子
只有楼主把label怎么制作的给说清楚了
 
回复本楼

mdezsmm

 
 
注册:
2008-03-20
  • 0粉丝
  • 0精华
  • 292帖子
受益匪浅,谢谢作者!阅读时,一直存在一个问题向您请教:您在4.1小节中说:“并不是网格内的信息被映射为30维向量,网格周围的信息也会被识别和整理”,我的理解是,在卷积网络中(全连接看做卷积的话),由于卷积的空间不变性,左上角向量就是由左上角网格决定,即左上角向量的感受野为左上网格内信息,其输出不受周围信息影响,这里一直很困扰!其次,如上述说法成立,yolo每个向量预测,仅由单一网格决定,而单一网格信息有限,对于较大目标无法覆盖特征,那么yolo凭什么通过单一网格预测超出网格很多的目标边框?即yolo算法预测较大目标为什么有效?在此不胜感激!! @X-猪 
 
回复本楼

xjksbc

 
 
注册:
2008-03-31
  • 0粉丝
  • 1精华
  • 713帖子
牛逼,很清楚
 
回复本楼

cyzhj925

 
 
注册:
2008-03-14
  • 0粉丝
  • 0精华
  • 290帖子
第七乐章 发表于 62楼
我想问一下,两个bounding box 是先知道对象的位置预测出来的吗?还是对每个grid预测的,一开始标签应该是怎样的,两个bounding box的位置咋填还是在网络的过...
您好、请问您现在知道了吗
 
回复本楼

cyzhj925

 
 
注册:
2008-03-14
  • 0粉丝
  • 0精华
  • 290帖子
车比马好 发表于 24楼
YOLO的bounding box看起来很像一个grid中2个Anchor,但它们不是。YOLO并没有预先设置2个bounding box的大小和形状,也没有对每个bounding box分别输出一个对...
什么意思?不太懂,我也觉得anchor就是相当于原图感受野、文章不是说了都要回归、有个大概位置就可以吗?
 
回复本楼

yao0217

 
 
注册:
2008-03-30
  • 0粉丝
  • 0精华
  • 686帖子
大佬,请收下我的膝盖
 
回复本楼

SaCa

 
 
注册:
2008-01-02
  • 0粉丝
  • 1精华
  • 422帖子
必须留下我的赞。看过最棒的
 
回复本楼

chengang420

 
 
注册:
2008-04-15
  • 0粉丝
  • 0精华
  • 539帖子
讲得很好便于理解
 
回复本楼

、?彈奏'

 
 
注册:
2008-02-27
  • 0粉丝
  • 0精华
  • 590帖子
这个必须赞,目前我看过的讲解YOLO文章讲的最清楚的,最主要原因是训练部分将的很清楚。
 
回复本楼

nanayang

 
 
注册:
2008-01-21
  • 0粉丝
  • 0精华
  • 532帖子
第七乐章 发表于 62楼
我想问一下,两个bounding box 是先知道对象的位置预测出来的吗?还是对每个grid预测的,一开始标签应该是怎样的,两个bounding box的位置咋填还是在网络的过...
可以参考下一个yolov1的简单实现的数据处理部分的程序https://github.com/yl-jiang/Yolo/blob/master/YOLOV1/data/dataset.py
 
回复本楼

nanayang

 
 
注册:
2008-01-21
  • 0粉丝
  • 0精华
  • 532帖子
mdezsmm 发表于 66楼
受益匪浅,谢谢作者!阅读时,一直存在一个问题向您请教:您在4.1小节中说:“并不是网格内的信息被映射为30维向量,网格周围的信息也会被识别和整理”,我的...
特征提取网络(论文中称darknet)是将输入的(448,448,3)的图片压缩成了(1024, 1,1),之后在此基础之上解回到(7,7,30),因此每个grid的预测应该是看到了整张图片的。
 
回复本楼

mdezsmm

 
 
注册:
2008-03-20
  • 0粉丝
  • 0精华
  • 292帖子
mdezsmm 发表于 66楼
受益匪浅,谢谢作者!阅读时,一直存在一个问题向您请教:您在4.1小节中说:“并不是网格内的信息被映射为30维向量,网格周围的信息也会被识别和整理”,我的...
十分感谢!豁然开朗!谢谢!
 
回复本楼
返回列表
12345 /5页
未登录用户

只可添加一张图片,多张图片请选高级模式

高级模式
温馨提示:回复超10字可获1金币,有独特见解超30字可获3金币,灌水用户将扣除金币并锁号处理。希望广大车友共同维护论坛的友好回复氛围。
常用表情
您可能感兴趣

支付宝扫码询价
领最高888元现金红包

关闭