自监督学习新范式CAE:为什么 MIM 比对比学习更适合下游任务?( 三 )
对同一图像的不同剪裁提取全局语义 , 实际上学到的是原始图像中主体对象的特征 , 正因如此 , 同一图像的不同剪裁之间才可能相似 。 在监督预训练中 , 受到图像分类标签的约束 , 网络学习到的也是图像主体区域的特征 , 这和对比学习学到的知识有很大的相似之处 , 因此在下游任务表现类似 。
3.5MIM和对比学习的区别
【自监督学习新范式CAE:为什么 MIM 比对比学习更适合下游任务?】MIM方法(例如CAE)基于可见patch的表征 , 对掩码patch区域做预测 。 在做随机掩码时 , 图像的每个patch(例如背景区域的对象/stuff)都有可能被考虑到 , 而不仅仅是图像的主体区域 。 为了做好掩码patch的预测 , CAE会学好每个patch的表征 。
- 洪水|洪水袭来怎么办 逃生自救指南请收好
- 位于广东省阳江市的海陵岛自然资源丰富,景色优美,该岛没有 神奇海洋6月28日答案
- 网友热议|母亲回应3个孩子2个上清华:只能教孩子做人诚实守信 学习都靠自己努力
- 苹果|抢台积电3nm产能!苹果自研处理器M2 Pro/M3齐曝光 性能更强
- 英特尔|两倍变焦自拍能有多大区别?苹果、三星、OPPO自拍样张解析
- 唯一拥有蓝色血液的生物,活了4亿年,救得了数万人却救不了自己
- 显示器|买到就是赚到?这台300块的显示器快把我整自闭了
- 小米Civi,推荐给喜欢高颜值外观的自拍达人
- 马云|马云自己\打脸\之前所说的,如今现身西班牙,开12亿游艇!
- iqoo|iQOO 10系列搭载蓝厂自研V1 ISP芯片 有望首发天玑9000+新机版本
