共 506 篇文章
显示摘要每页显示  条
京东AI开源最强ResNet变体CoTNet:即插即用的视觉识别模块。本文是京东AI研究院梅涛团队在自注意力机制方面的探索,不同于现有注意力机制仅采用局部或者全局方式进行上下文信息获取,他们创造性的将Transformer中的自注意力机制的动态上下文信息聚合与卷积的静态上下文信息聚合进行了集成,提出了一种新颖的Transformer风格的“即插即用”CoT模...
LeCun团队提出MDETR:实现真正的端到端多模态推理|ICCV 2021 Oral.本文提出了MDETR,一种端到端调制检测器,能够根据原始文本query直接来检测图像中的目标,基于Transformer的结构,通过在模型的早期阶段融合这两种模态的信息,来对文本和图像进行共同的推理。因此,本文的作者基于DETR,提出了一个端到端的调制检测器MDETR,结合训练数据中的...
1 MoCo v11.1 自监督学习的 Pretext Task1.2 自监督学习的 Contrastive loss1.3 MoCo v1 之前的做法1.4 MoCo v1 的做法1.5 MoCo v1 FAQ1.6 MoCo v1 实验1.7 MoCo v1 完整代码解读。图8:MoCo方法。2 构造模型 # create model print("=> creating model ''''''''{}'''''''...
ICCV2021|性能优于何恺明团队MoCo v2,DetCo:为目标检测定制任务的对比学习作者丨小马编辑丨极市平台。作者专为目标检测任务“量身定制”了对比学习框架DetCo,在PASCAL VOC数据集上,DetCo在100个epoch时的性能就与MoCo V2 800个epoch的性能差不多,最终性能优于Mask RCNN-C4/FPN/RetinaNet等监督学习的方法。从上图可以看出,虽然Relative-...
本文是香港大学&商汤科技在MLP架构方面的探索,针对MLP-Mixer等已有方案存在的分辨率相关、不便于向下游任务迁移的问题,提出了一种新颖的CycleFC操作,并由此构建了CycleMLP架构。提出了一种新的MLP模块:CycleFC,它是一个广义的即插即用操作,可用于替换MLP-Mixer中的token mixing MLP操作;基于所提CycleFC,我们构建了用于提取分层特...
[2] MDETR : Modulated Detection for End-to-End Multi-Modal Understanding(Oral)paper:https://arxiv.org/pdf/2104.12763code:https://github.com/ashkamath/mdetrproject:https://ashkamath.github.io/mdetr_page/colab:https://colab.research.google.com/github/ashkamath/mdetr/blob/colab/notebooks/MDETR_demo.ipynb.
万字长文细说工业缺陷检测作者丨皮特潘编辑丨极市平台。主要难点场景分析缺陷归纳简单粗暴的可行性分析数据的四大难点数据生成场景VS数据方法论算法积木任务拆分定制分类模型定制语义分割模型语义分割利器dice loss定制目标检测模型正常样本建模工具链技术壁垒总结(一) 主要难点。另外,应用语义分割任务做缺陷检测,其实缺陷检测并不局限语...
不同于现有的通道/空域注意力模块,该模块无需额外参数为特征图推导出3D注意力权值。受启发于人脑注意力机制,本文提出一种3D注意力模块并设计了一种能量函数用于计算注意力权值;本文推导出了能量函数的解析解加速了注意力权值的计算并得到了一种轻量型注意力模块;在正式介绍本文所提注意力模块之前,我们先对现有代表性注意力模块(比如SE、C...
具有与YOLOv4-CSP、YOLOv5-L相当的参数量,YOLOX-L取得了50.0%AP指标同事具有68.9fps推理速度(Tesla V100),指标超过YOLOv5-L 1.8%;值得一提的是,YOLOX-L凭借单模型取得了Streaming Perception(Workshop on Autonomous Driving at CVPR 2021)竞赛冠军。上表对比了所提YOLOX与其他SOTA检测器的性能对比,从中可以看到:相比YOLOv3、YOLOv4、YOL...
用简单Mask分类实现语义分割、实例分割“大一统”!因此本文作者提出将实例分割任务和语义分割任务都用mask分类的范式来处理,并在性能上能够超过当前per-pixel分类的处理范式。因此作者就提出了,将实例分割任务和语义分割任务都用mask分类的范式来处理,并在性能上能够超过当前per-pixel分类的处理范式。1)什么是语义分割(semantic segment...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部