分享

实测超强!自学深度学习时的4种数据集检索方法分享!超35万个优质数据集!

 葛医生_EP日记 2024-04-26 发布于广西

自己在学习深度学习时,有哪些途径是可以找到数据集的?

今天就给大家分享我所有认为最好用的途径和方法,总共4种!

第一种,去竞赛网站去找数据集

首先推荐的是大名鼎鼎的竞赛社区kaggle,总共有超过320050个数据集!还有非常多有意思的数据集,像著名的泰坦尼克号数据集、鸢尾花数据集等,你也可以通过参加kaggle机器学习比赛来下载相关的一些数据集,质量都挺高的。

图片

https://www./datasets

对了,这里先插一句,我自己也给大家整理一份包含70个机器学习深度学习常用数据集文档,每个都是优质常用数据集,每个数据集的下载地址和介绍都给大家整理好了,还有这份我自己整理的463篇神经网络核心论文的pdf与代码,有目前主流的神经网络模型以及变体模型。

因网盘易和谐,如果你需要的话可以直接长按扫码添加下方小助手微信,让她无偿发送给你最新链接!

图片

图片

图片

再就是阿里云举办的竞赛平台天池大赛!当中的数据集完全都是来自真实业务场景,每场赛事积累下的课题和数据集在天池都会保留和开放,并且在这里对数据集进行了不同领域不同类型的划分,方便你筛选和检索。

图片

https://tianchi.aliyun.com/dataset/?tag=all-computervision

第二种,通过论文找数据集

你可以多去找找和你方向强相关的优质论文,然后再通过github、papers with code之类的检索数据集下载,这里重点提一下,papers with code这个网站非常棒,里面不仅几乎包含了人工智能领域所有带有代码的论文,还覆盖了9747个常用的数据集,还能帮你及时追踪最新最前沿的论文。

图片

图片

https:///sota

如果别人论文的数据集不可以公开下载,你可以先去论文发表的期刊官网看看能不能下载数据集,还有就是可以通过给论文作者发邮件索取试一试。

第三种,深度学习框架pytorch内置的一些经典数据集

一般深度学习框架中都会内置像minist、cifar-10、cifar-100、imagenet等等经典常用的数据集,用来做入门实操项目也非常够用了,主要是非常方便。

图片

第四种:可以去谷歌的这个网站进行数据集检索,基本你想要的数据集都可以在这里检索到

图片

https://datasetsearch.research.google.com/

还有就是基于公开数据集来创建自己的数据集,像图像加遮挡、音频加噪声等等等等。

这些就是我认为查找数据集最有效的四种方法,希望对你有帮助!

我是future,我们下期再见,拜拜!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多