以下是一些常用的人工智能数据集: 1. CIFAR-10:包含了60,000张彩色图片,共分为10个类别。 2. MNIST:包含了60,000张灰度图片,用于手写数字识别任务。 3. ImageNet:包含了超过14,000,000张图像,涵盖了超过20,000个类别。 4. COCO:包含了超过200,000张图像,用于图像注释、图像分割等任务。 5. 20 Newsgroups:包含了20个主题的新闻组文章,用于文本分类任务。 6. IMDB电影评论数据集:包含了50,000条电影评论,分为正面和负面两类。 7. Enron电子邮件数据集:包含了50万封邮件的数据,可用于文本数据分析任务。 8. LFW人脸识别数据集:包含了13,000多张名人的面部图像。 9. Penn Treebank:包含了超过4.5百万个单词的新闻文章,用于语言建模等任务。 10. SQuAD:包含了10万个问题和40万个答案的数据集,用于问答系统等任务。 以上只是一小部分常见的人工智能数据集,还有很多其他领域的数据集可供使用。 |
|
来自: yulinmufengde > 《待分类》