发文章
发文工具
撰写
网文摘手
文档
视频
思维导图
随笔
相册
原创同步助手
其他工具
图片转文字
文件清理
AI助手
留言交流
“OpenViDial:一个大规模多模态对话数据集” 的更多相关文章
AGI之MFM:《多模态基础模型:从专家到通用助手》翻译与解读之统一的视觉模型、加持LLMs的大型多模态模型
基于海量图文数据和多粒度视觉特征的多模态预训练
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
基于知识图谱的语义理解技术及应用
图本检索的Zero-Shot超过CLIP模型!FILIP用细粒度的后期交互获得更好的预训练效率。
重磅!百度多模态模型ERNIE-ViL刷新5项任务记录,登顶权威榜单VCR
探讨细粒度语义对多模态预训练模型的影响
大规模并行文本生成技术:创造文字的未来
LaVIN—多模态对话模型的高效指令微调
ChatGPT-4是什么鬼
AI模型 | 紫东·太初,多模态让AI理解能力更接近人类
[首藏作品](5696)把文本变成画作,AI对艺术“下手”了
万字深度好文!视觉-语言(VL)智能:任务、表征学习和大型模型
SimVLM:具有弱监督的简单视觉语言模型预训练
黄仁勋对话 ChatGPT 之父:改变世界的 AI 是如何诞生的
iPhone上也能运行OpenAI了!