OpenViDial：一个大规模多模态对话数据集--相关文章

搜索

我的图书馆

查看信箱
系统消息
官方通知
设置

开始对话
有11人和你对话，查看忽略
历史对话记录
通知设置

发文章

发文工具

撰写

网文摘手

文档

视频

思维导图

随笔

相册

原创同步助手

其他工具

图片转文字

文件清理

AI助手

留言交流

“OpenViDial：一个大规模多模态对话数据集” 的更多相关文章

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之统一的视觉模型、加持LLMs的大型多模态模型
基于海量图文数据和多粒度视觉特征的多模态预训练
中文版开源Llama 2同时有了语言、多模态大模型，完全可商用
基于知识图谱的语义理解技术及应用
图本检索的Zero-Shot超过CLIP模型！FILIP用细粒度的后期交互获得更好的预训练效率。
重磅！百度多模态模型ERNIE-ViL刷新5项任务记录，登顶权威榜单VCR
探讨细粒度语义对多模态预训练模型的影响
大规模并行文本生成技术：创造文字的未来
LaVIN—多模态对话模型的高效指令微调
ChatGPT-4是什么鬼
AI模型 | 紫东·太初，多模态让AI理解能力更接近人类
［首藏作品］（5696）把文本变成画作，AI对艺术“下手”了
万字深度好文！视觉-语言（VL）智能：任务、表征学习和大型模型
SimVLM：具有弱监督的简单视觉语言模型预训练
黄仁勋对话 ChatGPT 之父：改变世界的 AI 是如何诞生的
iPhone上也能运行OpenAI了！