发文章
发文工具
撰写
网文摘手
文档
视频
思维导图
随笔
相册
原创同步助手
其他工具
图片转文字
文件清理
AI助手
留言交流
机器之心编辑部
来自: 天承办公室 > 《022机器之心》
0条评论
发表
请遵守用户 评论公约
AGI之MFM:《多模态基础模型:从专家到通用助手》翻译与解读之统一的视觉模型、加持LLMs的大型多模态模型
除了RLHF(Gunjal等人,2023)、密集预测(Wang等人,2023h;Zang等人,2023;Chen等人,2023d)、视频(Zhang等人,2023f;Luo等人,2023c;Li等人,2023i)、图像生成(Koh等人,2023)和体验代理(M...
像人一样编辑源代码,谷歌大脑提出神经网络也可以学“编程”
在隐式表征中,研究者考虑一个简单的序列到序列模型以及一个基于注意力的双向模型,后者拥有一个生成编辑位置的指针网络 head 和一个生...
大道至简,何恺明新论文火了:Masked Autoencoders让计算机视觉通向大模型
它基于两个核心理念:研究人员开发了一个非对称编码器 - 解码器架构,其中一个编码器只对可见的 patch 子集进行操作(没有掩蔽 token)...
ACMMM 2021-多模态宝藏!京东梅涛团队重磅开源第一个适用于多个任务的多模态代码库x-modaler
同时,由于有些阶段(如跨模块态交互)的有效模块化设计是在不同的视觉语言任务中共享的,因此x-modaler可以扩展到跨模态分析中其他任务...
老码农眼中的大模型(LLM)
老码农眼中的大模型(LLM)基于大模型的 ChatGPT 给我们带来了极大的震撼,那么什么是大模型呢?鉴于基于解码器的模型在生成性人工智能...
这一次,脑机接口可以实时读取人类脑中画面了?
由俄罗斯脑机接口公司 Neurobotics、莫斯科物理技术学院(MIPT)研发的一种全新脑机接口算法最近被公之于众,它可以利用人工神经网络和...
当AI也精通了「读唇术」:戴上口罩或许是我最后的倔强
数据集研究者提出了一个新的基准数据集,用于无约束唇语合成,以探索如何准确地从一个人的唇部动作推断出 ta 讲话的方式和内容。实验研...
工业检测:基于密集尺度特征融合&像素级不平衡学习框架
工业检测:基于密集尺度特征融合&像素级不平衡学习框架(论文下载)所提出的模型采用经典的编码器-解码器框架,其中使用预训练的神...
大型语言模型与知识图谱协同研究综述:两大技术优势互补
而在用 LLM 来增强知识图谱方面,LLM 已被用于多种与知识图谱相关的应用,比如知识图谱嵌入、知识图谱补全、知识图谱构建、知识图谱到文...
微信扫码,在手机上查看选中内容