发文章
发文工具
撰写
网文摘手
文档
视频
思维导图
随笔
相册
原创同步助手
其他工具
图片转文字
文件清理
AI助手
留言交流
来自: 长沙7喜 > 《新闻》
0条评论
发表
请遵守用户 评论公约
2025,DeepSeek崛起!英伟达一夜市值蒸发近6000亿美元
Janus-Pro 的多模态理解与视觉生成结果DeepSeek 研究团队在他们的论文中表示:「Janus Pro 是一个高效的视觉模型系列,旨在实现性能与计...
梁文锋新论文:大模型底层革命:从 DSV3 看 AI 硬件与模型的协同进化
梁文锋新论文:大模型底层革命:从 DSV3 看 AI 硬件与模型的协同进化。中国 AI 公司深度求索(DeepSeek-AI)推出的 DeepSeek-V3,正是针...
梁文锋硬核科普:用大白话给你讲透 mHC,这条“智能高速路”怎么让大模型训练快、稳、省?
梁文锋硬核科普:用大白话给你讲透 mHC,这条“智能高速路”怎么让大模型训练快、稳、省?我是梁文锋,我来用大白话给你讲讲 mHC(流形约束超连接) 是怎么回事,它为啥牛,怎么解决大模型训练的“老大...
中国工程院院士揭秘:DeepSeek究竟厉害在哪里
快科技1月17日消息,在AI领域,DeepSeek带来的影响力,一点也不亚于“六代机”。郑纬民指出,“DeepSeek自研的MLA架构和DeepSeek MOE架...
《自然》期刊打肿了欧神的脸
《自然》期刊打肿了欧神的脸。一、deepseek创造历史。因为deepseek r1的论文已经登上了《Nature》(自然)期刊的封面。事实上,《自然》...
打败月之暗面的,不是广东老乡的DeepSeek
打败月之暗面的,不是广东老乡的DeepSeek.在资本的热捧下,月之暗面迅速成为国内大模型领域最具话题性的公司之一,与MiniMax、智谱AI、...
DeepSeek竟被小学生攻破?揭开AI巨头不敢说的秘密
揭开AI巨头不敢说的秘密。凑近一看,他们居然在用DeepSeek调试自动驾驶模型,有个戴眼镜的男孩随口说了句:'''''...
万字长文解构DeepSeek V1/V2/V3/R1进化史:从算法革命到推理涌现!
MOE架构1.基于 DeepSeek V3 基座模型2.结合冷启动数据的强化学习。DeepSeek-V3.● 知识蒸馏:从DeepSeek-R1 系列模型中蒸馏推理能力,将...
DeepSeek-R1模型架构深度解读(四)弄懂Multi-Token Prediction
:1 上面接了多输出Head,每个Head负责预估一个token, ????????1 负责预估 next token, ????????2 负责预估 next next token , 以此类...
微信扫码,在手机上查看选中内容