个人名片
loading... |
馆藏文件夹
loading...
馆藏关键词
loading... |
馆藏
- 一些通用的Makefile文件模板 (阅38)24-01-11
- 领域/场景大模型也太难训了吧 (阅181)23-09-12
- PEFT | Transformer参数量、计算量... (阅1054)23-09-06
- 23-09-06
- 浅析 | 大语言模型细节、训练及微调 (阅202)23-09-06
- 23-08-25
- 关于大语言模型的11个应用方向和16... (阅364)23-07-26
- 23-07-26
- 23-07-19
- 650亿参数,8块GPU就能全参数微调:... (阅47)23-06-21
- FinGPT:一个「专用于金融领域」的... (阅157)23-06-19
- FinGPT:一个「专用于金融领域」的... (阅1737)23-06-19
- 23-06-16
- 23-06-16
- 社区供稿 | RLHF 实践中的框架使用... (阅414)23-06-16
- 23-06-13
- pdfGPT——通过AI与上传的PDF文件进... (阅764)23-06-13
- LLM遍地开花,盘点过去一个月那些开... (阅167)23-06-13
- 23-06-13
- 陈丹琦团队新作:单卡A100可训300亿... (阅69)23-06-13
- 多模态的过渡态——Latent Modal (阅28)23-06-13
- 600条最强Linux命令总结 (阅1)23-06-13
- 中文LLaMA&Alpaca大语言模型词表扩... (阅1996)23-06-09
- 直白图解GPT2模型Self Attention注... (阅1143)23-06-07
- LaVIN—多模态对话模型的高效指令微... (阅14)23-06-06
- 文本生成模型解码策略和采样方法对... (阅1586)23-06-06
- 也读Lawyer LLaMA法律领域微调大模... (阅1916)23-06-06
- 近乎完美!最强算术语言模型: Goar-... (阅20)23-06-06
- 大模型幻觉问题专栏 (阅411)23-06-06
- 大幅优化推理过程,字节高性能Trans... (阅17)23-06-06
360doc推荐的文章
loading... |
我推荐的文章
loading... |
最近最受欢迎的文章
- LLM+LoRa微调加速技术原理及基于PEF... (阅2355)23-04-18
- Meta最新模型LLaMA语言模型细节与代... (阅2272)23-03-07
- 史上最全网络模拟器,大集合! (阅2135)23-04-24
- 【LLM系列之Tokenizer】如何科学地... (阅2007)23-06-05
- 中文LLaMA&Alpaca大语言模型词... (阅1996)23-06-09
- 也读Lawyer LLaMA法律领域微调大模... (阅1916)23-06-06
- ChatIE:通过与ChatGPT对话实现零样... (阅1787)23-03-13
- FinGPT:一个「专用于金融领域」的... (阅1737)23-06-19
- MiniGPT-4实现原理及其核心BLIP2模... (阅1706)23-05-03
- 大模型训练之概念篇 (阅1628)23-04-21
- 极低资源条件下如何微调大模型:LoR... (阅1612)23-04-01
- 文本生成模型解码策略和采样方法对... (阅1586)23-06-06
- 中文大模型安全评测平台 (阅1575)23-03-20
- 23-06-16
- 五万字综述!深度解读微调新范式Pro... (阅1344)23-04-16
关注的关键词
loading... |