个人名片
loading... |
馆藏文件夹
loading...
馆藏关键词
loading... |
馆藏
- 一些通用的Makefile文件模板 (阅7)01-11
- 领域/场景大模型也太难训了吧 (阅78)23-09-12
- PEFT | Transformer参数量、计算量... (阅526)23-09-06
- 23-09-06
- 浅析 | 大语言模型细节、训练及微调 (阅142)23-09-06
- 23-08-25
- 关于大语言模型的11个应用方向和16... (阅298)23-07-26
- 23-07-26
- 23-07-19
- 650亿参数,8块GPU就能全参数微调:... (阅42)23-06-21
- FinGPT:一个「专用于金融领域」的... (阅107)23-06-19
- FinGPT:一个「专用于金融领域」的... (阅1643)23-06-19
- 23-06-16
- 23-06-16
- 社区供稿 | RLHF 实践中的框架使用... (阅345)23-06-16
- 23-06-13
- pdfGPT——通过AI与上传的PDF文件进... (阅726)23-06-13
- LLM遍地开花,盘点过去一个月那些开... (阅163)23-06-13
- 23-06-13
- 陈丹琦团队新作:单卡A100可训300亿... (阅53)23-06-13
- 多模态的过渡态——Latent Modal (阅24)23-06-13
- 600条最强Linux命令总结 (阅1)23-06-13
- 中文LLaMA&Alpaca大语言模型词表扩... (阅1570)23-06-09
- 直白图解GPT2模型Self Attention注... (阅808)23-06-07
- 23-06-06
- 文本生成模型解码策略和采样方法对... (阅1424)23-06-06
- 也读Lawyer LLaMA法律领域微调大模... (阅1667)23-06-06
- 近乎完美!最强算术语言模型: Goar-... (阅19)23-06-06
- 大模型幻觉问题专栏 (阅366)23-06-06
- 大幅优化推理过程,字节高性能Trans... (阅14)23-06-06
360doc推荐的文章
loading... |
我推荐的文章
loading... |
最近最受欢迎的文章
- LLM+LoRa微调加速技术原理及基于PEF... (阅2224)23-04-18
- Meta最新模型LLaMA语言模型细节与代... (阅2210)23-03-07
- 史上最全网络模拟器,大集合! (阅2076)23-04-24
- 也读Lawyer LLaMA法律领域微调大模... (阅1667)23-06-06
- ChatIE:通过与ChatGPT对话实现零样... (阅1648)23-03-13
- FinGPT:一个「专用于金融领域」的... (阅1643)23-06-19
- MiniGPT-4实现原理及其核心BLIP2模... (阅1591)23-05-03
- 中文LLaMA&Alpaca大语言模型词... (阅1570)23-06-09
- 极低资源条件下如何微调大模型:LoR... (阅1570)23-04-01
- 【LLM系列之Tokenizer】如何科学地... (阅1540)23-06-05
- 大模型训练之概念篇 (阅1512)23-04-21
- 文本生成模型解码策略和采样方法对... (阅1424)23-06-06
- 23-06-16
- 五万字综述!深度解读微调新范式Pro... (阅1110)23-04-16
- 中文大模型安全评测平台 (阅1086)23-03-20
关注的关键词
loading... |