Carpe diem
<aside> 💡 Tags: Reinforcement Learning, Large Language Model, Pretrain Model
</aside>
从统一视角理解 Parameter Efficient Finetune
NewBing vs. ChatGPT vs. LaMDA : 强化学习能否提高搜索生产力
从强化学习视角聊聊 ChatGPT
【Transformer 基础系列】手推显存占用