StableVicuna

4周前发布 1 00

第一个通过RLHF训练的大规模开源聊天机器人

收录时间：

2024-11-24

打开网站手机查看

AI训练模型平台

StableVicuna

StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习（RLHF）训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本，它是一个指令微调的 LLaMA 130亿模型。

数据统计

暂无评论

暂无评论...

StableVicuna

数据统计

相关导航

StableLM

Lamini

悟道

Llama 3

魔搭社区

豆包大模型

阿里巴巴M6

Gemma

暂无评论