安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活286

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

最近在追剧《驻站》不错,推荐

作者: 野兽良民    时间: 前天 14:32基层民警的故事,没有流量明星,推荐p2902107322.jpg (532.5 KB, 下载次数: 0)下载附件前天 14:31 上传作者: 数码爱好者...

杜甫的诗,确实好啊。

作者: Stamp    时间: 前天 18:53没有华丽的辞藻,用朴实的语言直击心灵。无边落木萧萧下,不尽长江滚滚来。万里悲秋常作客,百年多病独登台。作者: npcjy    时间: 前天 18:5...

网上买了一双迪卡侬登山鞋

作者: 大母鸡    时间: 昨天 07:51一看义务发货靠谱不作者: 泡泡虾    时间: 昨天 09:49拿到迪卡侬店里面去问一下作者: 无水的鱼    时间: 昨天 11:26 本帖最后由 无水...

流量为王,鹿哈向网红女友求婚成功!带货一天净赚500万

作者: 弱电门禁    时间: 3 天前 本帖最后由 弱电门禁 于 2025-1-19 17:17 编辑 我还想了半天,鹿晗女朋友不是关晓彤啊,证明改成兔兔了,什么情况啊,再定睛一看,喔,是鹿哈,不是...

鹿哈向女友求婚成功,七个月赚3500万

作者: 阿里克斯    时间: 昨天 15:35大家伙看看吧,就模仿鹿晗,这财富效应,架不住东大人口多啊。作者: npcjy    时间: 昨天 15:53要不你也模仿一个?比苦哈哈的求人加名字强多了...