安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活112

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

199的电信套餐下个月到期了。。。现在有啥便宜点的不。。

作者: Lautumn    时间: 2025-1-7 11:13标题: 199的电信套餐下个月到期了。。。现在有啥便宜点的不。。我要求不高啊,只想要个稳定的宽带,300M500M都够,因为我就是看剧...

飙升17%!拼命发钱催生后,第一个出生率暴涨的城市出现了

作者: keqile    时间: 前天 09:01湖北天门这样的五线小城,重赏之下必有勇夫作者: 亚洲小海    时间: 前天 09:08中国的政局坚如磐石!真心话、你有那反抗精神不如躺下来享受。说...

今天凌晨得知身边同事被勒令吐出几万块大洋,惨不忍睹

作者: 阿里克斯    时间: 4 天前年底糟心事,由于在此次绩效考核当中,没有达到要求,不仅是从现在开始降低级别,还要把前两年的钱吐出来,残忍至极,说明已经紧张到这种地步,不过同事马上船要靠岸了吧,...

请教现在离市区最近的科目一考试地点是哪个?

作者: yinvn88    时间: 3 天前江宁车管所吗?作者: wuwuwu2008    时间: 3 天前尧化门有个点作者: 728-弈成    时间: 3 天前wuwuwu2008 发表于 2...

霍乱时期的爱情

作者: 吉吉大人    时间: 前天 17:22电影不错,豆瓣7.4分,抛去化妆,我感觉没有什么不好的.一个男人睡了600多个女人,第一次竟然是被一个女人强暴的,脸都没看清,50多年后终于睡了自己最初...