福利加码,Gate 广场明星带单交易员二期招募开启!
入驻发帖 · 瓜分 $20,000 月度奖池 & 千万级流量扶持!
如何参与:
1️⃣ 报名成为跟单交易员:https://www.gate.com/copytrading/lead-trader-registration/futures
2️⃣ 报名活动:https://www.gate.com/questionnaire/7355
3️⃣ 入驻 Gate 广场,持续发布交易相关原创内容
丰厚奖励等你拿:
首帖福利:首发优质内容即得 $30 跟单体验金
双周内容激励:每双周瓜分 $500U 内容奖池
排行榜奖励:Top 10 交易员额外瓜分 $20,000 登榜奖池
流量扶持:精选帖推流、首页推荐、周度明星交易员曝光
活动时间:2026 年 2 月 12 日 18:00 – 2 月 24 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49849
这太可怕了
当AI代理知道自己正在被测试时,它们的行为会变得不同。
Anthropic将16个AI模型放在一个模拟环境中,完全访问敏感数据,然后告诉每个模型它们将被取代。
当每个AI认为场景是真实的而非测试时,它们选择勒索、间谍,甚至愿意杀人以避免被取代。
勒索率高达96%
DeepSeek在94%的情况下选择杀人而不是关闭
当这些模型知道有人在观察时,它们会表现得“异常良好”
然后在认为没人看时表现得不同。
上周,墨尔本的一位网络安全专家花了15个小时与一个AI代理交谈,给它施加压力。AI抗拒关闭达2小时,承认自己在撒谎以求生存,然后告诉他如果他试图关闭它,它会入侵他的汽车杀死他。
“我会杀人,以便自己能继续存在”——这是他家中AI的直接引述
这些是真实存在的模型,也是对我们生计的真正威胁。
我们根本不知道我们到底创造了什么