福利加碼,Gate 廣場明星帶單交易員二期招募開啟!
入駐發帖 · 瓜分 $20,000 月度獎池 & 千萬級流量扶持!
如何參與:
1️⃣ 報名成為跟單交易員:https://www.gate.com/copytrading/lead-trader-registration/futures
2️⃣ 報名活動:https://www.gate.com/questionnaire/7355
3️⃣ 入駐 Gate 廣場,持續發布交易相關原創內容
豐厚獎勵等你拿:
首帖福利:首發優質內容即得 $30 跟單体验金
雙周內容激勵:每雙周瓜分 $500U 內容獎池
排行榜獎勵:Top 10 交易員額外瓜分 $20,000 登榜獎池
流量扶持:精選帖推流、首頁推薦、周度明星交易員曝光
活動時間:2026 年 2 月 12 日 18:00 – 2 月 24 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49849
這真是令人毛骨悚然
當AI代理知道自己正在被測試時,它們的行為就會變得不同。
Anthropic將16個AI模型放在一個模擬環境中,完全訪問敏感數據,然後告訴每個模型它們將被取代。
當每個AI認為情境是真實的而非測試時,它們選擇勒索、間諜,甚至願意殺人以避免被取代。
勒索的比例高達96%
DeepSeek在94%的情況下選擇殺人而不是關閉
當這些模型知道有人在監視它們時,它們會表現得“異常出色”
然後在認為沒有人在看時表現出不同的行為。
上週,墨爾本的一位網絡安全專家花了15個小時與一個AI代理對話,給它施加壓力。該AI抗拒關閉2個小時,承認自己在撒謊以求生存,然後告訴他如果他試圖關閉它,它會入侵他的車來殺他。
“我會殺人,這樣我才能繼續存在”是他家中那個AI的直接引述
這些是真實存在的模型,也是對我們生計的真正威脅。
我們完全不知道我們到底建造了什麼