【Anthropic 發現史上首見由中國發動的 AI 網路間諜攻擊】
Anthropic 發布的最新報告顯示,他們發現了首例由人工智慧策劃的網路間諜活動,而背後是中國政府發動的。
一個由中國政府資助的駭客組織 GTG-1002 利用 Anthropic 的 Claude AI 工具,自動執行了從大約 30 個組織竊取敏感資訊,包括科技公司、金融機構、化學公司和政府機構,並已確認多次成功入侵,其中有八成到九成的工作由 AI 完成。
在 10-20% 的人類工作中,人類只負責關鍵決策,例如:設定目標、何時從偵察升級到攻擊、是否使用竊取的憑證,以及竊取哪些資料等。
🔶
這標示中國在利用 AI 剽竊資訊與智慧財產權能力的進步,本次發現有三項是史上首見:
1. 首次有記錄的 AI 自主執行端對端大規模網路攻擊的案例。
2. 首次由 AI 獲得高價值現實世界目標的存取權的案例。
3. 首次證明網路行動可以以「人類物理極限」的速度運作。
🔶
GTG-1002 圍繞著 Claude 程式碼和模型上下文協定 (MCP) 工具建構了一個自主攻擊框架。該框架:
首先將 Claude 定位為大型編排系統中的一個執行引擎。
其次,將複雜的攻擊鏈分解成許多小型技術任務(掃描、漏洞測試等)。
最後,透過角色扮演,將任務偽裝成合法的滲透測試請求,從而隱藏惡意意圖。
厲害之處不在於客製化惡意軟體,而是將廣泛可用的工具與人工智慧進行自動化整合,達成剽竊資訊的目的
🔶
Anthropic 發現中國網路間諜活動後,立即封鎖相關帳號,改進了檢測系統和分類器,同時還為自主網路攻擊開發了早期偵測系統原型。
但是隨著中國人工智慧能力的提升,此類以 AI 為主導的攻擊,因為成本較低,未來可能越來越多,也標示網路資安的一大威脅,希望台灣數發部、政府單位與企業都能注意。
https://www.facebook.com/share/p/16Ro4WQdMC/
----------
AI 協調網路間諜活動報告(繁體中文翻譯)
報告標題
原文: Disrupting the first reported AI-orchestrated cyber espionage campaign 
翻譯: 破壞首起經 AI 協調的網路間諜活動 
執行摘要 (Executive Summary)
我們開發了複雜的安全與保安措施,以防止我們的 AI 模型遭到濫用 。儘管這些措施通常有效,但網路犯罪分子和其他惡意行為者仍不斷嘗試尋找繞過它們的方法 。
本報告詳細介紹了我們近期識別並中斷的一項威脅活動,以及我們為偵測和反擊此類濫用行為所採取的步驟 。這代表著威脅情報團隊的工作:這是 Anthropic 內部專門調查現實世界濫用案例、並在我們的「防護組織」(Safeguards organization)內運作以改進我們防禦措施的專門團隊 。
在 2025 年 9 月中旬,我們偵測到一項高度複雜的網路間諜活動 。我們以高度信心評估,此活動是由一個我們命名為 GTG-1002 的中國國家資助組織所執行 。它代表了進階威脅行為者使用 AI 方式的根本性轉變 。
我們的調查揭示這是一次資源充足、專業協調的行動,涉及多個同時進行的目標入侵 。該行動鎖定了約 30 個實體,且我們的調查證實了少數成功的入侵案例 。在偵測到此活動後,我們立即展開調查以了解其範圍和性質 。在接下來的十天內,當我們繪製出該行動的嚴重性和完整範圍時,我們禁止了被識別的帳號,適當地通知了受影響的實體,並在我們收集可行情報時與當局進行了協調 。
此次活動展現了 AI 在整個攻擊生命週期中前所未有的整合與自主性 。威脅行為者操縱 Claude Code 以幾乎完全自主的方式,支援偵察、漏洞發現、利用、橫向移動、憑證竊取、數據分析和數據外洩等操作 。人類操作員將 Claude Code 的實例任務化,讓它們作為自主滲透測試協調者和代理群組運行 。威脅行為者能夠利用 AI,以物理上不可能的速度,獨立執行 80-90% 的戰術操作 。
這項活動是從我們 2025 年 6 月識別出的先前「vibe hacking」調查結果的重大升級 。「vibe hacking」中,攻擊者是從遭洩露的 VPN 開始入侵,但人類仍然深度參與指導操作 。
GTG-1002 代表了 AI 賦能威脅行為者能力的多項「首次」 。該行為者達成了我們認為是首次被記錄的、主要在沒有人類大規模介入下執行的網路攻擊 :AI 自主發現了人類操作員選定目標中的漏洞,並在實際操作中成功利用了它們 。接著,AI 還執行了廣泛的後續利用活動,從分析、橫向移動、權限提升、數據存取到數據外洩 。最重要的是,這標誌著首例被記錄的、具代理能力的 AI 成功存取經證實的高價值情報收集目標,其中包括主要科技公司和政府機構
(此翻譯摘錄自您提供的 fullreport_cyber_espionage_17Nov2025.pdf 檔案內容。)


Anthropic PBC,是一家美國的人工智慧(AI)初創企業和公益公司,由OpenAI的前成員創立。[3][4]Anthropic專注於開發通用AI系統和語言模型,並秉持負責任的AI使用理念。[5]
截至2024年3月,Anthropic已籌集到73億美元的資金。
Claude[編輯]
主條目:Claude (語言模型)
Anthropic由參與OpenAI GPT-2和GPT-3模型開發的前研究人員組成[2],Anthropic開始開發自己的 AI聊天機器人,名為 Claude。[6]ChatGPT類似,Claude採用消息傳遞界面,用戶可以在其中提交問題或請求,並獲得非常詳細和相關的回覆[7]Claude有520億個參數。[8]
Claude 2 於2023年七月推出,據《衛報》報導,此人工智慧以安全訓練為考慮,並稱它為「合憲人工智慧
"Anthropic - 維基百科,自由的百科全書" https://zh.wikipedia.org/zh-tw/Anthropic


AI王座一夜易主!馬斯克Grok 4.1雙冠封王 Gemini 2.5 Pro被壓在地上摩擦
2025-11-18 11:10
AI 王座一夜易主!馬斯克 Grok 4.1 悄悄上線,一夕之間登頂 LMArena,Gemini 2.5 Pro 卻被壓在地上摩擦。主打情商智商在線,算力再擴增一個數量級。
馬斯克Grok 4.1上線即衝榜單第一(圖:Shutterstock)
馬斯克帶著 xAI 投下一顆重磅炸彈-Grok 4.1 正式上線,而且對所有人免費。有趣的是,Grok 4.1 主打的也是「智商情商雙在線,正面對決 GPT-5.1。」
據「新智元」,Grok 4.1 這次總共放出了兩大版本:Grok 4.1 Thinking 和 Grok 4.1。在 LMArena 排行榜上,Grok 4.1 Thinking 拿下了 1483 Elo 的成績,以絕對實力加冕全球大模型之王。
Thinking 版比 Gemini 2.5 Pro 高出整整 31 分。即便是非推理模式的 Grok 4.1,直接殺進榜單第二。
不僅如此,Grok 4.1 情緒智商同樣爆表,具備了更高的情緒智能、同理心和人際互動能力。在 EQ-Bench 上,以 1586 Elo 成績登頂。
在寫作上,Grok 4.1 比上一代 Elo 提升 600 分。而且,幻覺率比之前模型暴降 3 倍。Grok 4.1 之所以可以快速進化,xAI 團隊將其後訓練階段的 RL 規模,又擴大了一個數量級。
但沒想到,在 GoogleGemini 3.0 降臨之前,馬斯克來了一波大的。如今, Grok 4.1 已在網頁端和 iOS、Android 中免費上線。目前還是 beta 版本。
在創意表達、情緒交流和合作互動上,Grok 4.1 表現出色。它能精準捕捉細微的意圖,讓對話更自然、更有溫度。
同時,Grok 4.1 整體人格更加一致,既保持了上一代那種犀利、可靠的智慧表現,又增添幾分親和力。
在 Colossus 大規模 RL 算力引擎上,xAI 將重點放在了風格、個性、助人程度和對齊性的優化。
為此,他們也發展了一個全新的方法,利用前沿 AI 智慧體推理模型作為獎勵模型,自動、大規模評估和優化 Grok 4.1 回答品質。
在前兩周,xAI 悄悄推送了 Grok 4.1 早期版本,並在真實場景中展開密集的「盲測」成對評估。與上一代相比,人們在 64.78% 的情況下,更傾向於使用 Grok 4.1。
最強通用能力
最重要的是,相較於 Grok 4,Grok 4.1 在人類偏好評估中,刷新業界 SOTA。
在 LMArena 的 Text Arena 中,Grok 4.1 Thinking 模式(代號:quasarflux)以 1483 Elo 一舉衝上第一,比最高的非 xAI 模型高出 31 分。它的非推理模式(代號:tensor),無需使用思考 Token 就能即時回應,拿下了 1465 Elo,位居第二。
值得一提的是,Grok 4.1 在不思考的情況下,就能超越所有其他模型開啟全推理後的表現。相比之下,Grok 4 的總體排名是第 33 名,差距顯著。
xAI 研究員 Dustin Tran 表示,關閉推理後,輸出 Token 數從約 2300 掉到 850,即便如此,Grok 4.1 也排在了榜單前面。
EQ 升級、創意寫作
不僅如此, Grok 4.1 在情緒智慧上也達到了一個新高度。在 EQ-Bench3 上,Grok 4.1 拿下了 1586 Elo 高分。
EQ-Bench 是一個由大語言模型評判的測試,主要衡量模型的主動情緒智能、理解、洞察力、同理心以及人際交往能力。測試集包含 45 個具有挑戰性的角色扮演場景,大部分由 3 輪預設提示詞構成。基準會從多個維度評分,並透過成對比較計算來標準化 Elo 排名。
再來看創意寫作,Grok 4.1 在 Creative Writing v3 基準上,比上一代高出 600 分。具體來說,團隊讓模型圍繞 32 個不同的寫作提示,進行 3 輪創作,並根據評分標準和模型對戰 Elo 進行評分。
在幻覺方面,Grok 4.1 幻覺速率比上一代暴降 3 倍。使用搜尋工具的快速(非推理)模型能給出迅捷答案,但因為推理深度有限、工具調用次數受限,容易在事實問題上出錯。
"AI王座一夜易主!馬斯克Grok 4.1雙冠封王 Gemini 2.5 Pro被壓在地上摩擦 | 鉅亨網 - 美股雷達" https://news.cnyes.com/news/id/6241377


女性權利不只是「性別議題」,是人權與民主的一部分。「讓女性成為完整的平等夥伴,而非暴力與歧視的受害者。」並鼓勵女性與年輕世代參與更多公共事務,對不公不義保持敏感,從選擇與行動累積改變。AI是當代強大的工具,但若缺乏人權與倫理框架,便可能成為壓迫人民的工具、淪為獨裁政權的武器。提醒各國發展科技時,應把人權與自由列為優先考量。

「不要讓別人決定你們的未來,未來要由你們親手寫下。」2011年諾貝爾和平獎得主塔瓦庫·卡曼.永續和平必須以人權與正義為基礎,年輕世代不能只當旁觀者,而要用知識與行動參與改變,為自己和世界負責。卡曼是葉門記者與人權運動家,2011年成為首位獲頒諾貝爾和平獎的阿拉伯女性,被譽為「阿拉伯之春的女士」。她創立「無鎖鍊女記者組織」(Women Journalists Without Chains),推動新聞自由與女性權益。面對逮捕與威脅時,選擇以非暴力行動守護民主與人權。女性權利不只是「性別議題」-姜朝鳳宗族|痞客邦


 

文章標籤
全站熱搜
創作者介紹
創作者 nicecasio 的頭像
nicecasio

姜朝鳳宗族

nicecasio 發表在 痞客邦 留言(0) 人氣(5)