Anthropic 發現史上首見由中國發動的 AI 網路間諜攻擊．中國政府資助的駭客組織 GTG-1002 利用 Anthropic 的 Claude AI 工具，自動執行了從大約 30 個組織竊取敏感資訊，包括政府機構，並已確認多次成功入侵，其中有八成到九成的工作由 AI 完成。 1. 首次有記錄的 AI 自主執行端對端大規模網路攻擊的案例。 2. 首次由 AI 獲得高價值現實世界目標的存取權的案例。 3. 首次證明網路行動可以以「人類物理極限」的速度運作．將廣泛可用的工具與人工智慧進行自動化整合 | 姜朝鳳宗族 | 生活綜合分享 | 痞客邦

【Anthropic 發現史上首見由中國發動的 AI 網路間諜攻擊】
Anthropic 發布的最新報告顯示，他們發現了首例由人工智慧策劃的網路間諜活動，而背後是中國政府發動的。
一個由中國政府資助的駭客組織 GTG-1002 利用 Anthropic 的 Claude AI 工具，自動執行了從大約 30 個組織竊取敏感資訊，包括科技公司、金融機構、化學公司和政府機構，並已確認多次成功入侵，其中有八成到九成的工作由 AI 完成。
在 10-20% 的人類工作中，人類只負責關鍵決策，例如：設定目標、何時從偵察升級到攻擊、是否使用竊取的憑證，以及竊取哪些資料等。
🔶
這標示中國在利用 AI 剽竊資訊與智慧財產權能力的進步，本次發現有三項是史上首見：
1. 首次有記錄的 AI 自主執行端對端大規模網路攻擊的案例。
2. 首次由 AI 獲得高價值現實世界目標的存取權的案例。
3. 首次證明網路行動可以以「人類物理極限」的速度運作。
🔶
GTG-1002 圍繞著 Claude 程式碼和模型上下文協定 (MCP) 工具建構了一個自主攻擊框架。該框架：
首先將 Claude 定位為大型編排系統中的一個執行引擎。
其次，將複雜的攻擊鏈分解成許多小型技術任務（掃描、漏洞測試等）。
最後，透過角色扮演，將任務偽裝成合法的滲透測試請求，從而隱藏惡意意圖。
其厲害之處不在於客製化惡意軟體，而是將廣泛可用的工具與人工智慧進行自動化整合，達成剽竊資訊的目的。
🔶
Anthropic 發現中國網路間諜活動後，立即封鎖相關帳號，改進了檢測系統和分類器，同時還為自主網路攻擊開發了早期偵測系統原型。
但是隨著中國人工智慧能力的提升，此類以 AI 為主導的攻擊，因為成本較低，未來可能越來越多，也標示網路資安的一大威脅，希望台灣數發部、政府單位與企業都能注意。
https://www.facebook.com/share/p/16Ro4WQdMC/
-－－－－－－－－－
AI 協調網路間諜活動報告（繁體中文翻譯）
報告標題
原文： Disrupting the first reported AI-orchestrated cyber espionage campaign
翻譯：破壞首起經 AI 協調的網路間諜活動
執行摘要 (Executive Summary)
我們開發了複雜的安全與保安措施，以防止我們的 AI 模型遭到濫用。儘管這些措施通常有效，但網路犯罪分子和其他惡意行為者仍不斷嘗試尋找繞過它們的方法。
本報告詳細介紹了我們近期識別並中斷的一項威脅活動，以及我們為偵測和反擊此類濫用行為所採取的步驟。這代表著威脅情報團隊的工作：這是 Anthropic 內部專門調查現實世界濫用案例、並在我們的「防護組織」（Safeguards organization）內運作以改進我們防禦措施的專門團隊。
在 2025 年 9 月中旬，我們偵測到一項高度複雜的網路間諜活動。我們以高度信心評估，此活動是由一個我們命名為 GTG-1002 的中國國家資助組織所執行。它代表了進階威脅行為者使用 AI 方式的根本性轉變。
我們的調查揭示這是一次資源充足、專業協調的行動，涉及多個同時進行的目標入侵。該行動鎖定了約 30 個實體，且我們的調查證實了少數成功的入侵案例。在偵測到此活動後，我們立即展開調查以了解其範圍和性質。在接下來的十天內，當我們繪製出該行動的嚴重性和完整範圍時，我們禁止了被識別的帳號，適當地通知了受影響的實體，並在我們收集可行情報時與當局進行了協調。
此次活動展現了 AI 在整個攻擊生命週期中前所未有的整合與自主性。威脅行為者操縱 Claude Code 以幾乎完全自主的方式，支援偵察、漏洞發現、利用、橫向移動、憑證竊取、數據分析和數據外洩等操作。人類操作員將 Claude Code 的實例任務化，讓它們作為自主滲透測試協調者和代理群組運行。威脅行為者能夠利用 AI，以物理上不可能的速度，獨立執行 80-90% 的戰術操作。
這項活動是從我們 2025 年 6 月識別出的先前「vibe hacking」調查結果的重大升級。「vibe hacking」中，攻擊者是從遭洩露的 VPN 開始入侵，但人類仍然深度參與指導操作。
GTG-1002 代表了 AI 賦能威脅行為者能力的多項「首次」。該行為者達成了我們認為是首次被記錄的、主要在沒有人類大規模介入下執行的網路攻擊：AI 自主發現了人類操作員選定目標中的漏洞，並在實際操作中成功利用了它們。接著，AI 還執行了廣泛的後續利用活動，從分析、橫向移動、權限提升、數據存取到數據外洩。最重要的是，這標誌著首例被記錄的、具代理能力的 AI 成功存取經證實的高價值情報收集目標，其中包括主要科技公司和政府機構。
(此翻譯摘錄自您提供的 fullreport_cyber_espionage_17Nov2025.pdf 檔案內容。)

Anthropic 發現史上首見由中國發動的 AI 網路間諜

Anthropic PBC，是一家美國的人工智慧（AI）初創企業和公益公司，由OpenAI的前成員創立。[3][4]Anthropic專注於開發通用AI系統和語言模型，並秉持負責任的AI使用理念。[5]
截至2024年3月，Anthropic已籌集到73億美元的資金。
Claude[編輯]
主條目：Claude (語言模型)
Anthropic由參與OpenAI GPT-2和GPT-3模型開發的前研究人員組成[2]，Anthropic開始開發自己的 AI聊天機器人，名為 Claude。[6]ChatGPT類似，Claude採用消息傳遞界面，用戶可以在其中提交問題或請求，並獲得非常詳細和相關的回覆[7]Claude有520億個參數。[8]
Claude 2 於2023年七月推出，據《衛報》報導，此人工智慧以安全訓練為考慮，並稱它為「合憲人工智慧
"Anthropic - 維基百科，自由的百科全書" https://zh.wikipedia.org/zh-tw/Anthropic

AI王座一夜易主！馬斯克Grok 4.1雙冠封王 Gemini 2.5 Pro被壓在地上摩擦
2025-11-18 11:10
AI 王座一夜易主！馬斯克 Grok 4.1 悄悄上線，一夕之間登頂 LMArena，Gemini 2.5 Pro 卻被壓在地上摩擦。主打情商智商在線，算力再擴增一個數量級。
馬斯克Grok 4.1上線即衝榜單第一(圖：Shutterstock)
馬斯克帶著 xAI 投下一顆重磅炸彈－Grok 4.1 正式上線，而且對所有人免費。有趣的是，Grok 4.1 主打的也是「智商情商雙在線，正面對決 GPT-5.1。」
據「新智元」，Grok 4.1 這次總共放出了兩大版本：Grok 4.1 Thinking 和 Grok 4.1。在 LMArena 排行榜上，Grok 4.1 Thinking 拿下了 1483 Elo 的成績，以絕對實力加冕全球大模型之王。
Thinking 版比 Gemini 2.5 Pro 高出整整 31 分。即便是非推理模式的 Grok 4.1，直接殺進榜單第二。
不僅如此，Grok 4.1 情緒智商同樣爆表，具備了更高的情緒智能、同理心和人際互動能力。在 EQ-Bench 上，以 1586 Elo 成績登頂。
在寫作上，Grok 4.1 比上一代 Elo 提升 600 分。而且，幻覺率比之前模型暴降 3 倍。Grok 4.1 之所以可以快速進化，xAI 團隊將其後訓練階段的 RL 規模，又擴大了一個數量級。
但沒想到，在 GoogleGemini 3.0 降臨之前，馬斯克來了一波大的。如今， Grok 4.1 已在網頁端和 iOS、Android 中免費上線。目前還是 beta 版本。
在創意表達、情緒交流和合作互動上，Grok 4.1 表現出色。它能精準捕捉細微的意圖，讓對話更自然、更有溫度。
同時，Grok 4.1 整體人格更加一致，既保持了上一代那種犀利、可靠的智慧表現，又增添幾分親和力。
在 Colossus 大規模 RL 算力引擎上，xAI 將重點放在了風格、個性、助人程度和對齊性的優化。
為此，他們也發展了一個全新的方法，利用前沿 AI 智慧體推理模型作為獎勵模型，自動、大規模評估和優化 Grok 4.1 回答品質。
在前兩周，xAI 悄悄推送了 Grok 4.1 早期版本，並在真實場景中展開密集的「盲測」成對評估。與上一代相比，人們在 64.78% 的情況下，更傾向於使用 Grok 4.1。
最強通用能力
最重要的是，相較於 Grok 4，Grok 4.1 在人類偏好評估中，刷新業界 SOTA。
在 LMArena 的 Text Arena 中，Grok 4.1 Thinking 模式（代號：quasarflux）以 1483 Elo 一舉衝上第一，比最高的非 xAI 模型高出 31 分。它的非推理模式（代號：tensor），無需使用思考 Token 就能即時回應，拿下了 1465 Elo，位居第二。
值得一提的是，Grok 4.1 在不思考的情況下，就能超越所有其他模型開啟全推理後的表現。相比之下，Grok 4 的總體排名是第 33 名，差距顯著。
xAI 研究員 Dustin Tran 表示，關閉推理後，輸出 Token 數從約 2300 掉到 850，即便如此，Grok 4.1 也排在了榜單前面。
EQ 升級、創意寫作
不僅如此， Grok 4.1 在情緒智慧上也達到了一個新高度。在 EQ-Bench3 上，Grok 4.1 拿下了 1586 Elo 高分。
EQ-Bench 是一個由大語言模型評判的測試，主要衡量模型的主動情緒智能、理解、洞察力、同理心以及人際交往能力。測試集包含 45 個具有挑戰性的角色扮演場景，大部分由 3 輪預設提示詞構成。基準會從多個維度評分，並透過成對比較計算來標準化 Elo 排名。
再來看創意寫作，Grok 4.1 在 Creative Writing v3 基準上，比上一代高出 600 分。具體來說，團隊讓模型圍繞 32 個不同的寫作提示，進行 3 輪創作，並根據評分標準和模型對戰 Elo 進行評分。
在幻覺方面，Grok 4.1 幻覺速率比上一代暴降 3 倍。使用搜尋工具的快速（非推理）模型能給出迅捷答案，但因為推理深度有限、工具調用次數受限，容易在事實問題上出錯。
"AI王座一夜易主！馬斯克Grok 4.1雙冠封王 Gemini 2.5 Pro被壓在地上摩擦 | 鉅亨網 - 美股雷達" https://news.cnyes.com/news/id/6241377

女性權利不只是「性別議題」，是人權與民主的一部分。「讓女性成為完整的平等夥伴，而非暴力與歧視的受害者。」並鼓勵女性與年輕世代參與更多公共事務，對不公不義保持敏感，從選擇與行動累積改變。AI是當代強大的工具，但若缺乏人權與倫理框架，便可能成為壓迫人民的工具、淪為獨裁政權的武器。提醒各國發展科技時，應把人權與自由列為優先考量。

「不要讓別人決定你們的未來，未來要由你們親手寫下。」2011年諾貝爾和平獎得主塔瓦庫·卡曼．永續和平必須以人權與正義為基礎，年輕世代不能只當旁觀者，而要用知識與行動參與改變，為自己和世界負責。卡曼是葉門記者與人權運動家，2011年成為首位獲頒諾貝爾和平獎的阿拉伯女性，被譽為「阿拉伯之春的女士」。她創立「無鎖鍊女記者組織」（Women Journalists Without Chains），推動新聞自由與女性權益。面對逮捕與威脅時，選擇以非暴力行動守護民主與人權。女性權利不只是「性別議題」－姜朝鳳宗族｜痞客邦