Bitget App
交易「智」變
快速買幣市場交易合約理財廣場更多
Google 正式推出 Gemini 3:目前最強大的 AI Agentic 與 Vibe Coding 大型語言模型

Google 正式推出 Gemini 3:目前最強大的 AI Agentic 與 Vibe Coding 大型語言模型

AbmediaAbmedia2025/11/18 11:14
作者:Neo
Google 正式推出 Gemini 3:目前最強大的 AI Agentic 與 Vibe Coding 大型語言模型 image 0

Google 今日正式發表全新一代大型語言模型 Gemini 3,並同步在 Gemini App、SearchAI 模式、AI Studio、Vertex AI 等多項服務中推出 Gemini 3 Pro。Google 表示,Gemini 3 是目前最強的多模態與推理模型,在科學、數學、視覺理解與長程規劃等多項重要 AI 基準測試上大幅領先前代。除了 Vibe Coding 外,Gemini 3 也是最強的 Agentic 模型,這意味著 AI 可以幫你主動完成任務。

Google 執行長:Gemini 理解力已從文字圖片進化成能「讀空氣」

Google 執行長 Sundar Pichai 指出,自 Gemini 系列推出近兩年以來,AI 產品已觸及全球二十億用戶。每一代 Gemini 都建立在上一代的成果之上,Gemini 1 在原生多模態與長上下文方面帶來突破,能處理更多也更複雜的資訊。Gemini 2 奠定代理 (agentic) 能力,推動推理與思考極限。

而現在,Gemini 3:我們最智慧的一代模型,集結 Gemini 系列所有能力,讓你能把任何想法帶到現實。它在推理方面達到 SOTA (state-of-the-art),能掌握深度與細膩度。無論是捕捉創造性想法中的微妙線索,或拆解層層重疊的艱難問題。

Gemini 3 也能更好理解你的請求背後的上下文與意圖,讓你不用苦想提示就能得到真正需要的答案。令人驚嘆的是,短短兩年內,AI 已從能閱讀文字與圖片,進化到能讀懂場面與情境 (reading the room)。

推理能力突破:Gemini 3 在 LMArena、科學推理與數學測試皆奪冠

Gemini 3 Pro 在最新評測中刷新多項紀錄:

  • LMArena 榜首:取得 1501 Elo 分數。
  • Humanity’s Last Exam(學術推理):37.5%(無工具)。
  • GPQA Diamond(科學推理):91.9%。
  • MathArena Apex(高難度數學):23.4%。
  • MMMU-Pro:81%
  • Video-MMMU:87.6%
  • SimpleQA Verified:72.1%(提升事實準確度)

這些結果代表 Gemini 3 Pro 在科學、數學、多模態推理中具備高度可靠性,可處理極為複雜的問題。

Google 同步發布 Gemini 3 Deep Think 推理模式,在 ARC-AGI-2(含程式執行)取得 45.1%,推理能力更上一層。其他亮點還包括:

  • Humanity’s Last Exam:41.0%
  • GPQA Diamond:93.8%

Gemini 3:更強的學習、執行與規劃能力

Gemini 3 是目前最強的 vibe coding 與代理式編程模型,具體評分包括:

  • WebDev Arena:1487 Elo(最高)
  • Terminal-Bench 2.0:54.2%(工具操作能力)
  • SWE-bench Verified:76.2%(大型程式任務)

它也支援 Google 全新的 Google Antigravity 代理式開發平台,AI 能自主規劃、編寫程式、操作終端機、驗證程式、操控瀏覽器等多步驟任務。Agentic AI 指的是能主動採取行動、規劃多步驟任務、並自主操作工具的 AI 系統。核心概念是:AI 不再只是回答,而是能像助手一樣,主動完成任務。

舉例來說,當我輸入:「幫我抓今日 ETH 價格並更新 Google Sheet。」,Agentic AI 自己去查 API 並更新 Google Sheet。

大型語言模型意味著使用者輸入一樣的內容,可能因模型運算出不同結果而有截然不同的輸出。而 Gemini 3 在 Vending-Bench 2 中可連續一年度保持一致決策,這意味 Gemini 3 能協助你完成:

  • 預約本地服務
  • 整理 Gmail
  • 處理多步驟工作流程

Gemini Agent 今天起向 Google AI Ultra 使用者開放。且 Google 表示,Gemini 3 是目前經過最多安全審查的模型,強化抗「拍馬屁式生成」、防 Prompt Injection 與網路攻擊。Deep Think 模式則將在完成額外安全測試後,提供給 Google AI Ultra 訂閱者。

這篇文章 Google 正式推出 Gemini 3:目前最強大的 AI Agentic 與 Vibe Coding 大型語言模型 最早出現於 鏈新聞 ABMedia

0

免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與

您也可能喜歡

2025年十大工具幫助您解決最常見的加密貨幣交易錯誤

簡單來說 強大的交易工具透過提供數據驅動的洞察、自動化和即時警報,幫助加密貨幣交易者避免常見的錯誤——從情緒化的決策和隱藏的風險到糟糕的分析。

Mpost2025/11/29 00:48
2025年十大工具幫助您解決最常見的加密貨幣交易錯誤

2025年,10款人工智慧工具將使加密貨幣稅務和合規變得輕鬆便捷

簡單來說 人工智慧驅動的工具正在將加密貨幣稅收從一項複雜、容易出錯的苦差事轉變為精簡、自動化且符合合規要求的流程,適用於交易者、企業和機構。

Mpost2025/11/29 00:48
2025年,10款人工智慧工具將使加密貨幣稅務和合規變得輕鬆便捷

Hack Seasons 阿布達比匯聚全球投資者、家族辦公室和 Web3 新資產管理領導者

簡單來說 Hack Seasons 大會將在阿布達比舉辦首屆資產管理專題研討會,探討加密貨幣、機構金融和新興技術,研討會將圍繞人工智慧等議題展開。 DeFiRWA。

Mpost2025/11/29 00:48
Hack Seasons 阿布達比匯聚全球投資者、家族辦公室和 Web3 新資產管理領導者

HSC資產管理阿布達比:與產業領導者共同探索數位資產和機構金融的未來

簡單來說 HSC資產管理公司在阿布達比舉辦的活動將匯集加密貨幣和機構金融領域的領導者,進行為期兩天的專題討論、創新研討會和爐邊談話。

Mpost2025/11/29 00:48
HSC資產管理阿布達比:與產業領導者共同探索數位資產和機構金融的未來