Google I/O:人工智慧將與 Gemini、AI 代理一起統治世界
谷歌正在通過其 Gemini AI 服務來反擊人工智慧的顛覆,這些服務貫穿其包括搜索在內的整個產品群組。我們相信 Gemini 有助於縮小與 ChatGPT 的差距,而 Google I/O 是突出 AI 創新和技術進入 Google 開發者世界的關鍵活動。
Copilots(基本上是對話式聊天機器人介面)旨在提高員工的工作效率,但依賴於人工提示。Project Astra 涉及即時多模態 AI 助手,而 Project Mariner 是個人電腦上使用的瀏覽器代理。此外,Jules 還是軟體錯誤的編碼代理。同時,Deep Research 是一個可以深入研究複雜主題並創建報告的助手。作為軟工工程師輔助工具,Codex能模仿人類工程師形式及拉取(pull request)偏好撰寫功能程式碼、回答codebase問題、除錯、並建議檢查的pull request。它會確實遵守指示,還能反覆測試直到獲得程式通過的結果。
使用者可在提示列中輸入「Code」讓Codex寫新程式,輸入「Ask」詢問程式問題。每項任務都是在分開執行。Codex能讀取和編輯檔案、執行指令,像是test harnesses、linters和 type checkers。視任務複雜性而定一般可在1到30分鐘內完成,用戶也能即時監控Codex進度。一旦完成,它會並提供log及測試結果供開發人員檢視。用戶可要求它進一步修改、開啟GitHub pull request或直接將其變更整合到環境中。
根據OpenAI的說明,GPT-4o是個完整的多模態模型,幾乎支援所有功能,從搜尋、生成圖像、語音或資料分析,也能輸入各種內容,最適合用來進行日常任務,不管是摘錄會議紀錄、起草專案電子郵件或是校稿等,而它在ChatGPT Enterprise訂閱方案中也可無限使用。
而GPT-4.5則適合創意任務,因為它更有情緒智商,有創造力也有協調性,很適合幫忙撰寫新功能的描述,或是寫一封具同理心的道歉信,但每周僅支援20個請求。OpenAI o4-mini 適合快速的技術任務,像是快速的STEM相關查詢、程式設計及視覺推理等,如自CSV檔案中提取關鍵資料點,或是快速修復Python回溯等,支援每天300個請求。OpenAI o4-mini-high 可用來執行那些需要更長思考的技術任務,如數學、撰寫程式碼,或是科學解釋,該模型支援每天100個請求。至於OpenAI o3則適合複雜或多步驟的任務,如策略規畫、分析,或是大量或深入的程式碼撰寫,也能根據CSV進行多步驟分析,預測並繪制下一季趨勢等,支援每周100個請求。而OpenAI o1 pro mode基本上奠基於傳統模型上,只是針對高風險與長期的分析任務進行微調,使得它能夠更準確地完成複雜任務,像是可以替歐盟隱私推廣起草詳細的風險分析,或是能夠生成多頁的新興技術研究摘要,也能利用理論模型來建立一個財務預測演算法,但該模型每月只支援5個請求。
參考資料:
https://www.investors.com/news/technology/google-stock-google-io-artificial-intelligence-gemini/
https://www.ithome.com.tw/news/169008
https://www.ithome.com.tw/news/168750