谷歌Gemini Ultra來了!每月19.9刀 網友:GPT4不香了 加载评论...
資訊  硅星人  2024-02-09 13:31
農曆春節除夕這一天,Google 直接來了一票大的:

Bard今後統稱Gemini。

通過Gemini Advanced,即可訪問Google能力最強的原生多模態大模型Gemini Ultra!

去年12月,Go ogle 推出Gem ini Pro和Gemini Nano,人們可以通過聊天機器人Bard、Pixel 8 Pro 和三星S24 系列手機免費使用。 而今天,Bard改頭換面,帶來由超大杯Ultra 1.0 驅動的會員版Gemini Advanced全新體驗,同時推出支持安卓和iOS客戶端的手機移動應用。

新服務訂閱價格為每月19.99美金 ,和ChatGPT Plus、Perplexity Pro等主流生成式AI應用每月20美金的價格差不多。不過為了顯示誠意,Google會提供前兩個月免費試用。



Google最高階多模態大模型,Gemini Ultra新時代開啟


據Google CEO 桑達爾·皮查伊稱,Ultra 1.0是首個在 MMLU(大規模多任務語言理解)上超越人類專家的模型,使用了包括數學、物理、歷史、法律、醫學和倫理學在內的57個學科組合來測試知識和解決問題的能力。

因此,Gemini Advanced在編碼、邏輯推理、遵循微妙指令和協作創意項目等高度複雜的任務上將更加強大。不僅可以與用戶進行更長、更詳細的對話,還能更好地理解提示上下文。

比如:Gemini Advanced可以成為個人導師,為你創建逐步說明、個性化測驗或根據學習風格量身定製回答;解決更複雜的編碼場景,並協助評估不同的編程思路;成為數字創作者的創意夥伴,生成新鮮內容,分析最新趨勢,制定商業計劃書。值得一提的是,Gemini Ultra內由Imagen 2生成的所有圖像都應用了數字水印(雖然你看不到它)。

隨著新功能不斷添加,用戶將體驗到更強的多模態能力、更多互動式編程功能以及更深入的數據分析。目前Gemini Advanced僅支持英語,可以在超過150個國家和地區使用,將逐步擴展到更多語言。

安卓和IOS手機端登場,Gmail、文檔、表格可使用

Gemini Advanced作為全新Google One AI高級計劃的一部分,還會給用戶提供2TB存儲空間。此外,AI高級訂閱者很快就能夠在Gmail、Docs、Slides、Sheets等之前被集合為Duet AI的應用中指調用Gemini Ultra。

為了實現手機端輕鬆訪問,Google此次推出全新Gemini應用程序。

你可以拍攝一張車胎的照片請求說明,為晚宴邀請函生成自定義圖像,或者要求撰寫一條複雜簡訊。Google稱之為「構建真正的AI助手的重要第一步,一個具有對話性、多模態的新型實用助理。」

安卓手機用戶可以下載Gemini應用程序,或按照平時激活Google助手的方式——比如直接說「嘿,Google」來將它喚醒。Gemini 能為你剛拍攝的照片生成描述,回答閱讀中文章的相關問題。許多Google助手的語音功能也將通過Gemini App可用,包括設置定時器、打電話和控制智能家居設備等。

雖然iOS應用還在路上,但Google表示在接下來的幾周里即會上架App Store。



將Gemini 能力擴展至更多產品

Gemini也將全面應用於個人和企業每天使用的產品,包括 Workspace 和谷歌雲服務。

Workspace:

皮查伊表示,目前已經有超過100萬人正在使用像 「Help me write 」這樣的功能,通過 Duet AI 提高生產力和創造力。從今天起,Duet AI 將改為 Gemini for Workspace,並且很快, Google One AI 高級計劃訂閱者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等谷歌辦公全套件中使用 Gemini Ultra。

谷歌云:

對於雲客戶來說,Gemini 將幫助提高企業生產力,協助開發人員更高效編寫代碼,並保護組織免受網路攻擊。

開發者一直是每一次重大技術變革的基礎,在 Gemini 生態系統中也扮演著同樣重要的角色。現在已經有數十萬技術人員和企業正在使用 Gemini 大模型進行開發。Google將在下周分享更多關於開發者和雲客戶未來權益的詳細信息。

皮查伊還透露,Google已經在積極訓練下一代 Gemini 模型了。

網友迫不及待,Gemini Ultra新鮮開測


去年12月6日Google發布Gemini Pro時,對標的是GPT-3.5。由於取消了原定的線下亮相,Gemini系列被媒體渲染得陰影重重。於是沒隔幾天,中杯大杯忽然集體登場,還以一個震懾三觀的「鴨子」視頻demo引發熱烈討論和網路打假。當時Google曾預告說在32項LLM廣泛使用的基準測試中,Gemini Ultra有30項都超越了 ChatGPT代表的業界最先進水平。

究竟Ultra版本實力如何,現在終於可以上手一探究竟了。

用寫LinkedIn Post來測試內容生成。結論是Gemini Ultra憑藉更多標題選項、更快響應速度和「沒有愚蠢的emoji表情」擊敗GPT-4成為絕對勝者。



網友 Alphabetting拿出一道邏輯推理題:Tabitha喜歡餅乾但不喜歡蛋糕,喜歡羊肉但不喜歡羔羊肉,喜歡秋葵但不喜歡南瓜。它詢問按照相同規則,Tabitha會喜歡櫻桃還是梨。

Gemini Ultra給出的建議是:「Tabitha喜歡發音兩個音節的食物,不喜歡一個音節的食物。」它列出謎題中每種食物的音節數,由於「cherries」有兩個音節,因此答案是櫻桃。

GPT-4認為Tabitha的偏好可能與單詞最後一個字母有關。她喜歡的食物結尾是輔音,而她不喜歡的食物結尾是原因。這樣的話,櫻桃和梨都符合條件——有些棘手,但一定要選一個的話,那就櫻桃吧。



他表示Gemini Ultra成功解決了被GPT-4搞到稀碎的邏輯測試。



用戶Brett Winton測試兩者的文生圖功能,提示詞是「生成一個畫家試圖在火箭外部畫靜物的圖像,讓它幽默一些,一幅插畫「。左邊是GPT-4,右邊是Gemini Ultra。

AI模型的想象力見仁見智,不過Gemini圖像里的畫家比起繪畫更像在吃東西,手部細節也有點問題。評論里都覺得GPT-4更好些。



他又緊接著對比了Gemini Ultra、 Claude和GPT-3.5對於8年級數學題計算能力。

題面是:Garcia正策劃一個比薩派對,她需要確保30名學生每人至少得到3片,每個比薩有8片。為增加多樣性, Garcia決定訂購一半乳酪比薩和一半香腸比薩。然而有5名學生是素食者,只會吃乳酪比薩。

請回答:

1.Garcia需要訂購多少個比薩,以確保每個學生至少3片?

2.每種類型比薩各多少個?

3.如果每個比薩12美元,總訂單費用是多少?

在之前的測試中, Gemini Pro把這道題搞砸了。此次Ultra答對了總數12個比薩和費用144美元。但第2題的正確答案應該是兩種比薩各6個,Ultra沒通過。



Brett Winton表示,Gemini Ultra和Claude一樣,數學計算都不如GPT-3.5準確。



編碼能力上,網友Mervin Praison在Gemini Ultra用Python成功創建了一個貪吃蛇遊戲。



更多更深入的用例,大家可以抓住兩個月的免費試用福利,親自上手玩一玩。

OpenAI開闢AI代理新戰場,Google 不甘落後

谷歌副總裁兼Gemini體驗和Google助手部門總經理Sissie Hsiao表示,「對谷歌來說,Gemini不僅僅是模型。它實際上是我們思考最先進技術,以及我們在其基礎上構建的整個生態系統的轉變,從影響數十億用戶的產品,到開發者和企業用來創新的API平台。」

就在昨天,The Information發表題為《OpenAI正將AI競爭焦點轉移到能操作設備和自動化任務的軟體上》的報道。



文中爆料,OpenAI正在開發一種代理軟體,能有效接管手機和電腦,替用戶執行複雜任務操作。你可以命令ChatGPT執行從文檔到表格的數據轉移,自動填寫費用報告並輸入到會計軟體中,或者在特定預算下創建行程或預訂機票等基於網路的任務。

隨著越來越多全新大模型的推出,OpenAI也深知今年可能不再擁有市場上最強大LLM的可能性。所以加緊開闢新戰場早做準備。

據知情人士稱,這類請求將觸發代理點擊、游標移動、文本輸入等其它人類動作。可能會將將ChatGPT變成Sam Altman私下稱為「超智能個人工作助理」的工具,也將與微軟Copilot和谷歌Gemini for Workspace 展開更直接競爭。

去年ChatGPT已經給OpenAI帶來16億美元收入,微軟也靠生成式AI顯著拉升了最新季度財報業績。

而AI業務卻還沒有給Google帶來明朗的現金流。如今付費版本Gemini Advanced和Ultra 1.0的推出會帶來怎樣的市場回饋,那些已經花錢訂閱GPT的用戶們會不會轉投Gemini,人工智慧整合進谷歌生態的全新究極樣貌是什麼?這些都讓人期待。今年,註定繼續是高潮迭起的AI拉鋸戰。