中央社
(中央社記者吳家豪舊金山14日電)Google共同創辦人布林(Sergey Brin)去年重返Google,為人工智慧(AI)技術操盤,他今天意外現身在美國加州山景城舉辦的Google I/O年度開發者大會,向媒體分享對Google AI模型Gemini的看法,大讚比想像更厲害。
布林原本已經淡出Google營運,鮮少涉足公司業務,去年7月外媒發現布林常出現在Google總部,與AI研究員一起工作,開發Gemini模型,以因應OpenAI公司旗下聊天機器人ChatGPT崛起所帶來的挑戰。
中央社記者受邀前往I/O大會現場,參加一場禁止拍攝、介紹Gemini 1.5模型功能的閉門小型展演時,一名工作人員開門走進來,定睛一看竟是Google創辦人布林,引起現場一陣驚呼。原本議程並沒有安排布林參與,事前也沒有任何布林會出席I/O大會的消息。
他向現場記者一一握手打招呼,展現十足親和力,與在場所有人一起合影留念。
布林表示,自己推動Gemini發展時,發現Gemini比想像中更厲害,於是陸續應用到各種領域,進一步拓展Gemini的能力,包括今天展示的視覺辨識與記憶能力。
在Gemini 1.5模型的展演中,工作人員把長頸鹿、鴨子、小狗造型的布偶逐一放在攝影機下方,幫每個布偶取名,然後詢問Gemini每個名字的布偶是誰;Gemini回答時除了能分辨每個布偶是什麼動物,也能準確把名字連結在一起。
在接下來的展演中,工作人員在觸控螢幕上用手指繪圖,Gemini可以分辨是小圓圈或人形,還能根據工作人員加上的外星人圖案,聯想到手繪圖可能與電視影集「X檔案」有關。
Gemini 1.5 Pro是Google最先進的AI模型,可包含100萬個詞元的脈絡長度(context window),是目前全球其他一般消費者使用的聊天機器人所擁有最高的脈絡長度,因此Gemini Advanced服務能理解內容更龐大的文件,像是長達1500頁的文件檔案,或處理約100封電子郵件的摘要。
不久後,Gemini Advanced還可以處理長達1小時的影片內容,或超過3萬行的程式碼。
Google同時宣布,在接下來幾週內,將為訂閱Gemini Advanced服務的使用者推出Gemini Live功能,透過語音技術,使用者能夠以直覺自然的方式與Gemini互動,除了跟Gemini互動時可以用自己習慣的語速交談,也能中途打斷Gemini的回應來詢問額外問題,進一步釐清資訊,就像任何日常對話一樣。(編輯:林淑媛)1130515
新聞來源:中央社
讀者迴響