OpenAI新發表GPT-4o 反應僅需232毫秒

綜合報導  / 美國

美國人工智慧研究實驗室OpenAI,發表了CHATGPT全新的AI模型,叫作GPT-4O,它能接受文字、聲音和圖像,3種格式,以及任何組合的輸入,令人驚艷的是GPT-4O,能在232亳鈔之內,回應輸入的語音資料,反應時間之快,已經很接近,真實生活中人與人的對話。

人工智慧實驗實OpenAI2022年11月,推出CHATGPT人工智慧聊天機器人程式。如今透過深層學習,使CHATGPT更進化,新的模型叫CHATGPT-4O,字尾的O代表拉丁文的OMNI,有「全能」的意思,透過多模態,使CHATGPT能更自然地與人互動,成為人類強大的語音助理。即使隨身助理,能否「即時反應」就是關鍵,OPENAI技術長米拉穆拉蒂:「這一回真的首次向前邁一大步,讓它更方便使用。」

多方便呢?CHATGPT-4O一發表,令業界驚艷,CHATGPT-4O人機對話過程,我現在在台上要作現場展示,坦白說我有一點緊張,你能幫我降低緊張情緒嗎,喔你正在作即時發表嗎太棒了,你只要深呼吸同時記得「你是專家」,展示人員試了幾次深呼吸,讓CHATGPT-4O提供評論。

這段真人與CHATGPT-4O的人機對話過程,聽起來就像兩個人對話一般。因為CHATGPT-4O的反應時間相當快,只要232毫秒,人工智慧在平均320毫秒內對輸人的聲音內容做出回應,就幾乎跟一般人對話的回應時間相近了。

另外,展示過程裡,CHATGPT-4O還秀了即時翻譯功能,過去OPENAI已經讓世人見識到CHATGPT處理文字、聲音和圖像的能力;如今進化版的CHATGPT-4O更上一層樓,能分析使用者的聲音語調、臉部表情,並且判斷使用者使用當下的情緒反應;簡單的說,CHATGPT-4O已經懂得「察顏觀色」更像個人類助理,能幫助人處理事務。

新聞來源:華視新聞



新聞關鍵字

加入Line好友