OpenAI 宣布推出 GPT-4o,新版本 GPT-4o 示範影片比 Siri 和 Google 語音助理更強


OpenAI 在春季發佈會宣布推出 GPT-4o 新模型,所有 ChatGPT 用戶 (包括免費用戶) 即將可以使用 GPT-4o 模型,付費用戶將繼續「擁有免費用戶五倍的容量限制」。


GPT-4o(“o”代表“o​​”),這個 o 就是 "Omni"。它接受文字、音訊和圖像的任意組合作為輸入,並產生文字、音訊和圖像的任意組合輸出。GPT-4o 可以在短至 232 毫秒的時間內響應音訊輸入,平均為 320 毫秒。


GPT-4o 目前的上下文視窗為 128k,知識截止日期為 2023 年 10 月。


OpenAI 春季發佈會其他重點


1. 正在發布桌面版 ChatGPT 應用程式和新的使用者介面 (UI)。


2. GPT-4o 提供「GPT-4 級別」的智能,但速度更快,並且改進了文字、視覺和音訊方面的功能。


3. GPT-4o 可以理解音頻和視頻,甚至可以檢測聲音中的情緒,能夠理解情緒,令對話更自然逼真。


4. GPT-4o 可以即時收聽和觀看程式碼,並進行修改。


5. GPT-4o 的多語言能力也更強,在 50 種不同語言中的表現得到了提升。


6. 在 API 使用方面,GPT-4o 的價格是 GPT-4-turbo 的一半,速度是 GPT-4-turbo 的 2 倍。


▉  GPT-4o 模型評估


GPT-4o 文本能力


GPT-4o 文本能力

GPT-4o 音頻能力


GPT-4o 音頻能力


GPT-4o 音頻翻譯能力


GPT-4o 音頻翻譯能力


GPT-4o 各種語言考試能力


GPT-4o 各種語言考試能力


GPT-4o 視覺理解評估


GPT-4o 視覺理解評估


▉  GPT-4o 演示視頻:


OpenAI 聯合創辦人及總裁 Greg Brockman 錄制了 GPT-4o 實時語音及多模態演示。

👉  https://x.com/gdb/status/1790071008499544518


▉  OpenAI Spring Update 視頻:



資料來源: OpenAI


延伸閱讀:  


推薦 8 個免費好用的 AI 音樂生成工具


推薦 5 個免費好用的 AI Logo 設計生成器


5 個 AI 漫畫生成工具,自動生成漫畫或動漫


Stable Foundation + Gen-2 + ElevenLabs 快速製作動畫


==========================

訂閱 👉 Pulse AI 電子報


✅ 快速掌握最新 AI 工具、科技資訊及品牌應用!

✅ 免費訂閱,節省資料搜集時間!

✅ 加快學習如何運用 AI,減低被淘汰機會!

✅ 每周幾分鐘,工作、學習更高效!

==========================


pulse-ai-newsletter