OpenAI 宣布推出 GPT-4o,新版本 GPT-4o 示範影片比 Siri 和 Google 語音助理更強
OpenAI 在春季發佈會宣布推出 GPT-4o 新模型,所有 ChatGPT 用戶 (包括免費用戶) 即將可以使用 GPT-4o 模型,付費用戶將繼續「擁有免費用戶五倍的容量限制」。
GPT-4o(“o”代表“o”),這個 o 就是 "Omni"。它接受文字、音訊和圖像的任意組合作為輸入,並產生文字、音訊和圖像的任意組合輸出。GPT-4o 可以在短至 232 毫秒的時間內響應音訊輸入,平均為 320 毫秒。
GPT-4o 目前的上下文視窗為 128k,知識截止日期為 2023 年 10 月。
OpenAI 春季發佈會其他重點
1. 正在發布桌面版 ChatGPT 應用程式和新的使用者介面 (UI)。
2. GPT-4o 提供「GPT-4 級別」的智能,但速度更快,並且改進了文字、視覺和音訊方面的功能。
3. GPT-4o 可以理解音頻和視頻,甚至可以檢測聲音中的情緒,能夠理解情緒,令對話更自然逼真。
4. GPT-4o 可以即時收聽和觀看程式碼,並進行修改。
5. GPT-4o 的多語言能力也更強,在 50 種不同語言中的表現得到了提升。
6. 在 API 使用方面,GPT-4o 的價格是 GPT-4-turbo 的一半,速度是 GPT-4-turbo 的 2 倍。
▉ GPT-4o 模型評估
GPT-4o 文本能力
GPT-4o 音頻能力
GPT-4o 音頻翻譯能力
GPT-4o 各種語言考試能力
GPT-4o 視覺理解評估
▉ GPT-4o 演示視頻:
OpenAI 聯合創辦人及總裁 Greg Brockman 錄制了 GPT-4o 實時語音及多模態演示。
👉 https://x.com/gdb/status/1790071008499544518
▉ OpenAI Spring Update 視頻:
資料來源: OpenAI
▋ Stable Foundation + Gen-2 + ElevenLabs 快速製作動畫
==========================
訂閱 👉 Pulse AI 電子報
✅ 快速掌握最新 AI 工具、科技資訊及品牌應用!
✅ 免費訂閱,節省資料搜集時間!
✅ 加快學習如何運用 AI,減低被淘汰機會!
✅ 每周幾分鐘,工作、學習更高效!
==========================