OpenAI发布免费多模态GPT-4o模型，文生图强大升级！

chatgpt中文网2025-03-31 13:16:387

OpenAI在5月13日凌晨重磅发布新一代多模态模型GPT-4o，全面升级AI交互体验。该模型突破性地整合文本、图像、音频的实时端到端处理能力，响应速度媲美人类对话，语音延迟仅232毫秒。尤为亮眼的是首次实现原生的"文生图+文本对话"多模态联动，用户可边画边聊进行创作。即日起免费用户可直接体验，付费用户仍享5倍高容量优先使用权。桌面版APP同步上线，支持截图提问等便捷功能。这一技术飞跃大幅降低AI使用门槛，或将重塑人机交互生态。

今日凌晨，OpenAI直播揭晓了GPT-4o的重大更新——集成了原生多模态文生图功能，这一突破意味着，用户无需再切换至Sora或Dall·e3，直接在聊天界面即可实现高质量的图像创作。

新模型的核心优势在于：

1、精准理解文本：能够准确捕捉提示细节，即使是复杂的符号融合也游刃有余，比如路标文字分毫不差；

2、多轮对话优化：通过自然语言交互，模型可动态调整图像设计，例如让游戏角色在多次迭代中保持风格统一；

3、超强对象处理能力：单张图可容纳10-20个关联对象，远超同类模型的极限；