OpenAI发布免费多模态GPT-4o模型,文生图强大升级!

chatgpt中文网2025-03-31 13:16:387
OpenAI在5月13日凌晨重磅发布新一代多模态模型GPT-4o,全面升级AI交互体验。该模型突破性地整合文本、图像、音频的实时端到端处理能力,响应速度媲美人类对话,语音延迟仅232毫秒。尤为亮眼的是首次实现原生的"文生图+文本对话"多模态联动,用户可边画边聊进行创作。即日起免费用户可直接体验,付费用户仍享5倍高容量优先使用权。桌面版APP同步上线,支持截图提问等便捷功能。这一技术飞跃大幅降低AI使用门槛,或将重塑人机交互生态。

今日凌晨,OpenAI直播揭晓了GPT-4o的重大更新——集成了原生多模态文生图功能,这一突破意味着,用户无需再切换至Sora或Dall·e3,直接在聊天界面即可实现高质量的图像创作。

新模型的核心优势在于:

1、精准理解文本:能够准确捕捉提示细节,即使是复杂的符号融合也游刃有余,比如路标文字分毫不差;

2、多轮对话优化:通过自然语言交互,模型可动态调整图像设计,例如让游戏角色在多次迭代中保持风格统一;

3、超强对象处理能力:单张图可容纳10-20个关联对象,远超同类模型的极限;

4、情境学习:分析上传的参考图后,能主动提取元素融入新创作,实现个性化输出;

5、知识联动:结合庞大的知识库,生成更符合现实的画面(比如猫与老虎的创意倒影);

6、多样化风格:从狗仔队偷拍到油画质感,轻松驾驭不同视觉语言,甚至能模拟光线、动态模糊等专业效果。

目前该功能已覆盖ChatGPT免费版及付费订阅用户,企业与教育版本也将陆续开放,这一升级或将彻底改变内容创作的工作流——从头脑风暴到视觉落地,只需持续对话即可完成。

示例展示

- 马克思“商场购物”的讽刺小报风格图(闪光灯、飘动衣角等细节逼真)

- 街头水洼中猫与老虎的虚实倒影(涟漪扭曲效果自然)

想体验?试试向GPT-4o描述你的奇思妙想吧!

*官方公告参考:OpenAI.com

本文链接:https://p6p6.cn/chatgptPlus_gpt4_gpt5_709.html

OpenAIGPT4o

相关文章

网友评论