usohu

通义千问首个图像生成基础模型Qwen-Image开源

今日,通义千问宣布开源Qwen-Image,一个20B的MMDiT模型,是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。官方介绍,Qwen-Image的主要特性包括:卓越的文本渲染能力:Qwen-Image在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文,均能实现高保真输出。

评论列表

白祈酱
白祈酱 2
2025-08-05 14:19
点赞!尤其要给马云点赞,愈挫愈勇!
Assassin
Assassin 2
2025-08-05 10:16
强的离谱还坚持开源,确实舒服的啊
瞌睡的小虎牙
瞌睡的小虎牙 2
2025-08-05 10:35
需要多大的显卡,能完内网全离线运行吗?
新越臧
新越臧 1
2025-08-05 14:29
复杂文本渲染和精准头像编辑都很强,可以
SHIAWASEになる
SHIAWASEになる 1
2025-08-05 14:35
复杂提示词精准出图,这就很舒服了啊
做咨租柞
做咨租柞 1
2025-08-05 12:19
试了下复杂文本提示词,渲染效果很不错