每日ai资讯

Posted by Gavin Blog on March 30, 2025

摘要:腾讯混元发布了最新的开源文生图模型”混元图像2.1(HunyuanImage2.1)”,该模型在多个方面进行了重要升级。主要特点包括:支持原生2K分辨率图像生成;具备中英文原生输入能力;能够生成高质量的复杂语义文本;支持最长1000个tokens的提示词,可精准生成场景细节、人物表情和动作;在处理图像文字信息方面表现出色,能自然融合文字与画面。模型基于庞大的图文对齐数据集,在复杂语义理解和跨领域泛化能力上有显著提升。作为开源模型,其代码和权重已在Hugging Face和GitHub平台发布,可供个人和企业开发者进行进一步研究和开发。腾讯还透露正在研发一款原生多模态图像生成模型。 原文url:https://www.aibase.com/zh/news/21163