每日ai资讯 - Gavin的博客

摘要:腾讯混元发布了最新的开源文生图模型”混元图像2.1（HunyuanImage2.1）”，该模型在多个方面进行了重要升级。主要特点包括：支持原生2K分辨率图像生成；具备中英文原生输入能力；能够生成高质量的复杂语义文本；支持最长1000个tokens的提示词，可精准生成场景细节、人物表情和动作；在处理图像文字信息方面表现出色，能自然融合文字与画面。模型基于庞大的图文对齐数据集，在复杂语义理解和跨领域泛化能力上有显著提升。作为开源模型，其代码和权重已在Hugging Face和GitHub平台发布，可供个人和企业开发者进行进一步研究和开发。腾讯还透露正在研发一款原生多模态图像生成模型。原文url:https://www.aibase.com/zh/news/21163