1月16日消息,今日智谱宣布,其与华为联合开源的新一代图像生成模型GLM-Image,在开源不足24小时内,便登上全球知名AI开源社区Hugging Face(抱抱脸)榜单的全球榜首。
智谱方面称,这是首次完全依靠国产芯片训练的国产模型在国际舞台上登顶,意味着国产AI模型的端到端自主研发能力在国际竞争中实现了突破。
据了解,GLM-Image依托昇腾Atlas 800T A2设备与昇思MindSpore AI框架,实现了从数据处理到模型训练的全流程闭环,是首个在国产芯片平台上完成端到端训练的SOTA多模态模型。
在模型架构层面,GLM-Image与开源领域普遍采用的LDM方案有所区别,它创新性地运用了自回归与扩散解码器相结合的混合架构,既能实现对全局指令的精准理解,又能细致刻画局部细节。
在性能表现上,GLM-Image于CVTG-2K(复杂视觉文本生成)与LongText-Bench(长文本渲染)两大榜单中拿下开源领域的榜首位置。它具备精准理解指令、正确生成文字的能力,在汉字生成任务上尤为突出,能够被广泛运用到海报制作、PPT设计、科普图创作等知识密集型场景中。
在商业化应用场景中,采用GLM-Image API调用方式时,生成单张图片的成本仅需0.1元,这一优势显著降低了企业与开发者运用先进图像生成技术的准入门槛。