永洪社区
标题: 腾讯混元文生图大模型开源,采用首个中文原生Sora同款DiT... [打印本页]
作者: puffs 时间: 2024-5-15 17:29
标题: 腾讯混元文生图大模型开源,采用首个中文原生Sora同款DiT...
2024年2月15日,OpenAI放出大招,发布了为震惊全球的文生视频模型Sora,而Sora之所以能收获震撼人心的效果,很大程度上是由于其底层采用了DiT架构。DIT即Diffusion Transformer, 采用了扩散模型和Transformer相结合,由Meta开源。
在中文世界里,DiT也取得了可喜的进展。5月14日,业内首个中文原生的DiT架构文生图开源模型——腾讯混元文生图大模型宣布全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,支持中英文双语输入及理解,参数量15亿,可供企业与个人开发者免费商用。升级后的混元文生图大模型采用了与 Sora 一致的DiT架构,因此在支持文生图的基础上,为多模态视觉生成提供了工具和能力。
评测数据显示,最新的腾讯混元文生图模型效果远超开源的 Stable Diffusion 模型,是目前效果最好的开源文生图模型;整体能力属于国际领先水平。