分类
-
- 2025-12-03
- 可灵O1— 可灵AI推出的首个统一多模态视频生成模型
可灵O1是什么可灵O1(即“可灵视频O1模型”)是由可灵AI研发并发布的全球首款统一架构多模态视频生成大模型。该模型依托原创的多模态视觉语言(MVL)技术框架,首次实现视频生成、智能编辑与语义理解三大能力的一体化协同。它...Read More -
- 2025-12-02
- 快手正式全量上线可灵 AI 视频 O1 模型,全球首个统一多
快手可灵AI团队正式发布全球首个统一多模态视频模型——可灵视频O1模型全量上线。据悉,该模型采用全新生成式架构,旨在“打破功能壁垒”,并引入了MVL(多模态视觉语言)交互系统,实现多种任务在单一输入框内的无缝整合。结合C...Read More -
- 2025-09-12
- 字节跳动联合清华大学开源统一多模态框架:HuMo
论文地址:https://arxiv.org/abs/2509.08519由字节跳动智能创作团队与清华大学联合推出的HuMo,是一个统一的HCVG(Human-CentricVideoGeneration)框架,致力于推...Read More -
- 2025-09-06
- OneCAT— 美团联合上交大推出的统一多模态模型
OneCAT简介OneCAT是美团发布的一款先进的统一多模态人工智能模型,基于纯解码器架构构建,集成了多模态理解、文本到图像生成以及图像编辑等多项能力。该模型突破了传统多模态系统对外部视觉编码器和分词器的依赖,通过引入模...Read More -
- 2025-08-14
- Skywork UniPic 2.0— 昆仑万维开源的统一多
SkyworkUniPic2.0是什么SkyworkUniPic2.0是由昆仑万维推出的开源高效多模态模型,致力于实现图像生成、编辑与理解能力的统一。该模型基于具备20亿参数的SD3.5-Medium架构,采用预训练、渐...Read More -
- 2025-07-30
- MWCS 2025 | 基于MediaTek T930的广和
广和通重磅发布随着AI技术的迅猛发展以及智能设备的爆发式普及,家庭用户与中小企业(SMB)对高效、安全、智能化的“数字中枢”需求愈发迫切。各类智能终端亟需实现无缝协作,在智能安防、数据协同、远程办公等场景中,依赖统一的“...Read More


