快速导航×

分类

当前所在位置：首页

2025-12-03

可灵O1— 可灵AI推出的首个统一多模态视频生成模型

可灵O1是什么可灵O1（即“可灵视频O1模型”）是由可灵AI研发并发布的全球首款统一架构多模态视频生成大模型。该模型依托原创的多模态视觉语言（MVL）技术框架，首次实现视频生成、智能编辑与语义理解三大能力的一体化协同。它...

Read More
2025-12-02

快手正式全量上线可灵 AI 视频 O1 模型，全球首个统一多

快手可灵AI团队正式发布全球首个统一多模态视频模型——可灵视频O1模型全量上线。据悉，该模型采用全新生成式架构，旨在“打破功能壁垒”，并引入了MVL（多模态视觉语言）交互系统，实现多种任务在单一输入框内的无缝整合。结合C...

Read More
2025-09-12

字节跳动联合清华大学开源统一多模态框架：HuMo

论文地址:https://arxiv.org/abs/2509.08519由字节跳动智能创作团队与清华大学联合推出的HuMo，是一个统一的HCVG（Human-CentricVideoGeneration）框架，致力于推...

Read More
2025-09-06

OneCAT— 美团联合上交大推出的统一多模态模型

OneCAT简介OneCAT是美团发布的一款先进的统一多模态人工智能模型，基于纯解码器架构构建，集成了多模态理解、文本到图像生成以及图像编辑等多项能力。该模型突破了传统多模态系统对外部视觉编码器和分词器的依赖，通过引入模...

Read More
2025-08-14

Skywork UniPic 2.0— 昆仑万维开源的统一多

SkyworkUniPic2.0是什么SkyworkUniPic2.0是由昆仑万维推出的开源高效多模态模型，致力于实现图像生成、编辑与理解能力的统一。该模型基于具备20亿参数的SD3.5-Medium架构，采用预训练、渐...

Read More
2025-07-30

MWCS 2025 | 基于MediaTek T930的广和

广和通重磅发布随着AI技术的迅猛发展以及智能设备的爆发式普及，家庭用户与中小企业（SMB）对高效、安全、智能化的“数字中枢”需求愈发迫切。各类智能终端亟需实现无缝协作，在智能安防、数据协同、远程办公等场景中，依赖统一的“...

Read More

<< < 1 2 3 4 5 > >>