阿里达摩院上线“文本生成视频大模型”
据《都市快报》消息,阿里达摩院昨日在魔搭社区(ModelScope)放出了“文本生成视频大模型”。根据官方介绍,目前这个模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿。支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
此前 2 月消息,阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段。
Web3.0行业快讯更多 »
- Messari 预测 Solana 在 2025 年将呈现爆炸式增长
- 币安 CEO:在参与加密货币投资之前需自行研究
- 分析:特朗普期望建立比特币战略储备及 MSTR 进入纳指 100 等多个因素将助力 BTC 创下新高
- DWF Labs 与阿布扎比区块链中心达成合作,将共同推出加速器计划
- 币安将上线 FIOUSDT 永续合约,最高杠杆可达 75 倍
- Amber Group迪拜子公司获得虚拟资产服务提供商许可证的原则性批准
- Greeks.live:投资者开始布局第四季度,十月行情值得关注
- 印度最高法院 YouTube 频道被劫持用于推销 XRP
- 富兰克林邓普顿计划在 Solana 区块链上推出共同基金
- Securitize与Wormhole达成合作,将共同推动跨链资产代币化