Story-Adapter:开源的长故事可视化工具

Story-Adapter:开源的长故事可视化工具

Story-Adapter 是 Github 上的开源项目,能够根据故事提供一致性的可视化。

作者在Story-Adapter项目页面上这样介绍:

故事可视化,即基于叙述生成连贯图像的任务,随着文本到图像模型的出现,尤其是扩散模型,已经取得了显著的进步。然而,在长时间的故事可视化中(例如,多达100帧),保持语义的一致性、生成高质量的细粒度互动以及确保计算上的可行性仍然是具有挑战性的。在这项工作中,我们提出了一种无需训练且计算效率高的框架,称为Story-Adapter,以增强长故事的生成能力。具体来说,我们提出了一个迭代范式来优化每个生成的图像,该范式既利用了文本提示也利用了前一次迭代中生成的所有图像。我们框架的核心是一个无需训练的全局参考交叉注意力模块,它汇总了前一次迭代中生成的所有图像,以在整个故事中保持语义一致性,同时通过全局嵌入最小化计算成本。这个迭代过程通过反复融入文本约束逐步优化图像生成,从而实现更精确和细粒度的互动。广泛的实验验证了Story-Adapter在改善语义一致性和生成能力方面,特别是在长时间故事场景中的优越性,对于细粒度互动尤为如此。

从项目页面给出的例子来看,该项目能够为故事生成非常精美且一致的漫画。

Story-Adapter项目页面展示的例子

Read more

NVIDIA RTX 50 系列显卡参数速览,5090 拥有 4090 的 2.5 倍 AI 性能

NVIDIA RTX 50 系列显卡参数速览,5090 拥有 4090 的 2.5 倍 AI 性能

NVIDIA 于今天发布 RTX 50 系列显卡。银杏AI第一时间整理了相关参数数据,附上 RTX 5090 D 的数据和 RTX 4090 的数据作为对比。 具体参数如下表。其中 RTX 5090 拥有 3352 TOPS Tensor Core 算力,约为 4090 的 2.5 倍。RTX 5090使用 GDDR7 显存,显存大小为 32GB。RTX 5070 Tensor Core 算力约为 4070 的两倍,显存带宽约为 4070 的 1.3 倍。 NVIDIA

NVIDIA 新一代旗舰显卡 RTX 5090 正式发布:定价1999美元

NVIDIA 新一代旗舰显卡 RTX 5090 正式发布:定价1999美元

快科技1月7消息,2025 CES消费电子展(1月7日至10日,美国拉斯维加斯)开幕在即。北京时间1月7日 (星期二)上午10:30,NVIDIA举办主题演讲,CEO黄仁勋担任主讲。 黄仁勋身着新皮衣亮相,一点也不废话,上来就公布了RTX 50系列Blackwell显卡的价格,一共四款: RTX 5090售价1999美元、RTX 5080 售价999美元、RTX 5070 Ti售价749美元,RTX 5070售价549美元。 其中,RTX 5080将于1月21日率先上市。 怎么样,惊不惊喜,意不意外? 公布价格之前,黄仁勋还特别提到了RTX 4090的价格。去年它的首发价是1599美元,而如今RTX 5070用549美元,就可以提供和4090相媲美的性能。 以RTX 5090售价1999美元的价格来看,折合人民币是1.46万元左右,国内大家可以猜猜。 规格方面,这一代RTX 50系列带来了重大的硬件升级,包括 PCle

ZLUDA 又一次复活 :在 AMD 显卡上运行基于 CUDA 的应用程序

ZLUDA 允许在非 NVIDIA GPU 上运行未经修改的 CUDA 应用程序,由 Andrzej Janik 发布,于 2020 年首次出现,起初它支持 Intel 显卡,CUDA 被称为 Nvidia 在人工智能领域的护城河,是人工智能生态中的重要一环。 然而,ZLUDA 于 2021 年 2 月从 GitHub 上被下架,Janik 的理由是“私人原因”。这与英特尔和 AMD 有关。当 Janik 第一次开始开发 ZLUDA 时,他是英特尔员工,正在内部游说公司采用它。英特尔要求 Janik 在评估该项目时取消该项目,但正如开发人员所说,“英特尔认为没有在英特尔 GPU