AI Intel

Industry Tracks

AI 创意

图像生成、视频生成、剪辑、商品图、AI 模特、广告素材、动效、配音和创作者工作流。

0/5已阅

Push #01 / 5

Pixl Stash 1.3 发布:更快的网格加载、Joy Caption 支持与批量标签选择

未读

分类

图像/视频/3D

来源

Reddit Creative AI Communities

时间

05/25 18:19

质量

充足

industry_tracks今日行业专题突破Coding AgentsOpen Source AI

一句话概括

Pixl Stash 1.3 更新了图片网格加载速度,增加了 Joy Caption 的自动打标和图片描述支持,并允许按所选模型进行批量重标注。

Key Facts

  • Pixl Stash 是一个本地部署、开源的图片管理服务器。
  • 1.3 版本重点改进了图片网格加载速度,原文称 40,000+ 图片的大库浏览更流畅。
  • 新增 Joy Caption 支持,覆盖自动打标和图片描述两种用途。
  • 用户可以在设置中为打标和描述分别选择不同引擎,如 WD14、Pixl Stash Tagger、Joy Caption 等。
  • 每个视图现在都有独立 URL,可用于书签、分享和刷新后回到原位置。

What's New

  • Joy Caption 可被设为默认引擎,但原文明确提示其速度比更简单的引擎更慢,更适合选中部分图片或特定集合处理。

讲了什么

原文介绍了 Pixl Stash 1.3 的功能更新。Pixl Stash 是一个本地部署、开源的图片管理服务器,面向大规模图片和视频集合的整理、筛选、打标与复核,尤其适合 AI 生成数据集。本次更新重点包括:更快的网格初始加载与更流畅的大库浏览;支持 Joy Caption,并可在设置中为打标和描述分别选择不同引擎;支持通过右键菜单对选中的图片按指定引擎重新打标或重新生成描述;以及每个视图都有独立 URL 便于书签、分享和回到原位。

原文链接

Push #02 / 5

在 ComfyUI 中实现服装迁移的求助帖

未读

分类

图像/视频/3D

来源

Reddit Creative AI Communities

时间

05/25 19:21

质量

一般

industry_tracks今日行业专题突破Coding AgentsIndustry Track: Creative AI

一句话概括

作者在 Reddit 上询问如何在 ComfyUI/SDXL 中把参考图服装迁移到目标图或替换人物服装,并提到本地 12GB 显存下效果不佳。

Key Facts

  • 发帖者使用 SDXL,并在 ComfyUI 场景下寻求更精确的服装控制。
  • 发帖者希望实现参考图服装迁移到目标图,以及对人物服装进行替换。
  • 发帖者表示自己尝试过的方法结果都不好。
  • 发帖者认为较大的模型在本地 12GB VRAM 条件下不可行。
  • 高赞评论称在 12GB 显存的 3060 和 24GB 内存环境下运行 Qwen 2511,并使用 100GB 交换文件进行图像创建或编辑。

What's New

  • 评论区提供了一个本地低显存运行图像编辑的个人配置示例:3060 12GB VRAM、24GB RAM、100GB 交换文件。

讲了什么

这是一条 Reddit 求助帖。发帖者表示自己使用 SDXL 想更精确控制生成图像中的服装,希望实现两类能力:一是把参考图中的服装迁移到目标图,二是替换图片中人物的衣服。作者称自己尝试过的方法结果都不好,也知道可以用更大的模型来做,但在本地 12GB VRAM 条件下不可行,因此怀疑这是否是 SDXL 的根本限制,并向社区寻求方案或资源。评论区有人回应自己在 12GB 显存的 3060 上运行 Qwen 2511、机器内存 24GB,并通过 100GB 交换文件正常进行图像创建或编辑,暗示本地运行并非完全不可用。

原文链接

Push #03 / 5

如何同时使用多个角色 LoRA 并避免角色融合

未读

分类

图像/视频/3D

来源

Reddit Creative AI Communities

时间

05/25 19:21

质量

一般

industry_tracks今日行业专题突破Coding AgentsIndustry Track: Creative AI

一句话概括

这是一则 Reddit 讨论帖,作者在 Stable Diffusion 中训练了两个角色 LoRA 后,遇到单个 LoRA 影响无关提示词、多个 LoRA 同时启用会互相混合的问题,并询问如何规避。

Key Facts

  • 作者为狗 mascot 训练了一个 character LoRA,触发词是“d0g”。
  • 作者为刺猬 mascot 训练了另一个 character LoRA,触发词是“h3dg3h0g”。
  • 作者发现即使提示词中不包含对应关键词,dog LoRA 仍会影响生成结果。
  • 作者发现同时加载两个 LoRA 时会发生 blending,导致 inpainting 结果变差。
  • 作者当前考虑的做法是分两次 inpainting,分别对不同区域应用不同 LoRA。

What's New

  • 作者提到在 Reddit 中看到有人建议用 <lora:lora_name:lora_strength> 语法调节 LoRA 强度。

讲了什么

原文主要是在描述一个 Stable Diffusion 的使用问题:作者分别为狗 mascot 和刺猬 mascot 训练了两个 character LoRA,触发词分别是“d0g”和“h3dg3h0g”。作者发现两个具体问题:第一,即使提示词里没有对应关键词,dog LoRA 仍会影响生成结果;第二,当同时加载两个 LoRA 时,它们会发生融合,导致 inpainting 结果变差。作者提到自己当前用 VACE 做 object removal / inpainting,且对象是 mascot 的手部。文中还提到,作者尝试过只用一个 LoRA 进行 inpainting,会出现另一个角色被意外改动;同时启用两个 LoRA 又会出现混合。作者目前考虑的方案是分两次 inpainting,先遮罩左手并应用一个 LoRA,再遮罩右手并应用另一个 LoRA,但担心耗时增加;他也提到 Reddit 上有人建议用 <lora:lora_name:lora_strength> 语法控制强度,但作者不确定这是否能直接解决自己这种两个 LoRA 需要同时激活的场景。

原文链接

Push #04 / 5

《Dorsal Fin(清凉浩室混音)》帖子

未读

分类

图像/视频/3D

来源

Reddit Creative AI Communities

时间

05/25 19:21

质量

不足

industry_tracks行业专题Coding AgentsIndustry Track: Creative AIResearch Papersimage_video_3d

一句话概括

这是一条来自 r/aivideo 的 Reddit 帖子记录,标题为《Dorsal Fin (Chilled House Remix)》,正文主要是重复的帖子元数据,没有提供实际内容。

Key Facts

  • 帖子来源于 Reddit 的 r/aivideo。
  • 原文显示评论数为 0。
  • 原文显示 score 为 8。
  • 正文内容高度重复,未展开具体创作或产品信息。

What's New

  • 《Dorsal Fin(清凉浩室混音)》帖子 属于新的官方发布或产品更新信号。
  • 来源为 Reddit Creative AI Communities,后续可重新运行中文分析任务补全细节。

讲了什么

原文几乎全部由 Reddit 帖子元信息重复组成,仅能确认帖子标题为“Dorsal Fin (Chilled House Remix)”,来自 r/aivideo,评论数为 0,score 为 8。正文未提供视频、音乐、创作过程或任何可核实的新信息。

原文链接

Push #05 / 5

《COVERT-DESIGN [DEAD DROP DISCO]》Reddit 帖子

未读

分类

图像/视频/3D

来源

Reddit Creative AI Communities

时间

05/25 19:21

质量

不足

industry_tracks行业专题Coding AgentsIndustry Track: Creative AIResearch Papersimage_video_3d

一句话概括

这是一条来自 r/midjourney 的重复抓取帖子,正文几乎只有帖子元信息和一条重复的评论,没有提供可独立验证的新内容。

Key Facts

  • 原文显示 score 为 33,comments 为 1。
  • 正文中出现的高赞评论内容是“Your style is so good 和 the consistency is awesome”。

What's New

  • 《COVERT-DESIGN [DEAD DROP DISCO]》Reddit 帖子 属于新的官方发布或产品更新信号。
  • 来源为 Reddit Creative AI Communities,后续可重新运行中文分析任务补全细节。

讲了什么

原文主要是 Reddit API 抓取结果,显示标题为“COVERT-DESIGN [DEAD DROP DISCO]”,来源于 r/midjourney,评分为 33,评论数为 1。正文中反复出现一条高赞评论,内容是“Your style is so good 和 the consistency is awesome”。除这些元信息和重复评论外,没有提供作品说明、制作过程或其他可验证信息。

原文链接