山鲸AI
无数可心AI Tool,
助你总有新发现。
🔥热门工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
SDXL-Light – 目前最快文生图AI模型,让AI出图速度提升 10 倍!
生成式人工智能技术已成为业界的焦点,它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像,可能需要5秒钟,并且要多次调用庞大的神经网络。因此,研究的热点是如何在保证图像质量的同时,加快图像的生成速度。 一、SDXL-Lightning是什么? SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-… -
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
TripoSR – 快速单图生成3D模型,1秒完成,本地部署包,Stability AI与华人团队联合开源
TripoSR 的开发灵感来源于LRM(Large Reconstruction Models)的最新研究成果,即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术,旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求,通过快速响应输出,实现3D模型细节的精确可视化。 在性能测试中,TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成… -
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够… -
ComflowySpace – 开箱即用的ComfyUI客户端,MacOS用户的福音~
有在使用 Mac 电脑又想使用 ComfyUI,但因为安装困难而放弃的朋友吗? 开源AI图像和视频生成工具值得更好的交互设计体验,而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮,因为工具门槛太高。这正是我们想要解决的问题。因此,我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具,ComflowySpace。 ComflowySpace的目标是做出人人…
🥕最新收录
-
Vector Magic – 超级好用的位图转矢量AI工具,中文破解版,轻松驾驭Mac与Win双平台~
@你丫才美工 :推荐一个超好用的软件,位图秒转矢量图!真的是秒转哦!软件的名字叫:Vector Magic,转矢量最强软件!试用之后真的超级厉害的!转出来的文件,锚点少,曲线平滑 还原度高,简直设计师必备!以后素材不够大都靠它啦!已打包,赶紧来拿! 在数字化时代,图像已经成为我们生活和工作中不可或缺的一部分。无论是设计师、艺术家,还是普通用户,都对图像质量有着极高的要求。而矢量图像,以其清晰度高、… -
Jasper – 新媒体内容创作者必备AI写作工具,AI助力高效内容创作
您可能听说过 ChatGPT 或其他自然语言处理 (NLP) 工具,但 Jasper 在简化工作流程方面优于它们。 它被设计为内容创建和管理的一站式商店:您可以使用它来创建博客文章、网页、电子邮件、社交媒体帖子、 YouTube 脚本、Facebook 广告等等。 一、Jasper 是什么? Jasper(原Jarvis)是国外最受欢迎的AI写作软件工具之一,因其丰富的的模板和强大的智能… -
Vectorizer AI – 位图转矢量在线AI神器,让你的图片像素无限放大的秘密武器,可无限放大。支持最大 2 万像素、30MB 图片大小
一、Vectorizer AI 是什么? Vectorizer AI 是一个位图转矢量图在线工具,能够帮助我们快速将JEPG和PNG格式的位图转换为SVG格式的矢量图。打开https://vectorizer.ai/,点击「PICK IMAGE TO VECTORIZE」按钮上传需要转换的位图,也可以直接将图片粘贴至上传区域,上传完成后后自动进行矢量图转换,在预览区左边为位图原图,右边为转换好的s… -
Tracejourney – 拯救Midjourney渣图画质,抠图、放大、转矢量统统不在话下,Midjourney最佳伴侣~
你是不是经常为了做IP而苦恼,想要把图片变成矢量图却不知道怎么操作? 别担心,推荐一款神奇的工具:Tracejourney 一、Tracejourney 是什么? Tracejourney Bot 是一款基于 Discord 的图像处理工具,可以实现图像转 SVG 矢量文件、抠图背景、放大、提取描述词、格式转换以及亮度和对比度调节。它可以在我们放大 Midjourney 图像的时候弹出功能框,点击… -
Rytr – 逆天的人工智能写作AI工具,帮你轻松丢掉写作发恼
无论您是个人写作者、企业营销人员还是社交媒体运营者,Rytr 都能够为您节省大量时间和精力,让写作变得更加轻松愉快。不再为寻找灵感而烦恼,不再为内容质量而担忧,Rytr 将成为您不可或缺的得力助手。 一、Rytr是什么? Rytr是一个AI写作助手,帮助用户快速、经济高效地创建高质量的内容。它利用最先进的语言AI技术为各种写作需求生成独特、原创的内容。从电子邮件到博客文章到广告文案,Rytr可以自… -
MuseTalk – 数字虚拟人唇形同步视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseTalk是什么? MuseTalk 是由腾讯团队开发的先进技术,它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号,自动调整数字人物的面部图像,使其唇形与音频内容高度同步。这样,观众就能看到数字人物口型与声音完美匹配的效果。MuseTalk 特别适用于256 x 256像素的面部区域,且支持中文、英文和日文等多种语言输入。在NVIDIA Tesla V100显卡上,Mus…
-
DDColor – 阿里AI老照片上色一键修复工具
一、什么是DDColor? 🎨DDColor 是最新的 SOTA 图像上色算法,能够对输入的黑白图像生成自然生动的彩色结果,使用 UNet 结构的骨干网络和图像解码器分别实现图像特征提取和特征图上采样,并利用 Transformer 结构的颜色解码器完成基于视觉语义的颜色查询,最终聚合输出彩色通道预测结果。 🪄 DDColor 可以为历史黑白老照片提供生动自然的着色。 🎲 它甚至可以对动漫游戏中的… -
NovelAI – 专注二次元漫画AI绘画工具,本地部署,一键免费使用
大家近几个月应该都听说过了,大批画师感叹要失业了,当然,就目前来看,这一言论还不太符合实际,但是究竟为什么让画师们这么震惊呢? 一、NovelAI是什么? NovelAI 是一项在线云端的订阅服务,它使用人工智能算法来协助作者、讲故事和虚拟陪伴。它提供了诸如文本到图像AI艺术生成器和生成新概念和情节线等功能。该服务于2021年6月在beta版中推出,并在2022年10月添加了图像生成功能。它由位于… -
Stable Diffusion 秋叶整合包v4.6 – 解压即用,防爆显存,快速入门AI绘画
Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ Stable Diffusion(SD)是什么? Stable Diff… -
Magnific AI – 专业级AI图像画质细节增强/无损放大AI神器,AI生图“精修师”
给跪了,新工具 Magnific 誓成 AI 生图“精修师”:小细节、高分辨率一拉即成! 一、Magnific AI是什么? Magnific AI是一个功能和算法非常强大的AI图像放大变高清的工具,支持将图片最高放大到10000×10000像素(10K分辨率)。Magnific AI转换放大后的图片拥有高质量的细节,适合用于如高分辨率的打印和图片处理。该AI扩图工具虽然需要付费使用,但如果你对图… -
DiffBIR – 新一代高质量图像修复技术AI工具(支持Google Colab)
在人工智能照片修复方面,我们通常会想到像SD(StyleGAN等)这类的生成式对抗网络。然而,这些模型有时候会在图像修复过程中“发挥过头”,导致生成的图片与原始内容大相径庭。 本次我们要分享的AI照片修复工具,有效解决了上述问题。这个工具不仅能够有效去除图片噪声、模糊等问题,还能复原老照片中褪色或缺失的细节,使其看起来更加鲜活和真实。同时,保证修复后的图片忠实于原图内容。这一突破性的算法模型被称为… -
AI Comic Factory – 免费开源,基于LLM的漫画创作AI在线工具
不会画漫画?没问题! 通过 AI Comic Factory 释放您的创造力,艺术无国界,讲故事变得毫不费力。潜入漫画制作领域! 一、AI Comic Factory是什么? AI Comic Factory 是一个强大的数字漫画创作工具,无需绘画技能,通过AI助手和自然语言描述,轻松生成原创漫画。选择多种风格,灵活布局,添加引人入胜的文字说明,通过反复修改优化漫画。适用于有限绘画技能的用户,提供… -
Stable Doodle – 零门槛AI绘画神器,手残党福音,Stability AI 推出素描转图像工具,让你的涂鸦变成艺术品~
Stability AI 推出的 Stable Doodle 是一款颠覆性的素描转图像工具,它能够将简易的手绘素描转化为栩栩如生的动态图像。这款工具不仅适用于专业人士,同样适合业余爱好者,为用户开启无限的图像创作可能性。 一、Stable Doodle是什么? Stable Doodle是由Stability AI推出的一款零门槛AI绘画神器,可以将简单的草图转化为精美的图像。它可以将随手的涂鸦草… -
Image to Line Drawings – 图片一键转素描线稿AI工具
一、Image to Line Drawings是什么? 在传统艺术学习过程中,绘制一幅素描作品往往需要耗费大量时间和精力。然而,在AI的帮助下,这一过程可以被大幅简化。本文介绍的Image to Line Drawings整合包,便是这样一个工具,它能够帮助用户迅速将普通图片转换成素描风格的线条图。 二、Image to Line Drawing如何使用? 为了让更多用户能够轻松体验这一技术,我…
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L… -
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(… -
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项… -
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
VideoReTalking – 虚拟数字人视频AI工具整合包,同步音频嘴型/面部表情,腾讯出品~
你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。 一、什么是VideoReTalking? VideoReTalking,这是一种新的AI系统,可以根据输入音频编辑现实世界中头部说话视频的面孔,即使具有不同的情绪,… -
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…
🎵AI声音工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能… -
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频… -
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情… -
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER… -
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark… -
AudioCraft – 顶级音乐生成AI工具,来自Meta AI免费开源,音乐效果媲美音乐家作品~
一、AudioCraft是什么? AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求:音乐、音效以及原始音频信号训练后的压缩。 它具有最先进的EnCodec音频压缩器/标记器,沿着MusicGen,一个简单可控的音乐生成LM,具有文本和旋律调节。 素材训练使用2万小时的授权音乐来训练MusicGen。 二、AudioCraft的项目地址: … -
Vocal Separate – 极简音乐人声分离AI工具,本地部署,无需网络,支持CPU
将一首歌曲或者含有背景音乐的音视频文件,拖拽到本地网页中,即可将其中的人声和音乐声分离为单独的音频wav文件,可选单独分离“钢琴声”、“贝斯声”、“鼓声”等 一、Vocal Separate是什么? 这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网,使用 2stems/4stems/5stems 模型。 二、Vocal Separate的开源地址: https://github.…
-
CSM 3D – 波士顿AI初创公司3D模型生成AI工具,图片秒变3D,有手就会的AI建模神器~
在AI领域的持续创新中,3D建模一直是等待着自己的"ChatGPT"时刻。 一、CSM 3D 是什么? CSM全称 Common Sense Machines,来自普纳的前 Google DeepMind 研究科学家 Tejas Kulkarni 与他人共同创立。这是一家位于波士顿的人工智能初创公司,旨在彻底改变 3D 生成人工智能平台。支持从视频和图像创建 3D 模型,最新上… -
OMS-Diffusion – AI换装升级版来了,虚拟试衣间,本地整合包,免训练,免安装
OMS-Diffusion 是OOTDiffusion的分支版本,与原来的 OOTDiffusion 训练两个 Unet 不同,OMS-Diffusion 只训练一个 Unet,这意味着一台 24GB 内存的机器(3090 或 4090)就足够了。 如今已有很多关于虚拟试穿的项目,如谷歌的Tryon Diffusion, 阿里的Outfit Anyone, 亚马的Diffuse to Choose… -
SadTalker – 图片配合音频秒变声音视频,头部、嘴型超自然,中英双语全能,还会唱歌~
单个肖像图像 🙎♂️ + 音频 🎤 = 头部说话视频🎞 一、SadTalker是什么? SadTalker模型是一个使用图片与音频文件自动合成人物说话动画的开源模型,我们自己给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴,眨眼,移动头部等动作。SadTalker,它从音频中生成 3DMM 的 3D 运动系数(头部姿势、表情),并隐式调制一种新颖的 3D… -
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf… -
Meshy – 全球最顶尖文本生成3D模型AI神器,没有之一,打开AI创作的无限可能,探索未知领域!
不仅是工具,Meshy为你打开AI在3D创作中的无限可能,探索未知领域~ 一、Meshy 是什么? Meshy 是一款创建 3D 游戏资产的 AI 工具,目标是利用生成式 AI 实现整个 3D 工作流的自动化。目前它的主要功能有 3 种:文本生成贴图纹理(AI Texturing)、文本生成 3D 模型(Text to 3D)以及图片生成 3D 模型(Image to 3D)。 它可以通过文本或图… -
Stable Diffusion 秋叶整合包v4.6 – 解压即用,防爆显存,快速入门AI绘画
Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ Stable Diffusion(SD)是什么? Stable Diff… -
SUDO AI – 领先的生成式人工智能 3D 创意AI工具
在AI领域的持续创新中,3D建模一直是等待着自己的"ChatGPT"时刻。 一、SUDO AI 是什么? SudoAI 支持通过文本和图像生成 3D 模型,目前主攻游戏领域的模型生成,新用户每月有 40 个免费积分可以使用。 如果想通过文本生成 3D 模型,先进入 Text to 3D 版块,先在文本框输入提示词并点击 Generate 按钮,等待几秒后可以得到 4 个预览图像… -
FaceChain – AI写真馆,妙鸭相机最强平替,仅需2张,即可获得专属写真大片~
FaceChain人物写真生成,仅需要某个人物的2张照片,即可训练得到该人物的专属形象,并批量生成各种风格的写真照片。FaceChain基于扩散模型的图像生成能力,结合LoRA训练实现人像和风格融合,并叠加一系列后处理能力,实现兼具相似度、真实感、美观度的写真生成能力。 一、FaceChain是什么? FaceChain是一款可以用于打造个人数字形象的深度学习模型工具。用户只需提供最低一张照片即可… -
Krea AI – 超级强大的实时图像AI生成工具,颠覆传统工作流,为创意提供无限可能!
Krea AI 是一个 AI 智能设计工具,功能包括文生图、AI pattern、Logo Illustration 以及 AI 模型训练等,它最近因为实时生成(Real-time Generation)功能而备受瞩目。 一、Krea AI是什么? Krea AI是一种全新的创意工具,它利用人工智能生成高质量的视觉效果,同时了解你的风格、概念或产品。你可以上传图像并训练AI引擎,然后在画布上生成图… -
ComflowySpace – 开箱即用的ComfyUI客户端,MacOS用户的福音~
有在使用 Mac 电脑又想使用 ComfyUI,但因为安装困难而放弃的朋友吗? 开源AI图像和视频生成工具值得更好的交互设计体验,而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮,因为工具门槛太高。这正是我们想要解决的问题。因此,我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具,ComflowySpace。 ComflowySpace的目标是做出人人… -
FRESCO – 一键视频风格转换AI工具,告别复杂工作流,北京大学开源,本地整合包,一键运行~
北京大学近日发布了一项全新的视频风格转换工具——FRESCO。这一工具旨在简化视频转视频的处理流程,使之更加便捷、高效。FRESCO支持将视频转换为多种不同的风格,并且独特之处在于,它可以选择性地转换视频中特定的部分。值得一提的是,该项目的代码已经开源,供广大研究人员和爱好者使用和探索。 一、FRESCO是什么? FRESCO在设计时考虑了帧间对应关系,并引入了帧内对应概念,从而构建了一个更加稳定… -
Style2Paints – 最强二次元线稿重绘着色AI工具,可输出PSD
人工智能的力量通过 Microsoft Windows 上的 Style2Paints 应用程序再次发挥作用。您所需要的只是您的线条艺术和 Nvidia GPU。当你曾经沉闷无生气的图像突然变得色彩缤纷时,让你的思绪轻轻地受到震撼! 一、Style2Paints是什么? Style2paints V4 是一款人工智能驱动的线性着色工具。不需要安装任何环境、做任何配置,下载然后双击,就可以给线描图画… -
NovelAI – 专注二次元漫画AI绘画工具,本地部署,一键免费使用
大家近几个月应该都听说过了,大批画师感叹要失业了,当然,就目前来看,这一言论还不太符合实际,但是究竟为什么让画师们这么震惊呢? 一、NovelAI是什么? NovelAI 是一项在线云端的订阅服务,它使用人工智能算法来协助作者、讲故事和虚拟陪伴。它提供了诸如文本到图像AI艺术生成器和生成新概念和情节线等功能。该服务于2021年6月在beta版中推出,并在2022年10月添加了图像生成功能。它由位于… -
VIGGLE – 可控的3D人物角色视频生成AI工具,科目三蹦迪多种舞姿根本停不下来,可精准控制人物姿势了~
Sora漫步街头的女人可以跳舞啦!科目三蹦迪多种舞姿停不下来,可精准控制动作。 目前VIGGLE在Discord可免费使用,赶紧去体验吧~ 一、VIGGLE是什么? VIGGLE是一款基于JST-1技术的可控视频生成平台,使用户能够创建和控制3D角色的动作。用户可以根据自己的意愿让任何角色进行移动和动作,而不仅仅是局限于预设的动画或动作。这种技术的应用可能会在游戏开发、动画制作、虚拟现实(VR)和… -
SONOTELLER – 快速音乐歌词分析风格AI在线工具,音乐人必备神器
无论是音乐爱好者还是专业从业者,他们都能借助SONOTELLER更好地管理自己的音乐库和数据,并进行受众分析。 使用SONOTELLER非常简单,只需前往YouTube,搜索所需歌曲,复制其URL,然后将URL粘贴到SONOTELLER.AI的搜索框中即可获取详细分析结果。 一、SONOTELLER是什么: SONOTELLER是一个在线AI音乐分析工具,专门用于分析YouTube上的音乐和歌词。… -
FunkyDesigns – 人工智能驱动的配色方案字体排版AI工具
用独特的配色方案和排版来丰富您的网页设计~ 一、FunkyDesigns是什么? FunkyDesigns是一个面向 UI/UX 设计师和前端的在线工具,FunkyDesigns的功能非常简单直接,帮你搞定网页的版面样式,从字体搭配、配色方案以及具体的 UI 控件怎么呈现。 和以往工具不同的地方在于,FunkyDesigns 并不是简单的搜集征集解决方案,而是借助 AI 来生成配色和字体搭配的,换…