山鲸AI
无数可心AI Tool,
助你总有新发现。
🔥热门工具
-
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够… -
ComfyUI 秋叶整合包 – 工作流界面,超多节点,解压即用,一键启动,快速入门AI绘画
上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包,让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了,我也安装试用了一下,的确非常方便,今天就为大家详细介绍一下整合包的用法 ~ 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ 一、Comf… -
ComflowySpace – 开箱即用的ComfyUI客户端,MacOS用户的福音~
有在使用 Mac 电脑又想使用 ComfyUI,但因为安装困难而放弃的朋友吗? 开源AI图像和视频生成工具值得更好的交互设计体验,而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮,因为工具门槛太高。这正是我们想要解决的问题。因此,我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具,ComflowySpace。 ComflowySpace的目标是做出人人…
🥕最新收录
-
Soundraw – 专为音乐人打造的在线AI音乐平台,停止搜索您需要的歌曲,自己创造吧~
Soundraw为视频编辑、音乐制作人和自由职业者等提供了一个强大的平台,以创造丰富的AI音乐。 一、Soundraw是什么? Soundraw是一款由Tago公司于2020年2月推出的在线AI音乐生成器。 Soundraw 是一个非常容易上手的 AI 音乐生成工具,即使你完全是音乐小白,也能用它创作出高质量的视频。登录后只需要设置音乐时长、速度,再选择流派、情绪和主题,5 步内就能轻松生成音乐… -
Stable Video – Stability AI推出的AI视频生成平台,卷爆Sora!一句话生成视频,图片也转成视频
Sora 虽然是造势很大,但是个人猜测想要公开使用大概率是卡在了算力方面,所以迟迟没有动静,网上申请了红客应用的人们也没有收到邀请内测,奥特曼也在靠几个 demo 想拉 7 万亿美元的投资实属有点异想天开了,种种不正常的表现引人遐想。 而就在这个是时候 Stability.ai 最新发布了 stable video 的官网,它是一个 AI 视频生成平台,用户可以通过文本或图像,将自己的想象转化为精… -
Dreamina – 字节旗下AIGC创作工具,首个中文生成视频的AI工具,用简单的文案,创作精彩的作品
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐) 一、Dreamina是什么? Dreamina是由字节跳动抖音旗下的剪映推出的一款AI图片创作和绘画工具,专门设计用于激发艺术创意和提升绘画体验。 我们提供多样化的功能,包括文字绘图、扩图、局部重绘和图片灵感生成,让您的艺术创作更加多元和精准。 在Dreamina,您可以使用自然语言描述您想要的图片,让先进…
-
Stable Diffusion 秋叶整合包v4.6 – 解压即用,防爆显存,快速入门AI绘画
Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ Stable Diffusion(SD)是什么? Stable Diff… -
GFPGAN – 老照片人脸修复AI工具本地整合包,腾讯团队出品~
在数字时代,老照片的修复和保存成为了一项挑战性的任务。幸运的是,随着人工智能技术的发展,我们现在能够以前所未有的方式恢复这些珍贵的回忆。GFPGAN,由腾讯开源,代表了这一技术进步的前沿。这款先进的人脸修复算法不仅仅是一个工具,它集成了一系列的先验知识,以支持对老旧照片中的人脸进行高效、自动化的修复。 通过使用预训练的模型,GFPGAN能够处理所谓的“盲脸”(blind face)修复任务,即在没… -
DDColor – 阿里AI老照片上色一键修复工具
一、什么是DDColor? 🎨DDColor 是最新的 SOTA 图像上色算法,能够对输入的黑白图像生成自然生动的彩色结果,使用 UNet 结构的骨干网络和图像解码器分别实现图像特征提取和特征图上采样,并利用 Transformer 结构的颜色解码器完成基于视觉语义的颜色查询,最终聚合输出彩色通道预测结果。 🪄 DDColor 可以为历史黑白老照片提供生动自然的着色。 🎲 它甚至可以对动漫游戏中的…
-
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、koboldcp… -
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(…
🎵AI声音工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能… -
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情…
-
Logo Diffusion – 全球顶尖LOGO商标生成AI工具,在线一键生成,LOGO生成式AI天花板产品~
今年一月份,官方迎来V3的版本更新,借助从头开始构建的新徽标设计 AI 模型,这是官方迄今为止最雄心勃勃的版本。 一、Logo Diffusion是什么? Logo Diffusion是一个利用生成式AI技术帮助用户快速生成和创建独特Logo标志的工具。只需要输入简单的文本提示,AI会在几秒钟内创建出原创设计。 此外,Logo Diffusion还提供将生成的标志转换成清晰的行业标准矢量文件的功能… -
DemoFusion – 专业优化放大AI图像/细节增强高清神器,无需$$$
DemoFusion 是一款能够显著提高图像分辨率的增强工具。它允许用户将图像的分辨率提升至原来的4倍、16倍甚至更高,不仅增强图片的清晰度,还能够细化图片中的小细节,如纹理和边缘,创造出更为自然和逼真的视觉效果。DemoFusion 与基于潜在扩散模型(LDM)的多种应用无缝集成,例如ControlNet,同时还能放大真实世界中拍摄的图像。 一、DemoFusion的技术剖析: 使用生成人工智能… -
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够… -
Catjourney – 专业收录高质量AI绘画提示词网站,值得收藏~
Catjourney可以帮助您快速生成美观、实用、可重复使用的AI图像。您可以复制提示以在您最喜欢的图像生成工具中生成图像,无论是Midjourney、Firefly还是DALL-E。每周都会发布各种类型的新提示和图像。 一、Catjourney是什么? Catjourney 是由 @歸藏 和 @ LysonOber 联合开发的一个提示词网站,专门收录高质量的 AI 绘画提示词,可以一键复制并用于… -
Snack Prompt – AI对话提示词专业分享平台,同时支持ChatGPT&Gemini~
一、Snack Prompt是什么? Snack Prompt 是一个由社区驱动的平台,专门为ChatGPT和Gemini提供最佳的AI提示词。在这个平台上,你可以发现、投票和分享各种AI提示词,跟踪关注的主题,创建和组织提示词,以及与专业的提示者进行交流。通过Snack Prompt,你可以充分挖掘AI的潜力。 二、Snack Prompt的官网地址: https://snackprompt.c… -
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
Stable Video – Stability AI推出的AI视频生成平台,卷爆Sora!一句话生成视频,图片也转成视频
Sora 虽然是造势很大,但是个人猜测想要公开使用大概率是卡在了算力方面,所以迟迟没有动静,网上申请了红客应用的人们也没有收到邀请内测,奥特曼也在靠几个 demo 想拉 7 万亿美元的投资实属有点异想天开了,种种不正常的表现引人遐想。 而就在这个是时候 Stability.ai 最新发布了 stable video 的官网,它是一个 AI 视频生成平台,用户可以通过文本或图像,将自己的想象转化为精… -
FaceFusion – 重磅更新,最强AI换脸汉化软化,去遮挡,高清化,卡通脸一键替换,本地整合包,无需部署,无需训练,免费使用!
一个替代Roop的开源软件,通过AI换脸技术实现简单的面部替换操作。Roop项目由于团队成员不当使用而停更,但其中一位作者开源了新项目FaceFusion,在GitHub上已经获得超过5000星的关注。 一、FaceFusion是什么? Facefusion是一款最新的开源AI视频/图片换脸项目。项目官方介绍只有一句话,下一代换脸器和增强器。采用了全新的界面设计,可以像Stable Diffuis… -
VOICEVOX – 专业日语AI配音文本语音合成工具
日语文字转语音软件「VOICEVOX」,提供了很多种不同的语音角色,每个角色都有独特的声音特征,适用于不同的场景和需求。VOICEVOX提供了直观易用的用户界面,使用户能够轻松地输入文本、选择语音角色、调整语音参数,并生成语音。 同时支持CPU,GPU,提供超过30 种不同声音的角色让你选择,效果如下: 一、VOICEVOX的官网地址: https://voicevox.hiroshiba.jp/… -
SONOTELLER – 快速音乐歌词分析风格AI在线工具,音乐人必备神器
无论是音乐爱好者还是专业从业者,他们都能借助SONOTELLER更好地管理自己的音乐库和数据,并进行受众分析。 使用SONOTELLER非常简单,只需前往YouTube,搜索所需歌曲,复制其URL,然后将URL粘贴到SONOTELLER.AI的搜索框中即可获取详细分析结果。 一、SONOTELLER是什么: SONOTELLER是一个在线AI音乐分析工具,专门用于分析YouTube上的音乐和歌词。… -
ComflowySpace – 开箱即用的ComfyUI客户端,MacOS用户的福音~
有在使用 Mac 电脑又想使用 ComfyUI,但因为安装困难而放弃的朋友吗? 开源AI图像和视频生成工具值得更好的交互设计体验,而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮,因为工具门槛太高。这正是我们想要解决的问题。因此,我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具,ComflowySpace。 ComflowySpace的目标是做出人人… -
ASR – 视频/语音自动生成字幕工具,本地整合包,AI视频剪辑必备神器~
一、ASR是什么? ASR全称Automatic Speech Recognition,自动语音识别也称为语音转文本 (STT),是将给定音频转录为文本的任务。它有很多应用,例如语音用户界面。 二、ASR的项目地址: https://huggingface.co/tasks/automatic-speech-recognition 三、ASR的使用场景: 1、虚拟语音助手 许多边缘设备都有嵌入式虚… -
DragGAN – 颠覆级AI工具,拖拖拽拽就能P图,再也不怕老板叫我给大象掉个头了~
DragGan巅峰级P图工具,离线版本,开箱即用! 最新AI绘图论文引爆学术届。多所知名学府及机构学者联合发布。AI 绘图神器出现,让图像实现形状、布局、姿态、表情、位置和大小的精准控制。 使用 DragGAN,只需确定生成图像的起点和终点,就能够根据对象的物理结构,生成符合逻辑的精细尺度图像。能够使图像实现形状、布局、姿态、表情、位置和大小的精准控制。输入一张行走的马,产生出一张奔跑的马。输入一… -
TTSMAKER PRO – 人工智能AI语音在线生成工具
TTSMaker Pro是一款专为专业人士设计的顶级人工智能语音生成工作室。支持 50 多种语言和 300 多种语音风格,为您提供 20 多种无限语音和高级语音合成功能,包括语音情感和说话风格,进一步增强用户体验。此外,您还可以方便地下载和共享音频文件。 一、TTSMAKER PRO的官网地址: https://pro.ttsmaker.com/ 二、TTSMAKER的产品优势: 为专业人士提供强… -
Krea AI – 超级强大的实时图像AI生成工具,颠覆传统工作流,为创意提供无限可能!
Krea AI 是一个 AI 智能设计工具,功能包括文生图、AI pattern、Logo Illustration 以及 AI 模型训练等,它最近因为实时生成(Real-time Generation)功能而备受瞩目。 一、Krea AI是什么? Krea AI是一种全新的创意工具,它利用人工智能生成高质量的视觉效果,同时了解你的风格、概念或产品。你可以上传图像并训练AI引擎,然后在画布上生成图… -
InpaintAnything- 一键智能局部重绘变装/换发型AI工具
一、InpaintAnything是什么? AI换装换发型局部重绘软件,可以用来重绘图片、换装、换发型等。它的独立版不需要依赖其他软件,而整合版则更为方便。 二、InpaintAnything的开源地址: https://github.com/Uminosachi/inpaint-anything 三、InpaintAnything的操作界面: 四、InpaintAnything的主要特点: 🎨 …