🔥热门工具
-
VIGGLE - 可控的3D人物角色视频生成AI工具,科目三蹦迪多种舞姿根本停不下来,可精准控制人物姿势了~
Sora漫步街头的女人可以跳舞啦!科目三蹦迪多种舞姿停不下来,可精准控制动作。 目前VIGGLE在Discord可免费使用,赶紧去体验吧~ 一、VIGGLE是什么? VIGGLE是一款基于JST-1技术的可控视频生成平台,使用户能够创建和控制3D角色的动作。用户可以根据自己的意愿让任何角色进行移动和动作,而不仅仅是局限于预设的动画或动作。这种技术的应用可能会在游戏开发、动画制作、虚拟现实(VR)和… -
UVR5 - 最强人声伴奏分离AI工具,最新版v5.6
UVR5是什么? 全称Ultimate Vocal Remover GUI,目前已更新到5.6版本,是一款完全免费的伴奏制作/人声提取工具,比RX9,RipX和SpectraLayers 9都要好,UVR5提取出来的伴奏已经无限接近原版立体声了! 对于音乐爱好者来说,找到一款既简单易用又能提供专业效果的音频处理软件是非常重要的。无论是因为专业软件的操作难度让人望而却步,还是冷门歌曲难以找到合适的伴… -
ProPainter - 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
Heygen - 全球爆火的顶尖虚拟数字人视频AI工具,一键生成
HeyGen 原名 Movio,是一个在线的数字人视频制作平台。 一、Heygen是什么? HeyGen是一个基于AI数字人技术的视频制作工具。它的特点在于将数字人技术融入到一般的视频制作流程中,也就是除了提供丰富的数字人素材,HeyGen 还提供了 100 多种不同的数字人视频模板,包括广告、电商、新闻、教育、科普、以及抖音、YouTube 视频等多个方面,让用户省去剪辑排版的环节,直接用模板就… -
Clarity AI - 超高质量图像无损放大/细节增强AI工具,Magnific最佳平替,免费开源~
Clarity AI是一款利用最新AI技术的高分辨率图片放大增强工具,它能够增强图片细节并提供超高分辨率,适用于多种场景如风景、肖像、插图、动漫、室内设计等。不仅是一个高质量的图片放大工具,而且还是一个开源项目,允许用户自由使用和修改其代码。 一、Clarity AI 是什么? Clarity Upscaler是一款集成了最新人工智能技术的图像放大工具,其GitHub页面已公开。该工具能够将低分辨… -
DiffMorpher - AI实现图像间平滑过渡视频工具,一键制作抖音爆火的小女孩的一生~
一、DiffMorpher是什么? DiffMorpher是一项人工智能技术,它利用先进的扩散模型,能够在两张图像之间实现平滑且自然的形变,生成过渡视频。这一技术在图像生成领域展现了突破性的进展,大幅提升了生成视频的质量,使其超越了以往的生成模型。 扩散模型在图像生成质量方面已经取得了令人瞩目的成就,但与生成对抗网络(GAN)相比,扩散模型在进行两个图像样本之间的平滑插值方面存在一些挑战。这是因为…
🥕最新收录
-
Aiarty Image Enhancer - Digiarty 旗下图像无损放大AI细节增强神器,完美激活,便携破解版
一、Aiarty Image Enhancer 是什么? Aiarty Image Enhancer 是一款由生成式人工智能驱动的图像增强软件,旨在提升图像的质量和清晰度。它可以去除模糊、降噪、修复和放大图像,同时利用先进的 AI 模型生成逼真的细节。该软件支持将图像放大至高达 32K 的分辨率,适用于各种类型的图像,包括数字照片和扫描图像。 二、Aiarty Image Enhancer 的官方… -
Lupa AI - 专业AI图像无损放大,修复AI生成缺失的细节,专门为AI创作者打造的图像放大神器
一、Lupa AI是什么? Lupa AI 是一款先进的图像增强工具,可以提升细节、恢复丢失元素、锐化纹理,并赋予图像逼真的效果。它提供多种模式,包括创意模式、高保真模式、Flux模式和现实模式,每种模式适用于不同的图像处理需求。它适用于各种类型的插图、图形设计、建筑设计和电影快照,能为图像增添自然质感和真实感。 二、Lupa AI的官网地址: https://app.lupaupscaler.c… -
pixie.haus - 像素艺术轻量级在线绘画/动画创作AI平台,可快速生成像素素材
像素艺术一直是经典的视觉风格之一,受到游戏开发者和创意人士的广泛青睐。然而,制作精致的像素图像往往需要投入大量时间和学习专业工具的精力。Pixie.haus作为一款基于 AI 的在线像素艺术生成平台,为用户提供了快速创作高质量像素图的全新方式,兼具效率与便捷性。 一、pixie.haus 是什么? Pixie Haus 是一个轻量级在线 AI 平台,专注于像素艺术(Pixel Art)与精灵动画(… -
Autodesk Flow Studio 真人视频转CG动画在线AI工具,再次开启动画电影制作的新时代
2024 年五月,Autodesk 收购了 AI 视效公司 Wonder Dynamics 及其旗下产品 Wonder Studio,近日正式更名为 Autodesk Flow Studio。Flow Studio(前身为 Wonder Studio)在推出之际,以其一键置换实拍影片中人物为 CG 角色的功能让人惊艳不已。其背后的原理是透过 AI 技术追踪实拍影片中人物的动作、光影、运镜,甚至是演… -
Google Nano Banana 谷歌 AI 图像模型,目前最强图片编辑处理模型,正式碾压GPT-4o,登上新一代AI王座,保姆喂饭级教程,附带热门提示词,包含免费白嫖方法
Google 最新推出 Gemini 2.5 Flash Image的 AI 图片编辑工具,Nano Banana为该模型的内部代号,由于在AI模型评测平台大火,故内部代号传疯网络,它能够在进行各种复杂修改的同时,完美保持人物或物体的一致性!无论是模特换装、改变姿势、更换场景,甚至修复老旧照片,它都能轻松搞定,为内容创作、电商营销、广告设计等领域带来革命性的改变。 一、Nano Banana&nb… -
OpenAI 正式推出 ChatGPT「学习模式」,不仅给答案,还给详细解题思路,彻底掀桌传统教培业!手把手教孩子学习,干死 AI 教育创企,国内培训机构的未来在哪里?
7月30日,最新报道,OpenAI在ChatGPT中推出学习模式,让其变身为不是只会甩答案的工具人,而是提供“私教服务”,一步步引导用户思考问题得出正确答案。 ChatGPT「学习模式」对免费、Plus、Pro、Team 版登录用户开放,ChatGPT Edu 版用户将在未来几周内获得该功能。 ChatGPT 正迅速成为全球最广泛使用的学习工具之一。学生们借助它来解决难题、备考以及探索新概念。但其…
-
Lama Cleaner - 一键去水印、去人物、去背景AI工具,本地整合包,修复老照片,轻松去除旅行照片中的路人~
这是一款 AI 修复神器,对于照片中不想要的东西,我们只需要简单涂抹,后台就会自动抹去对应的部分且尽量让抹去的部分和周围的环境相融合。 比如想去个图片的水印,自拍照去掉背景中杂乱的人物或事物,都可以用这款软件帮到你。 就连有破损的老照片也能修复,让我们一起探索它的更多功能。 一、Lama Cleaner是什么? Lama Cleaner是一款开源的去水印工具,专为Windows平台设计。它采用了先… -
APISR - 专注二次元动漫图像分辨率增强,无损放大AI神器,让漫画焕然一新,动漫爱好者的福音~
APISR:动漫制作启发现实世界动漫超分辨率 APISR旨在恢复和增强低质量、低分辨率的动漫图像和视频源,这些图像和视频源与现实世界场景相比存在各种退化。 一、APISR是什么? APISR 是一个新的放大算法,专门用于恢复和增强各种低质量、低分辨率的动漫图像和视频,其模型代码已经开源,并且有免费的在线 Demo 可以体验。试了一下效果的确非常不错,可以有效提升线条细节的清晰度,并且色彩的还原度也… -
GPT-4o - 深度剖析GPT-4o画图功能,AI真正进入嘴替时代,再也不骂队友不如人机了!
这次更新的影响力,我认为堪比春节期间发布的 Deepseek R1 模型。特别是在设计圈,一片“哀鸿遍野”。究其原因还是在于 GPT-4o 模型的生图能力不仅是改变了传统设计流程,可能也颠覆了现如今主流的 AI 生图工作流。 一、GPT-4o 是什么? GPT-4o 是一种多模态、多语言生成式预训练转换器模型,它由人工智能 (AI) 开发商 OpenAI 于 2024 年 5 月发布。该模型是一款… -
BRIA Background Removal 顶级商业背景移除/抠图AI工具
一、什么是BRIA? BRIA是BRIA Background Removal的简称,是一个由 BRIA.AI 所开发的图片背景去除开源模型。该模型基于精心选择的数据集进行训练,适用于非商业用途,旨在有效地分离图片中的前景和背景。用户只需上传图片,即可迅速实现背景去除。 Bria-RMBG 模型使用超过 12,000 张高质量、高分辨率、手动标记(像素精度)、完全许可的图像进行训练。我们的基准包括… -
Magnific AI - 专业级AI图像画质细节增强/无损放大AI神器,AI生图“精修师”
给跪了,新工具 Magnific 誓成 AI 生图“精修师”:小细节、高分辨率一拉即成! 一、Magnific AI是什么? Magnific AI是一个功能和算法非常强大的AI图像放大变高清的工具,支持将图片最高放大到10000×10000像素(10K分辨率)。Magnific AI转换放大后的图片拥有高质量的细节,适合用于如高分辨率的打印和图片处理。该AI扩图工具虽然需要付费使用,但如果你对图… -
SeaArt-Furry-XL-1.0 - 高质量毛绒绒卡通动漫人物插画生成AI绘画工具,海艺AI旗下开源项目,本地部署,一键生成~
一、SeaArt-Furry-XL-1.0 是什么? SeaArt-Furry-XL-1.0是基于先进的SDXL框架开发的,专门用于创造高品质的毛茸茸艺术图像。这个工具通过分析超过数百万张毛茸茸的图片,设定了毛茸茸艺术图像创作的新标准。它不仅深入了解各种毛茸茸角色,还细致考量了多种哺乳动物和鸟类的特征,使得生成的图像既精确又具有艺术家的风格。SeaArt-Furry-XL-1.0的目标是为毛茸茸艺… -
AI Comic Factory - 免费开源,基于LLM的漫画创作AI在线工具
不会画漫画?没问题! 通过 AI Comic Factory 释放您的创造力,艺术无国界,讲故事变得毫不费力。潜入漫画制作领域! 一、AI Comic Factory是什么? AI Comic Factory 是一个强大的数字漫画创作工具,无需绘画技能,通过AI助手和自然语言描述,轻松生成原创漫画。选择多种风格,灵活布局,添加引人入胜的文字说明,通过反复修改优化漫画。适用于有限绘画技能的用户,提供… -
Image to Line Drawings - 图片一键转素描线稿AI工具
一、Image to Line Drawings是什么? 在传统艺术学习过程中,绘制一幅素描作品往往需要耗费大量时间和精力。然而,在AI的帮助下,这一过程可以被大幅简化。本文介绍的Image to Line Drawings整合包,便是这样一个工具,它能够帮助用户迅速将普通图片转换成素描风格的线条图。 二、Image to Line Drawing如何使用? 为了让更多用户能够轻松体验这一技术,我…
-
VIGGLE - 可控的3D人物角色视频生成AI工具,科目三蹦迪多种舞姿根本停不下来,可精准控制人物姿势了~
Sora漫步街头的女人可以跳舞啦!科目三蹦迪多种舞姿停不下来,可精准控制动作。 目前VIGGLE在Discord可免费使用,赶紧去体验吧~ 一、VIGGLE是什么? VIGGLE是一款基于JST-1技术的可控视频生成平台,使用户能够创建和控制3D角色的动作。用户可以根据自己的意愿让任何角色进行移动和动作,而不仅仅是局限于预设的动画或动作。这种技术的应用可能会在游戏开发、动画制作、虚拟现实(VR)和… -
ProPainter - 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
Heygen - 全球爆火的顶尖虚拟数字人视频AI工具,一键生成
HeyGen 原名 Movio,是一个在线的数字人视频制作平台。 一、Heygen是什么? HeyGen是一个基于AI数字人技术的视频制作工具。它的特点在于将数字人技术融入到一般的视频制作流程中,也就是除了提供丰富的数字人素材,HeyGen 还提供了 100 多种不同的数字人视频模板,包括广告、电商、新闻、教育、科普、以及抖音、YouTube 视频等多个方面,让用户省去剪辑排版的环节,直接用模板就… -
DiffMorpher - AI实现图像间平滑过渡视频工具,一键制作抖音爆火的小女孩的一生~
一、DiffMorpher是什么? DiffMorpher是一项人工智能技术,它利用先进的扩散模型,能够在两张图像之间实现平滑且自然的形变,生成过渡视频。这一技术在图像生成领域展现了突破性的进展,大幅提升了生成视频的质量,使其超越了以往的生成模型。 扩散模型在图像生成质量方面已经取得了令人瞩目的成就,但与生成对抗网络(GAN)相比,扩散模型在进行两个图像样本之间的平滑插值方面存在一些挑战。这是因为… -
WinkStudio - 美图旗下专业视频人像精修AI工具,像修图一样修视频,操作如此简单,支持Windows/MacOS
像修图一样修视频,操作如此简单~ 一、WinkStudio 是什么? 专业的视频人像精修工具,让你的视频创作更高效。全面的美颜美妆等视频人像精修功能,可自由定制美容参数,批量处理视频。搭载强大的AI工具箱,提供画质修复、AI动漫、水印消除等常用功能支持。 “Winkstudio”类似“开拍”,但功能更丰富,定制性更高,添加了“瑕疵消除”、“一键抠像”、“AI 美颜调色”等功能,还具有一些滤镜,例如… -
LeiaPix - 专业2D图片转3D裸眼动画特效AI工具,让您的图片栩栩如生,打破视觉界限!
随着科技的发展,人工智能在图像处理方面展现了强大的能力。LeiaPix Converter就是一个使用AI技术,可以非常容易地将普通2D图片转换成3D动画的免费在线工具。在本文中,我将为您详细介绍如何使用LeiaPix Converter的各项功能,将静态图片转换成栩栩如生的3D动画。 一、LeiaPix 是什么? LeiaPix是一个基于网络的创新人工智能平台,能够将2D照片转3D效果的实用AI… -
MotionShop - 一键替换视频人物AI工具,阿里开源,把视频人物秒变3D角色,平替Wonder Studio
这款AI工具替换成的3D人物能复制原视频中人物的动作,就像镜子一样!这可太强大了,想想都觉得好神奇呀!能想象到,未来某些综艺节目明星塌房的问题,直接换个可爱的吉祥物可能比打马赛克更有看头了对吧。 一、MotionShop 是什么? Motionshop是阿里巴巴智能计算研究院(XR实验室和TIDE三维渲染团队)推出的一个AI角色动画框架,可将视频中的人物角色替换为3D化身,同时不改变视频中的其他场… -
Video Subtitle Remover - 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(…
🎵AI声音工具
-
UVR5 - 最强人声伴奏分离AI工具,最新版v5.6
UVR5是什么? 全称Ultimate Vocal Remover GUI,目前已更新到5.6版本,是一款完全免费的伴奏制作/人声提取工具,比RX9,RipX和SpectraLayers 9都要好,UVR5提取出来的伴奏已经无限接近原版立体声了! 对于音乐爱好者来说,找到一款既简单易用又能提供专业效果的音频处理软件是非常重要的。无论是因为专业软件的操作难度让人望而却步,还是冷门歌曲难以找到合适的伴… -
SONOTELLER - 快速音乐歌词分析风格AI在线工具,音乐人必备神器
无论是音乐爱好者还是专业从业者,他们都能借助SONOTELLER更好地管理自己的音乐库和数据,并进行受众分析。 使用SONOTELLER非常简单,只需前往YouTube,搜索所需歌曲,复制其URL,然后将URL粘贴到SONOTELLER.AI的搜索框中即可获取详细分析结果。 一、SONOTELLER是什么: SONOTELLER是一个在线AI音乐分析工具,专门用于分析YouTube上的音乐和歌词。… -
Suno AI - 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
Fish Speech - 低显存高效语音克隆生成AI工具,免训练,免安装,本地整合包,复制声音如此轻松~
高效的低显存语音克隆工具,媲美GPT-SoVITS! 一、Fish Speech是什么? Fish Speech 是一个全新的文本转语音(TTS)解决方案。作为一个前沿的技术,它提供了高度的自定义和灵活性,允许用户按照他们的个性化需求和期望进行设置。适应多元化环境,可无缝兼容 Linux 和 Windows 操作系统,一站式满足不同用户群体的需求。为了运行此程序,您需要至少 4GB 的 GPU 内… -
NeuCo AI - 全新声音克隆AI工具,无需训练,一键翻唱任意歌手任意歌曲~
🥳💕🎶 NeuCo AI歌手,无需训练、一键翻唱,🌟 只需10秒音频,一键翻唱任意歌手的任意歌曲!相较于传统的ASVC,NeuCoSVC只需要上传一个角色的声音,然后就能模拟这个角色的声音唱歌 NeuCo AI的特色亮点: 🎤 NeuCoSVC是一个虚拟项目,可用于模拟角色的声音唱歌 🎧 建议上传你喜欢的参考音频,然后选择时间长度以及声音去除等操作 🎶 可选择上传B站视频或本地音频,并在上传后选择… -
Mubert - 背景音乐在线生成AI工具,100+风格,海量曲库智能搜索引擎,ProductHunt单日产品榜首~
Mubert曾获得过 ProductHunt 单日产品第一名。 一、Mubert是什么? Mubert是一个由音乐制作人提供支持的平台,帮助创作者和品牌在人工智能的帮助下创作无限的免版税音乐。Mubert的使命是赋予创作者权力并保护他们。创业目的是使创造者经济民主化。 它支持通过文本和图像生成音乐,现在还上线了一个新功能,可以通过一个音频生成类似风格的新音频,是提升音乐生成效率的利器。Mubert… -
Bert-VITS 2 - 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER… -
EmotiVoice易魔声 - 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情…
-
Rope - 强大的一键换脸AI,本地部署,可消除脸部遮挡,飞一般的处理速度~
随着人工智能的发展,现在有着越来越多的ai换脸软件,可以一键将影视片段里的角色换成自己的脸,与喜欢的明星同框,那么免费的Ai换脸软件有哪些呢? 今天给大家推荐一个叫ROPE的换脸软件,ROPE是本地离线安装的换脸软件,无任何功能限制。可以这样说,ROPE目前是PC端最好的换脸软件,没有之一。 如果说目前pc端AI视频换脸软件哪个最好,可以这样说,rope当之无愧可以得到第一名,可以同时替换多个人脸… -
LightFlow - AI绘画超强作弊神器!一键复用工作流,Stable Diffusion革命性插件,腾讯出品~
一、LightFlow是什么? LightFlow可以将一张图像的生成参数和相关设置保存为文件,这样无论是复用图像生成信息还是分享给别人都非常方便,可以有效提升我们的出图效率。 它可以帮助你一键保存所有工作流数据(包括垫图和其他第三方插件设置),下次使用只需拖入.flow文件,就能快速复现整个工作流,就像使用Photoshop的PSD文件那样方便。 二、LightFlow的网址: 1、Github… -
Bark - 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark… -
Vid2Densepose + MagicAnimate - 一键AI本地整合包,视频生成骨骼动画,一张照片就能生成跳舞视频,抖音小姐姐要失业?
Vid2DensePose 将你的视频转换为 Densepose 序列,并在 MagicAnimate 上使用它,MagicAnimate目前依赖DensePose作为约束,如果想尝试转换自己的视频,需要先生成DensePose序列。我们将Vid2Densepose + MagicAnimate 制作成一键启动包,点击即可使用, 一、Vid2Densepose 1、Vid2Densepose是什么… -
Bert-VITS 2 - 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER… -
AnyText - 精准控制中文汉字的AI绘图工具,动动嘴皮子,就能出电商大促海报,一键整合包,开箱即用,阿里开源
随着人工智能技术的不断发展,视觉文字生成与编辑成为了一个备受关注的领域。AnyText作为一款多语言视觉文字生成与编辑工具,具有强大的功能和广泛的应用场景。 一、AnyText是什么? AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素的扩散管线:辅助潜在模块和文本嵌入模块。前者使用文本字… -
Genie - 史诗级文生高精度3D模型AI工具,Luma AI旗下产品,免费在线使用~
3D版Midjourney来了?Luma AI发布Genie,生成手办只需10秒 随着生成式 AI 的浪潮席卷而来,科技公司都在冲击 AIGC 的下一个突破口 —— 3D 生成。目前,文生 3D 在学术界取得了许多新突破。在产业界,无论是像英伟达这样的行业巨头,还是像 Stability AI 这样的中坚力量,都推出了自己的文生 3D 工具。虽然 3D 生成领域一直「卷」到飞起,但是好像一直没有出… -
AudioCraft - 顶级音乐生成AI工具,来自Meta AI免费开源,音乐效果媲美音乐家作品~
一、AudioCraft是什么? AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求:音乐、音效以及原始音频信号训练后的压缩。 它具有最先进的EnCodec音频压缩器/标记器,沿着MusicGen,一个简单可控的音乐生成LM,具有文本和旋律调节。 素材训练使用2万小时的授权音乐来训练MusicGen。 二、AudioCraft的项目地址: … -
DeepSeek - AI界拼多多模型,新年重磅炸弹横空出世,媲美ChatGPT o1,支持多模态理解和图像生成,幻方量化旗下深度求索开源项目,本地一键使用
在经历了一周的激烈竞争后,OpenAI于今天发布了新模型 o3-mini。显然,DeepSeek的崛起使得OpenAI感受到了压力,其在美国App Store免费榜单的登顶无疑是一个信号。与此同时,ChatGPT首次向所有用户免费开放推理模型,ChatGPT Pro用户将享受无限制访问,而Plus和Team用户的消息发送限制也从原来的o1-mini的每天50条提升至o3-mini的每天150条。 … -
OMS-Diffusion - AI换装升级版来了,虚拟试衣间,本地整合包,免训练,免安装
OMS-Diffusion 是OOTDiffusion的分支版本,与原来的 OOTDiffusion 训练两个 Unet 不同,OMS-Diffusion 只训练一个 Unet,这意味着一台 24GB 内存的机器(3090 或 4090)就足够了。 如今已有很多关于虚拟试穿的项目,如谷歌的Tryon Diffusion, 阿里的Outfit Anyone, 亚马的Diffuse to Choose… -
EMO - 震撼!阿里巴巴人物肖像图片转动态视频AI工具(即将开源)
阿里巴巴集团智能计算研究院的研究员田林瑞、王奇、张邦和薄烈峰开发了一种人工智能系统,可以让人工智能阅读选定的文本,并根据阅读的文本平滑地改变面部表情。EMO推出。 我们提出了 EMO,一种富有表现力的音频驱动的肖像视频生成框架。输入单个参考图像和声音音频,例如说话和唱歌,我们的方法可以生成具有表情丰富的面部表情和各种头部姿势的声音头像视频,同时,我们可以根据输入视频的长度生成任意持续时间的视频。 … -
LeiaPix - 专业2D图片转3D裸眼动画特效AI工具,让您的图片栩栩如生,打破视觉界限!
随着科技的发展,人工智能在图像处理方面展现了强大的能力。LeiaPix Converter就是一个使用AI技术,可以非常容易地将普通2D图片转换成3D动画的免费在线工具。在本文中,我将为您详细介绍如何使用LeiaPix Converter的各项功能,将静态图片转换成栩栩如生的3D动画。 一、LeiaPix 是什么? LeiaPix是一个基于网络的创新人工智能平台,能够将2D照片转3D效果的实用AI… -
漫画直出,然后上色 - ComfyUI 工作流分享
你可以使用这个工作流制作一个动漫漫画原本,并用它来上色,具有故事性和人物风格。 工作流下载: https://www.lightflow.ai/detail/man-hua-zhi-chu-ran-hou-shang-se-you-like 相关资源: 底模+lora:https://pan.quark.cn/s/29f03bcf2fe2 如何使用? 先将cn里的图去掉,并去掉下面的上色提示词 将… -
Dreamina - 字节旗下AIGC创作工具,首个中文生成视频的AI工具,用简单的文案,创作精彩的作品
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐) 一、Dreamina是什么? Dreamina是由字节跳动抖音旗下的剪映推出的一款AI图片创作和绘画工具,专门设计用于激发艺术创意和提升绘画体验。 我们提供多样化的功能,包括文字绘图、扩图、局部重绘和图片灵感生成,让您的艺术创作更加多元和精准。 在Dreamina,您可以使用自然语言描述您想要的图片,让先进… -
SONOTELLER - 快速音乐歌词分析风格AI在线工具,音乐人必备神器
无论是音乐爱好者还是专业从业者,他们都能借助SONOTELLER更好地管理自己的音乐库和数据,并进行受众分析。 使用SONOTELLER非常简单,只需前往YouTube,搜索所需歌曲,复制其URL,然后将URL粘贴到SONOTELLER.AI的搜索框中即可获取详细分析结果。 一、SONOTELLER是什么: SONOTELLER是一个在线AI音乐分析工具,专门用于分析YouTube上的音乐和歌词。… -
FaceFusion - 重磅更新,最强AI换脸汉化软化,去遮挡,高清化,卡通脸一键替换,本地整合包,无需部署,无需训练,免费使用!
一个替代Roop的开源软件,通过AI换脸技术实现简单的面部替换操作。Roop项目由于团队成员不当使用而停更,但其中一位作者开源了新项目FaceFusion,在GitHub上已经获得超过5000星的关注。 一、FaceFusion是什么? Facefusion是一款最新的开源AI视频/图片换脸项目。项目官方介绍只有一句话,下一代换脸器和增强器。采用了全新的界面设计,可以像Stable Diffuis…