山鲸AI
无数可心AI Tool,
助你总有新发现。
🔥热门工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
SDXL-Light – 目前最快文生图AI模型,让AI出图速度提升 10 倍!
生成式人工智能技术已成为业界的焦点,它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像,可能需要5秒钟,并且要多次调用庞大的神经网络。因此,研究的热点是如何在保证图像质量的同时,加快图像的生成速度。 一、SDXL-Lightning是什么? SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-… -
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
TripoSR – 快速单图生成3D模型,1秒完成,本地部署包,Stability AI与华人团队联合开源
TripoSR 的开发灵感来源于LRM(Large Reconstruction Models)的最新研究成果,即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术,旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求,通过快速响应输出,实现3D模型细节的精确可视化。 在性能测试中,TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成… -
ChatGPT Academic – 中科院学术专业版ChatGPT,一键搞定所有论文!助力科研创新,开启智能学术之旅~
自ChatGPT Academic在Github推出已有一段时间,已收获无数网友点赞。那什么是ChatGPT Academic,如何在自己电脑上部署呢?今天,就让小编带着大家一探究竟! 一、ChatGPT Academic是什么? ChatGPT Academic也被称为「中科院学术专业版 ChatGPT」,是中科院计算机科学与技术研究所研发的一款人工智能学术助手,旨在为科研人员提供高效、便捷的学… -
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够…
🥕最新收录
-
PurePhotos – 超强在线抠图工具,内置图像校正,可输出PSD,每月100张免费额度!推荐五颗星⭐️⭐️⭐️⭐️⭐️
说到抠图,我想,每个人第一个想到的就是PS!(谁敢说不是) PS的强大功能,真的一骑绝尘,不可否认,PS中可以用来作为抠图的工具也是很多,套索,魔棒,快速选择,调整边缘(选择并遮住),色彩范围,钢笔,等等。 那么,除了PS,还有没有什么好用的? 一、PurePhotos 是什么? Purephotos是一个图片去背景线上网站,你只需要通过浏览器上传你想要处理的图片,可以自动删除相片上的背景,而且有… -
remove.bg – 专业图片背景移除在线工具,自动抠图,3秒完成!可免费使用~
近几年remove.bg一度刷屏互联网行业,其号称只需要上传一张带有人像的照片,它就会帮你自动抠掉背景,全自动、5秒完成。可以起到辅助作用,节省了大量人工操作。 一、remove.bg 是什么? Remove.bg 是一款功能强大的在线抠图工具,将想要抠去背景的图片上传,网站就会自动抠去背景,整个过程完全不需要手动操作,简单易上手,可以弥补 Midjourney 和 Stable diffusio… -
InsightFaceSwap – 超快速精准换脸AI工具,效果恐怖如斯,实现你的一切童年幻想!Midjourney最强伴侣插件~
对于很多小伙伴来说,都使用 Midjourney 制作过个人头像,这也是目前变现方式之一。但在生成头像的时候往往难以控制,做到和照片“很像”。InsightFaceSwap 这款插件,它支持精准替换人物面貌,而不改变图片中的其他内容,可以更好地帮助你解决这个问题。 一、InsightFaceSwap 是什么? InsightFaceSwap 是一款基于深度学习的人脸交换工具,它可以将两张人脸图片进… -
D-ID – 全球最专业最全面的数字人视频生成AI工具,真人口播,三分钟打造超炫虚拟数字人,开启逼真数字人新时代~
随着人工智能技术的不断发展,我们逐渐迈入了一个全新的数字时代。在这个时代,人们可以通过创造性的方式与虚拟现实相结合,创造出惊人的数字人物。其中,Creative Reality Studio (D-ID) 是一家提供 AI 拟真人视频产品服务和开发的公司,其独特的技术让用户能够以惊人逼真的方式与数字人物进行互动。本文将介绍D-ID的技术原理和使用技巧,带您领略数字时代的无限可能性。 一、D-ID … -
GitLab Duo Chat – 人工智能编程助理,GitLab旗下最新产品,开发者新宠儿,AI时代利器,助力程序员提高开发效率
一、GitLab Duo Chat是什么? Duo Chat 是源代码管理平台 GitLab 推出的一款集成了人工智能(AI)的对话式编程助手,旨在通过自然语言交互为工程和非工程用户提供实时指导。该AI编程工具支持整个软件开发生命周期,帮助团队提高代码理解速度、增强协作能力,并快速掌握 GitLab 的使用。Duo Chat 能够解释代码、重构代码、生成测试,以及提供代码建议,从而提升开发效率和代… -
LeiaPix – 专业2D图片转3D裸眼动画特效AI工具,让您的图片栩栩如生,打破视觉界限!
随着科技的发展,人工智能在图像处理方面展现了强大的能力。LeiaPix Converter就是一个使用AI技术,可以非常容易地将普通2D图片转换成3D动画的免费在线工具。在本文中,我将为您详细介绍如何使用LeiaPix Converter的各项功能,将静态图片转换成栩栩如生的3D动画。 一、LeiaPix 是什么? LeiaPix是一个基于网络的创新人工智能平台,能够将2D照片转3D效果的实用AI…
-
Ideogram – 比Midjourney更好用的AI绘画工具,能准确生成文本内容!轻松搞定LOGO,无需魔法,免费使用~
一家名为Ideogram的AI生成式图像创业公司宣布获得了由a16z和Index Ventures领投的1650万美元种子轮融资。 一直以来,Midjourney 稳坐AIGC文生图的王座,少有威胁,直到这家公司的出现。 8 月 23 日,生成式人工智能创业公司 Ideogram AI 正式官宣:「我们正在开发最先进的人工智能工具,使创意表达变得更容易、更有趣、更高效。」 一、Ideogram是什… -
Tracejourney – 拯救Midjourney渣图画质,抠图、放大、转矢量统统不在话下,Midjourney最佳伴侣~
你是不是经常为了做IP而苦恼,想要把图片变成矢量图却不知道怎么操作? 别担心,推荐一款神奇的工具:Tracejourney 一、Tracejourney 是什么? Tracejourney Bot 是一款基于 Discord 的图像处理工具,可以实现图像转 SVG 矢量文件、抠图背景、放大、提取描述词、格式转换以及亮度和对比度调节。它可以在我们放大 Midjourney 图像的时候弹出功能框,点击… -
Pixian AI – AI智能驱动的在线一键抠图工具,支持批量~
一、Pixian AI是什么? Pixian.AI 提供了一种简单且用户友好的解决方案,用于从图像中删除背景,无需注册或订阅的麻烦。 用户可以轻松上传图像,并让 Pixian.AI 的先进算法对其进行处理,创建具有透明或选定颜色背景的图像。 Pixian.AI 非常适合多种用途,包括电子商务、营销材料、社交媒体帖子等,它简化了图像编辑任务,并提供了额外的功能,例如为开发人员提供 API 集成、与竞… -
Clarity AI – 超高质量图像无损放大/细节增强AI工具,Magnific最佳平替,免费开源~
Clarity AI是一款利用最新AI技术的高分辨率图片放大增强工具,它能够增强图片细节并提供超高分辨率,适用于多种场景如风景、肖像、插图、动漫、室内设计等。不仅是一个高质量的图片放大工具,而且还是一个开源项目,允许用户自由使用和修改其代码。 一、Clarity AI 是什么? Clarity Upscaler是一款集成了最新人工智能技术的图像放大工具,其GitHub页面已公开。该工具能够将低分辨… -
Image to Line Drawings – 图片一键转素描线稿AI工具
一、Image to Line Drawings是什么? 在传统艺术学习过程中,绘制一幅素描作品往往需要耗费大量时间和精力。然而,在AI的帮助下,这一过程可以被大幅简化。本文介绍的Image to Line Drawings整合包,便是这样一个工具,它能够帮助用户迅速将普通图片转换成素描风格的线条图。 二、Image to Line Drawing如何使用? 为了让更多用户能够轻松体验这一技术,我… -
AnyText – 精准控制中文汉字的AI绘图工具,动动嘴皮子,就能出电商大促海报,一键整合包,开箱即用,阿里开源
随着人工智能技术的不断发展,视觉文字生成与编辑成为了一个备受关注的领域。AnyText作为一款多语言视觉文字生成与编辑工具,具有强大的功能和广泛的应用场景。 一、AnyText是什么? AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素的扩散管线:辅助潜在模块和文本嵌入模块。前者使用文本字… -
RunDiffusion – 托管式SD绘画聚合云平台,OpenAI旗下产品, 整合所有Stable Diffusion绘画工具,不用再到处找云端了~
RunDiffusion 是一个专注于 SD 及开源生态的 AI 工具平台,提供 Stable Diffuison WebUI / ComfyUI / WebUI Forge / Fooocus / SD.next 等多款 SD 操作界面的线上使用,并拥有相对完整的插件配置。如果你是非 N 卡用户,或者因为电脑显存不足导致自己无法顺利使用 SD 软件,那么 RunDiffusion 是一个不错的选… -
Fooocus 2.0 中文版 – 傻瓜式AI绘画神器,超180种预置风格,体验直追Midjourney,三天登顶GitHub热榜!
玩AI画画,现在终于不用担心被老黄刀法“背刺”了! 只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。 一、Fooocus是什么? Fooocus是一款离线、开源且免费的AI绘画软件,仅需4G显存即可使用SDXL模型。通过重新思考Stable Diffusion和Midjourney的设计理念,Fooocus简化了安装过程,降低了使用门槛,让更多人能够体…
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项… -
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L… -
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(… -
VideoReTalking – 虚拟数字人视频AI工具整合包,同步音频嘴型/面部表情,腾讯出品~
你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。 一、什么是VideoReTalking? VideoReTalking,这是一种新的AI系统,可以根据输入音频编辑现实世界中头部说话视频的面孔,即使具有不同的情绪,… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold… -
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf…
🎵AI声音工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频… -
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark… -
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能… -
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情… -
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER… -
AudioCraft – 顶级音乐生成AI工具,来自Meta AI免费开源,音乐效果媲美音乐家作品~
一、AudioCraft是什么? AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求:音乐、音效以及原始音频信号训练后的压缩。 它具有最先进的EnCodec音频压缩器/标记器,沿着MusicGen,一个简单可控的音乐生成LM,具有文本和旋律调节。 素材训练使用2万小时的授权音乐来训练MusicGen。 二、AudioCraft的项目地址: … -
NeuCo AI – 全新声音克隆AI工具,无需训练,一键翻唱任意歌手任意歌曲~
🥳💕🎶 NeuCo AI歌手,无需训练、一键翻唱,🌟 只需10秒音频,一键翻唱任意歌手的任意歌曲!相较于传统的ASVC,NeuCoSVC只需要上传一个角色的声音,然后就能模拟这个角色的声音唱歌 NeuCo AI的特色亮点: 🎤 NeuCoSVC是一个虚拟项目,可用于模拟角色的声音唱歌 🎧 建议上传你喜欢的参考音频,然后选择时间长度以及声音去除等操作 🎶 可选择上传B站视频或本地音频,并在上传后选择…
-
NVIDIA Chat with RTX 一键部署私密的AI聊天机器人
真香!NVIDIA Chat with RTX,显卡原生加速GPT!一键部署私密的AI聊天机器人! 查看实际演示效果 什么是Chat with RTX? NVIDIA Chat with RTX是NVIDIA推出的一款本地部署的AI聊天机器人,专门为Windows个人电脑设计。它使用了类似ChatGPT的大型语言模型和检索增强生成(RAG)技术,允许用户个性化连接到自己内容的AI聊天机器人。Cha… -
Meshy – 全球最顶尖文本生成3D模型AI神器,没有之一,打开AI创作的无限可能,探索未知领域!
不仅是工具,Meshy为你打开AI在3D创作中的无限可能,探索未知领域~ 一、Meshy 是什么? Meshy 是一款创建 3D 游戏资产的 AI 工具,目标是利用生成式 AI 实现整个 3D 工作流的自动化。目前它的主要功能有 3 种:文本生成贴图纹理(AI Texturing)、文本生成 3D 模型(Text to 3D)以及图片生成 3D 模型(Image to 3D)。 它可以通过文本或图… -
Image to Line Drawings – 图片一键转素描线稿AI工具
一、Image to Line Drawings是什么? 在传统艺术学习过程中,绘制一幅素描作品往往需要耗费大量时间和精力。然而,在AI的帮助下,这一过程可以被大幅简化。本文介绍的Image to Line Drawings整合包,便是这样一个工具,它能够帮助用户迅速将普通图片转换成素描风格的线条图。 二、Image to Line Drawing如何使用? 为了让更多用户能够轻松体验这一技术,我… -
DemoFusion – 专业优化放大AI图像/细节增强高清神器,无需$$$
DemoFusion 是一款能够显著提高图像分辨率的增强工具。它允许用户将图像的分辨率提升至原来的4倍、16倍甚至更高,不仅增强图片的清晰度,还能够细化图片中的小细节,如纹理和边缘,创造出更为自然和逼真的视觉效果。DemoFusion 与基于潜在扩散模型(LDM)的多种应用无缝集成,例如ControlNet,同时还能放大真实世界中拍摄的图像。 一、DemoFusion的技术剖析: 使用生… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold… -
LightFlow – AI绘画超强作弊神器!一键复用工作流,Stable Diffusion革命性插件,腾讯出品~
一、LightFlow是什么? LightFlow可以将一张图像的生成参数和相关设置保存为文件,这样无论是复用图像生成信息还是分享给别人都非常方便,可以有效提升我们的出图效率。 它可以帮助你一键保存所有工作流数据(包括垫图和其他第三方插件设置),下次使用只需拖入.flow文件,就能快速复现整个工作流,就像使用Photoshop的PSD文件那样方便。 二、LightFlow的网址: 1、Github… -
Rope – 强大的一键换脸AI,本地部署,可消除脸部遮挡,飞一般的处理速度~
随着人工智能的发展,现在有着越来越多的ai换脸软件,可以一键将影视片段里的角色换成自己的脸,与喜欢的明星同框,那么免费的Ai换脸软件有哪些呢? 今天给大家推荐一个叫ROPE的换脸软件,ROPE是本地离线安装的换脸软件,无任何功能限制。可以这样说,ROPE目前是PC端最好的换脸软件,没有之一。 如果说目前pc端AI视频换脸软件哪个最好,可以这样说,rope当之无愧可以得到第一名,可以同时替换多个人脸… -
Fooocus 2.0 中文版 – 傻瓜式AI绘画神器,超180种预置风格,体验直追Midjourney,三天登顶GitHub热榜!
玩AI画画,现在终于不用担心被老黄刀法“背刺”了! 只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。 一、Fooocus是什么? Fooocus是一款离线、开源且免费的AI绘画软件,仅需4G显存即可使用SDXL模型。通过重新思考Stable Diffusion和Midjourney的设计理念,Fooocus简化了安装过程,降低了使用门槛,让更多人能够体… -
Pika- 火爆出圈的视频生成AI工具,海外独角兽项目,一度刷屏国内外社交平台
每个人都能成为多模态梦想的导演,就像《盗梦空间》中的建筑师一样。 一、Pika是什么? Pika是热门的人工智能初创公司Pika Labs推出的AI视频生成和编辑工具,该工具可以将任何创意转化为视频,用户只需输入文字或图像,即可快速生成3D动画、动漫、卡通、电影等风格的视频。该AI视频生成工具最早于2023年4月下旬推出测试版,累计已经超过50万名早期用户使用,每周都在生成数百万个视频。不过,目前… -
OpenVoice – 专业即时语音克隆复制AI工具,免训练,免部署,一键使用
多功能的即时语音克隆AI工具,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。OpenVoice还可以针对海量说话人训练集中未包含的语言实现零样本跨语言语音克隆。OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。 一、OpenV… -
SadTalker – 图片配合音频秒变声音视频,头部、嘴型超自然,中英双语全能,还会唱歌~
单个肖像图像 🙎♂️ + 音频 🎤 = 头部说话视频🎞 一、SadTalker是什么? SadTalker模型是一个使用图片与音频文件自动合成人物说话动画的开源模型,我们自己给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴,眨眼,移动头部等动作。SadTalker,它从音频中生成 3DMM 的 3D 运动系数(头部姿势、表情),并隐式调制一种新颖的 3D… -
TripoSR – 快速单图生成3D模型,1秒完成,本地部署包,Stability AI与华人团队联合开源
TripoSR 的开发灵感来源于LRM(Large Reconstruction Models)的最新研究成果,即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术,旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求,通过快速响应输出,实现3D模型细节的精确可视化。 在性能测试中,TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成… -
Kimi AI – 首个支持200万字上下文的AI对话模型,Moonshot AI出品,月之暗面,终于有了光~
一个简历,一般500~800字,按你1000字算,一次性能吃进去2000个简历,现在你就是HR之神。 一、什么是Kimi AI? Kimi AI又称Kimi Chat,是月之暗面基于自研千亿参数大模型打造的对话式AI 助手产品。 2023 年10 月发布时支持约20 万汉字无损上下文输入,预计今年将开启商业化模式。 Kimi Chat是月之暗面Moonshot AI公司推出的AI对话助手,该产品在… -
Dreamina – 字节旗下AIGC创作工具,首个中文生成视频的AI工具,用简单的文案,创作精彩的作品
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐) 一、Dreamina是什么? Dreamina是由字节跳动抖音旗下的剪映推出的一款AI图片创作和绘画工具,专门设计用于激发艺术创意和提升绘画体验。 我们提供多样化的功能,包括文字绘图、扩图、局部重绘和图片灵感生成,让您的艺术创作更加多元和精准。 在Dreamina,您可以使用自然语言描述您想要的图片,让先进… -
Gamma – 由AI驱动呈现优秀创意的PPT
Gamma: AI for presenting ideas, beautifully 一、Gamma是什么? Gamma是一款由AI驱动呈现优秀的有创意的产品,它是幻灯片的替代品 - 一种快速、简单的方式来分享和展示您的工作。 创建易于实时讨论或异步共享的引人入胜的演示文稿、备忘录、简报和文档。全部在您的浏览器中,无需下载或安装。 开始撰写吧!无需任何格式设置和设计工作,即可创造精美、引人入胜的… -
Magnific AI – 专业级AI图像画质细节增强/无损放大AI神器,AI生图“精修师”
给跪了,新工具 Magnific 誓成 AI 生图“精修师”:小细节、高分辨率一拉即成! 一、Magnific AI是什么? Magnific AI是一个功能和算法非常强大的AI图像放大变高清的工具,支持将图片最高放大到10000×10000像素(10K分辨率)。Magnific AI转换放大后的图片拥有高质量的细节,适合用于如高分辨率的打印和图片处理。该AI扩图工具虽然需要付费使用,但如果你对图…