Ai开源项目 - 第3页 - AI录-AIGC目录-AIGC导航

Ai开源项目 Media2Face

一款革命性的语音面部动画生成工具，借助 Media2Face，现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

一个专门为DuckDB数据库设计的文本到SQL的模型，你可以使用自然语言说描述你的需求，它会自动转换成SQL代码。

一个视频搜索和流媒体代理工具，能让您在 ChatGPT 中与您的视频库聊天并观看视频流。

FunASR是一个基础语音识别工具包，提供多种功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、…

基于大规模扩散的高保真通用图像恢复模型，SupIR能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。

一种基于扩散的图像修复模型，主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节，适用于在线购物等虚拟试穿场景中的图像修复任务。

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

一个为黑白图像上色的魔搭模型，通过双解码器实现逼真的图像着色，输入一张黑白图像，实现端到端的全图上色，返回上色…

网易有道一个开源的本地知识库问答系统，旨在支持多种文件格式和数据库，允许离线安装和使用。，QAnything官…