AI工具

AI-Media2Doc:开源 AI 视频转图文神器,秒产小红书与公众号多风格内容

AI-Media2Doc是一款基于 AI 大模型的开源 Web 工具,能够一键将视频和音频内容转化为多种文档风格,包括小红书推文、微信公众号文章、知识笔记、思维导图和视频字幕等,无需登录注册即可使用,并支持前端 ffmpeg wasm 处理、Docker 一键部署及自定义 Prompt 等功能,同时保障隐私安全与本地部署体验,极大降低 AI 内容创作门槛。

Prompt Optimizer:多端开源AI提示词优化器,轻松激活小模型潜力

Prompt Optimizer 是一款开源、跨平台的 AI 提示词优化工具,支持 Web、桌面、Chrome 插件与 Docker 部署,为开发者与创作者提供一键优化、对比测试及多模型集成等能力,提升AI输出质量;它通过结构化提示激活小模型潜力、保障生产稳定性,并在诗歌等创意场景中帮助用户精确表达灵感。项目在 GitHub 收获 1 万余颗星标与 1 200 + 分叉,社区活跃。

Google AI Edge Gallery:在手机端离线体验生成式 AI

Google AI Edge Gallery 由 Google AI Edge 团队开源的在手机端离线体验生成式 AI,主打“下载即用、离线运行”的生成式 AI 体验,源代码托管在 GitHub 并已收获上万颗 Star。安装 APK 后,所有推理计算均在本地完成,无需持续联网。当前支持 Android,iOS 版本处于准备阶段。

MusicGPT - 免费额度 - AI 音乐生成与编辑平台

在主页输入一句话(例如“lo-fi chill beat with rain”),几十秒就能得到一首 1~2 分钟左右的完整曲目,含歌词、伴奏、鼓点和简单音效。目前每天有 2 首免费额度,超出后需订阅。

Abogen 强大的文本转语音工具

Abogen 是一个强大的文本转语音工具,能够将 ePub、PDF 或文本文件快速转换为高质量音频,并生成同步字幕。它适用于制作有声书、为 Instagram、YouTube、TikTok 等平台创建配音,或任何需要自然语音的文本转语音项目。Abogen 使用 Kokoro-82M 模型,提供高品质的语音合成。

PoPo开源AI工具:用自然语言生成MMD角色动作与表情

PoPo 是一个开源 AI 工具,允许用户通过自然语言控制 MikuMikuDance(MMD)角色的骨骼动作和面部表情。你只需输入文字描述,PoPo 就能生成精确的 MPL(MMD Pose Language)脚本,驱动骨骼动画和角色表情的实时渲染 。