开源!:国产AI全能王火了!一个项目搞定YOLO v8训练、ChatGPT集成、数字人生成、语音识别、OCR...多模态!

作者:红鱼AI 发布时间: 2025-12-24 阅读量:3 评论数:0

开源项目地址:

https://gitee.com/dromara/wgai

https://github.com/dromara/wgai

https://gitcode.com/dromara/wgai


嗨,大家好,我是红鱼AI!今天要给大家安利一个真正国货之光的开源AI平台——WGAI!

最近是不是又被AI的各种黑科技刷屏了?什么GPT-5、Sora、Claude 3...看着别人在AI赛道上狂奔,咱们是不是也有点心痒痒?想搞点AI应用,结果发现:

  • 开个服务器就要几千块

  • 训练模型要GPU,还要买显卡

  • API接口按次收费,钱包在哭泣

  • 最关键的——很多核心技术在国外,想用还得担心被"卡脖子"

别慌!今天给你们带来的这个项目,绝对能让你的AI梦想落地生根,关键是——完全免费,开源,而且能离线部署!

一、先说说为啥这个项目这么牛

1️⃣ 开箱即用,小白也能玩转AI

以前训练个模型,得学Python、装TensorFlow、配CUDA...一堆配置能把你劝退。现在WGAI把一切都封装好了,你只需要:

  • 准备数据

  • 在线标注

  • 一键训练

  • 开箱使用

就这么简单!而且支持中文界面,再也不用啃英文文档了~

2️⃣ 训练与识别分离,省钱又省心

很多AI平台训练和识别是绑在一起的,训练的时候服务器内存直接爆炸。WGAI把这两个过程拆开了:

  • 训练阶段

    :可以集中资源,训练完把模型导出

  • 识别阶段

    :把模型部署到任何地方,CPU也能跑起来

这意味着你可以训练一次,到处部署!甚至可以训练完后,部署到便宜的边缘设备上~

3️⃣ 支持国产化,安全可控

支持国产化数据库和服务器,这是真正的"国产AI"!政府、企业、教育机构都能放心用~

4️⃣ 功能丰富到离谱

看看这个清单,我都惊呆了:

  • ✅ 在线训练系统(YOLO v3/v5/v8全支持)

  • ✅ 图像识别(目标检测、分类)

  • ✅ 视频识别(实时流媒体)

  • ✅ 语音识别(本地部署,支持热词)

  • ✅ OCR识别(95%高精度)

  • ✅ 车牌识别(蓝牌绿牌黄牌白牌全拿下)

  • ✅ ChatGPT集成(支持多模型)

  • ✅ 轻量级语言模型训练

  • ✅ 数字人技术(语音克隆、TTS)

  • ✅ 智能问答系统

  • ✅ 第三方API接口

这哪是一个项目,简直就是AI全家桶啊!


二、在线体验,眼见为实

怕是吹牛?先在线体验再说!

测试地址:http://1.95.152.91:9999/

账号:wgai
密码:wgai@2024

友情提示:测试服务器是作者掏腰包买的,体验的时候手下留情,别搞崩溃了😂


三、手把手教你部署(30分钟搞定)

好了,废话不多说,直接上干货!我整理了三种部署方式,根据你的情况选一个就行~

方式一:Docker一键部署(推荐新手)

第一步:安装Docker和Docker Compose

如果你是Linux系统,直接:

curl -fsSL https://get.docker.com | shcurl -L "https://github.com/docker/compose/releases/latest/download/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-composechmod +x /usr/local/bin/docker-compose

Windows和Mac用户就下载Docker Desktop安装即可~

第二步:下载项目代码

git clone https://gitee.com/dromara/wgai.gitcd wgai

第三步:一键启动

docker-compose up -d

等个几分钟,打开浏览器访问:http://localhost:8080

搞定!就这么简单~

第四步:初始化数据库

项目根目录下的 db 文件夹里有SQL脚本,导入到MySQL就行:

  • java_ai_gitee.sql

     - 主数据库

  • tables_nacos.sql

     - Nacos配置中心(如果用微服务版)

  • tables_xxl_job.sql

     - 任务调度(可选)


方式二:手动部署(适合想自定义配置的)

前端部署(Vue)

# 1. 进入前端目录cd wgai-module-system/wgai-system-start/src/main/resources# 2. 安装依赖npm run install# 3. 启动开发模式npm run serve# 4. 打包生产环境npm run build

后端部署(Spring Boot)

  1. 导入依赖包

有些本地的jar包在项目目录下,需要手动导入到你的Maven本地仓库:

# 需要导入的jar包位置wgai-module-system\wgai-system-start\src\main\resourceswgai-module-system\wgai-system-biz\src\main\resources

导入命令示例:

mvn install:install-file \  -Dfile=path/to/your.jar \  -DgroupId=com.wgai \  -DartifactId=your-artifact \  -Dversion=1.0.0 \  -Dpackaging=jar
  1. 修改配置文件

找到 application.yml,修改数据库和Redis连接信息:

spring:  datasource:    url: jdbc:mysql://localhost:3306/wgai?useUnicode=true&characterEncoding=utf8    username: root    password: yourpassword  redis:    host: localhost    port: 6379
  1. 启动后端

cd wgai-module-system/wgai-system-startmvn clean packagejava -jar target/wgai-system-start.jar

搞定!访问 http://localhost:8080 即可~


方式三:微服务部署(适合企业级应用)

如果你需要大规模部署,可以参考 wgai-server-cloud 目录下的微服务架构:

cd wgai-server-clouddocker-compose up -d

微服务版本包含:

  • Nacos配置中心

  • Gateway网关

  • Sentinel流量控制

  • XXL-Job任务调度

  • Monitor监控


四、核心功能实战演示

1️⃣ 训练自己的YOLO模型

假设你想训练一个检测"口罩"的模型:

步骤1:收集数据

找一些有人戴口罩和没戴口罩的图片,大概几百张就够(数据越多效果越好)。

步骤2:在线标注

登录系统后,进入"在线标注"页面,上传图片:

  • 画框标记口罩位置

  • 设置标签为"mask"

  • 标注完成后保存

步骤3:开始训练

进入"模型训练"页面:

  • 选择训练任务

  • 选择YOLO模型(支持v3/v5/v8)

  • 设置训练参数(迭代次数、学习率等)

  • 点击"开始训练"

等个几十分钟(取决于数据量),训练完成!

步骤4:模型部署

训练完成后,模型会自动保存到模型库,可以:

  • 直接在平台使用

  • 下载模型文件到本地

  • 部署到边缘设备

步骤5:实时识别

上传一张带人脸的图片或视频,系统会自动识别是否佩戴口罩,并框出来!

演示视频:

https://www.bilibili.com/video/BV13C9BYiEFS/?t=38.4


2️⃣ 车牌识别实战

这个功能超级实用,可以直接用在停车场、小区管理等场景!

配置步骤:

  1. 进入"车牌识别"模块

  2. 上传包含车牌的图片或视频

  3. 系统自动识别,支持:

    • 蓝牌(普通车)

    • 绿牌(新能源车)

    • 黄牌(大型车)

    • 白牌(特殊车辆)

识别速度快到飞起,而且本地部署,数据安全~


3️⃣ OCR文字提取

想从图片中提取文字?WGAI的OCR识别率高达95%!

使用方法:

  1. 上传图片或粘贴图片链接

  2. 系统自动提取文字

  3. 可以导出为TXT、Excel等格式

适合处理:发票、合同、证件扫描件等~


4️⃣ 语音识别

配置热词:

进入"语音识别"模块,可以配置热词(比如公司名称、专业术语),提高识别准确率!

功能亮点:

  • 本地部署,不依赖第三方

  • 支持多种音频格式

  • 可以实时识别或上传音频文件


5️⃣ 数字人训练(黑科技!)

这个功能真的太酷了!你可以:

  • 训练自己的数字人形象

  • 语音克隆(录制一段语音,就能模仿你的声音)

  • TTS文本转语音

  • 实时流媒体数字人

演示视频:

https://img.nj-kj.com/zhangwei_1745562613859_1745465917540_1745567724504.mp4

想象一下:

  • 企业宣传视频用数字人主播

  • 教育培训用AI老师

  • 客服用数字人代替真人

是不是打开了新世界的大门?


6️⃣ ChatGPT集成

WGAI支持接入多种大语言模型:

  • OpenAI ChatGPT

  • 国产大模型(文心一言、通义千问等)

  • 本地部署的开源模型(LLaMA、ChatGLM等)

配置方法:

  1. 获取API Key

  2. 在系统配置中填入Key

  3. 选择使用的模型

  4. 开始聊天!

系统还支持:

  • 上下文记忆

  • 多轮对话

  • API接口调用(可以集成到你的业务系统)


7️⃣ 第三方系统集成

这是企业最关心的功能!WGAI提供了完善的API接口,可以无缝集成到你的业务系统:

常用接口:

  • 图像识别接口

  • 视频流识别接口

  • 报警订阅接口

  • 模型管理接口

  • 知识库管理接口

使用示例:

// 调用图像识别接口POST /api/recognition/image{  "imageUrl": "http://example.com/image.jpg",  "modelId": "your-model-id"}// 返回结果{  "code": 200,  "data": {    "objects": [      {        "label": "person",        "confidence": 0.95,        "bbox": [100, 200, 300, 400]      }    ]  }}

五、项目架构解析(给技术人的)

如果你是开发者,肯定关心项目的技术栈:

前端技术:

  • Vue.js

  • Element UI

  • Axios

  • ...

后端技术:

  • Spring Boot

  • MyBatis Plus

  • Redis

  • OpenCV

  • PyTorch(YOLO训练)

  • ...

微服务组件:

  • Nacos(配置中心)

  • Sentinel(流量控制)

  • Gateway(网关)

  • XXL-Job(任务调度)

  • Docker(容器化)

支持的数据库:

  • MySQL

  • Oracle

  • SQL Server

  • 国产数据库(达梦、人大金仓等)


六、应用场景推荐

说这么多,到底能用在哪儿?给你举几个例子:

场景1:智能安防

  • 训练检测"陌生人"的模型

  • 检测"危险物品"(刀具、烟雾等)

  • 车牌识别用于访客管理

场景2:工业质检

  • 训练检测"产品缺陷"的模型

  • 实时监控生产线

  • 自动报警并记录

场景3:教育培训

  • 用数字人做在线课程

  • 语音识别做实时字幕

  • OCR识别作业自动批改

场景4:智慧医疗

  • 识别医疗影像

  • OCR识别病历

  • 智能客服回答患者咨询

场景5:零售电商

  • 商品识别(自动结算)

  • 客户行为分析

  • 智能推荐


七、为什么这个项目值得支持?

1. 开源精神

作者明确表示:

"无商业版本也不会开商业版本!为往胜继绝学"

不搞付费版本,完全开源,这种情怀在现在真的太难得了!

2. 实用性强

不是玩具项目,是真正能在生产环境用的!

3. 持续更新

项目一直在迭代更新,新功能不断上线~

4. 社区支持

  • 有知识星球(付费但支持有问必答)

  • GitHub Issues

  • 微信群/QQ群

5. 国产化支持

支持国产数据库和国产操作系统,这对政府、企业项目太重要了!


八、常见问题解答

Q1:训练模型需要GPU吗?

A:训练YOLO模型建议用GPU(速度会快很多),但CPU也能跑,就是慢点。识别阶段CPU就足够了~

Q2:支持什么操作系统?

A:Windows、Linux、国产操作系统(麒麟、统信等)都支持!

Q3:可以商用吗?

A:Apache 2.0协议,可以商用!但建议保留版权声明~

Q4:遇到问题怎么办?

A:

  1. 看文档(项目有详细的README)

  2. 提GitHub Issues

  3. 加入知识星球(付费但有问必答,工作日9-6)

  4. 查看B站演示视频

Q5:需要Java基础吗?

A:如果只是使用,不需要!但如果要二次开发,需要了解Java和Vue~


九、写在最后

AI时代已经来了,与其观望不如行动!

WGAI这个项目,给了我们一个低成本、高效率的AI实践平台。不管你是:

  • 学生党:可以用它做毕设、研究

  • 开发者:可以集成到你的项目中

  • 企业主:可以用它搭建AI能力

  • 爱好者:可以玩转各种AI应用

关键是——免费、开源、安全可控!

最后,如果这个项目对你有帮助,别忘了:

  1. 给项目点个Star ⭐

  2. 关注"红鱼AI"公众号(持续分享AI干货)

  3. 觉得好用可以捐赠支持作者(项目主页有捐赠二维码)

让我们一起,用国产AI技术,打破技术垄断,为国产AI生态贡献力量!


官方链接汇总:

开源仓库:
https://gitee.com/dromara/wgai
https://github.com/dromara/wgai
https://gitcode.com/dromara/wgai

官方网站:
http://120.48.51.195/#/

在线演示:
http://1.95.152.91:9999/
账号:wgai
密码:wgai@2024

B站演示视频:
https://www.bilibili.com/video/BV13C9BYiEFS/?t=38.4
https://www.bilibili.com/video/BV1fJwhe7E1G/?spm_id_from=333.1387.homepage.video_card.click&vd_source=73d8a30a253a95bdb8b89a5fec80d9b9
https://www.bilibili.com/video/BV1EJwheEEYq/?vd_source=73d8a30a253a95bdb8b89a5fec80d9b9

相关项目:
EasyAi(轻量级AI内核):https://gitee.com/dromara/easyAi


我是红鱼AI,一个专注AI技术分享的号主~

如果你觉得这篇文章对你有帮助,别忘了点赞、在看、转发三连!

有想了解的AI技术,可以在评论区留言,下期安排!

关注"红鱼AI",每天一个AI小技巧,带你从小白到大神!🚀

评论