开发进度

✅ 已完成

✓
RAG（AI识别找寻对应数据库）
实现基于语义的文档检索和问答
✓
统计Token用量
实时统计API调用的Token消耗
✓
多人访问，不同的聊天历史记录
支持多用户独立的对话历史
✓
检索器优化Retriever
Hybrid Search (向量60% + BM25 40%) + Multi-Query 查询扩展
✓
文档上传功能
支持 .txt / .pdf / .docx 文件上传
✓
ChromaDB 向量存储
向量数据库存储和检索文档
✓
流式响应（Streaming）
实时流式输出AI回答
✓
知识库管理
重置/查看/管理文档
✓
添加开发进度记录
记录项目开发进度和功能状态
✓
添加AI运行超时机制
防止AI请求长时间无响应
✓
添加文档出处
显示回答引用的文档来源和位置
✓
样式优化
UI/UX界面美化和交互优化
✓
服务器搭建测试使用
部署到服务器进行测试
✓
环境状态（线上线下区分）
区分开发/生产环境配置和状态显示
✓
添加AI聊天机制
实现AI对话功能和消息交互
✓
适配手机端样式
响应式布局适配移动端设备
✓
历史记录最多带入5条（节省token）
服务端限制最近5条历史消息，减少Token消耗
✓
知识库优化，AI识别更准确
优化数据结构，提取文章标题和ID，提升检索准确率
✓
添加部分错误提示
增加操作失败时的错误反馈提示
✓
优化AI思考时还能发送的bug
修复AI回复期间用户可重复发送消息的问题
✓
修复XSS漏洞
修复跨站脚本攻击安全漏洞
✓
通用 API 30次/分钟，对话接口 10次/分钟
API请求频率限制，防止滥用
✓
添加工具：百度网络搜索（可能不准确）
集成百度搜索 + 页面抓取工具
✓
添加缓存机制，优化AI回答时间
LLM/Embedding单例缓存 + 查询结果LRU缓存 + BM25缓存延长 + 条件化Multi-query
✓
优化AI首字回答时间
减少用户等待首字响应的时间
✓
Phoenix评估幻觉率（已完成未开启）
使用Phoenix工具评估AI生成内容的幻觉率
✓
记录用户操作日志，用于后续分析
按日期记录JSON格式日志，包含IP、Token使用量、接口调用统计
✓
优化聊天加载中的样式
优化AI思考和加载时的视觉反馈效果
✓
用户可以上传视频、图片问答（全模态大模型）
支持图片和视频文件上传，模型可分析多模态内容

⏳ 待办

○
聊天历史持久化存储
数据库存储聊天记录，重启不丢失
○
连接MySQL数据库
集成MySQL进行数据存储和查询
○
添加工具，让AI可以直接操作部分接口
AI可调用后端API执行具体操作