开发进度

✅ 已完成

  • RAG(AI识别找寻对应数据库)
    实现基于语义的文档检索和问答
  • 统计Token用量
    实时统计API调用的Token消耗
  • 多人访问,不同的聊天历史记录
    支持多用户独立的对话历史
  • 检索器优化Retriever
    Hybrid Search (向量60% + BM25 40%) + Multi-Query 查询扩展
  • 文档上传功能
    支持 .txt / .pdf / .docx 文件上传
  • ChromaDB 向量存储
    向量数据库存储和检索文档
  • 流式响应(Streaming)
    实时流式输出AI回答
  • 知识库管理
    重置/查看/管理文档
  • 添加开发进度记录
    记录项目开发进度和功能状态
  • 添加AI运行超时机制
    防止AI请求长时间无响应
  • 添加文档出处
    显示回答引用的文档来源和位置
  • 样式优化
    UI/UX界面美化和交互优化
  • 服务器搭建测试使用
    部署到服务器进行测试
  • 环境状态(线上线下区分)
    区分开发/生产环境配置和状态显示
  • 添加AI聊天机制
    实现AI对话功能和消息交互
  • 适配手机端样式
    响应式布局适配移动端设备
  • 历史记录最多带入5条(节省token)
    服务端限制最近5条历史消息,减少Token消耗
  • 知识库优化,AI识别更准确
    优化数据结构,提取文章标题和ID,提升检索准确率
  • 添加部分错误提示
    增加操作失败时的错误反馈提示
  • 优化AI思考时还能发送的bug
    修复AI回复期间用户可重复发送消息的问题
  • 修复XSS漏洞
    修复跨站脚本攻击安全漏洞
  • 通用 API 30次/分钟,对话接口 10次/分钟
    API请求频率限制,防止滥用
  • 添加工具:百度网络搜索(可能不准确)
    集成百度搜索 + 页面抓取工具
  • 添加缓存机制,优化AI回答时间
    LLM/Embedding单例缓存 + 查询结果LRU缓存 + BM25缓存延长 + 条件化Multi-query
  • 优化AI首字回答时间
    减少用户等待首字响应的时间
  • Phoenix评估幻觉率(已完成未开启)
    使用Phoenix工具评估AI生成内容的幻觉率
  • 记录用户操作日志,用于后续分析
    按日期记录JSON格式日志,包含IP、Token使用量、接口调用统计
  • 优化聊天加载中的样式
    优化AI思考和加载时的视觉反馈效果
  • 用户可以上传视频、图片问答(全模态大模型)
    支持图片和视频文件上传,模型可分析多模态内容

⏳ 待办

  • 聊天历史持久化存储
    数据库存储聊天记录,重启不丢失
  • 连接MySQL数据库
    集成MySQL进行数据存储和查询
  • 添加工具,让AI可以直接操作部分接口
    AI可调用后端API执行具体操作