基本信息

CozyOct1
23 岁
浙江省杭州市
15551651895
nwj_zju@foxmail.com

教育背景

合肥工业大学 | 智能科学与技术 | 本科 211双一流
2020.09 - 2024.06
浙江大学 | 人工智能 | 硕士 985211双一流
2024.09 - 2027.06

实习经历

上海哔哩哔哩股份有限公司 | 大模型&AIGC 研发工程师 | 数码推荐
2025.05 - 2025.08

LLMRAGMilvus

项目职责: 负责出卡判断服务的维护以及数码推荐服务和检索召回服务的优化

项目介绍:

出卡判断服务: 判断用户搜索是否符合展示数码推荐卡片条件。

  • 数码行业关键词库: 基于描述、品牌、功能、价格、评测等的数码行业关键词库构建正则规则引擎进行匹配与评分。
  • 决策逻辑: 若评分 ≥ 0.7 且命中强相关关键词,则触发展示带有可变标题的数码推荐卡片。

数码推荐服务: 提供用户聊天交互、服务停止控制、历史记录管理(标题/聊天)、用户赞踩反馈、具体反馈收集等接口。

  • 审核过滤: 对用户 Query 和最终回复进行敏感词过滤 + AI 机审。
  • Query 改写: 对用户 Query 进行问题类型判断以及对数码 Query 规范化改写。
  • 检索召回: 部署 Milvus 向量数据库集群,管理高光帧特征、ASR 文本、SKU 参数、视频章节文本等多模态数据。基于 Milvus 向量数据库以及重排模型对改写后的数码 Query 进行检索,召回相关的数据信息。
  • 意图识别: 根据改写后的数码 Query 判断用户的意图,即直接推荐和意图下钻。
3. **检索召回服务:** - **意图识别:** 根据 Query 判断检索信息的类型,以及对 Query 中的 Sku 相关信息进行提取和分类。 - **Query 分析:** 提取正负向品牌,拆分子查询并改写主查询。 - **型号标准化:** 对 Query 中的 Sku 相关信息进行模糊型号(时效、参数、品牌、热度)和具体型号的标准化处理。 - **用户评论召回:** - **无 sku:** 检索评论库 → BGE 模型重排 → 聚合返回。 - **单 sku:** 检索目标机型评论 → BGE 重排 → 调用大模型精确分类 → 聚合返回。 - **多 sku:** 转交机型推荐服务处理。 - **机型推荐召回:** - **无 sku:** 主/子查询四路召回检索 → 基于意图和型号条件过滤 → 聚合返回。 - **有 sku:** 目标机型四路召回检索 → 聚合返回。 - **四路召回检索:** - **Milvus 向量数据库集群部署:** 部署 Milvus 向量数据库集群,管理高光帧特征、ASR 文本、SKU 参数、视频章节文本等多模态数据。 - **检索流程:** 检索结果 → 使用 Qwen3 模型进行重排 (Rerank) → 调用大模型进行内容分类、打分、筛选 → 返回优质结果。

项目经历

智能数据分析平台
2025.02 - 2025.04

LLMAgentLangchain

项目架构

  • Planning: 意图识别,Query 拆分
  • Memory: 通过 Mysql 数据库存储用户的所有查询记录
  • Action: Sql 语句查询,可视化数据报表生成,Sql 语句自动纠错
  • Tool: Sql 执行工具,Python 执行工具

专业技能

Language Framework Database Toolchain
PythonJavaC++JavaScriptHTML5CSS3 LangChainLangGraphVue.jsPyTorchTensorFlow MySQLRedisMilvus GitDockerNginxApache Kafka