AI搜索导航
  • 首页
  • 科技方案
  • AI智能工具
  • AI摇一摇
  • 书籍推荐
登录 注册
  • 首页
  • 科技方案
  • AI智能工具
  • AI摇一摇
  • 书籍推荐
  • 首页
  • 科技热点
  • 基于谷歌EmbeddingGemma和Gemma3 1B在设备上构建一套离线RAG系统教程,给出完整代码片段和演示视频

基于谷歌EmbeddingGemma和Gemma3 1B在设备上构建一套离线RAG系统教程,给出完整代码片段和演示视频

2025-10-29 作者:技术PP虾 浏览量:435

提取PDF文本,用iText库直接抽文字,可限定页数,防止一次加载整份大文件导致内存暴涨或耗时过长

文本切块,借助Deep Java Library加载HuggingFace 格式tokenizer,按256 token一块、重叠40token做递归切分,方便后续向量比对

生成向量,调用EmbeddingGemma 300M(TFLite 格式),把每段文字转成768维向量,一次算好后用Java序列化写进本地文件,下次启动直接读取无需重新推理

用户提问也转成向量,同一套EmbeddingGemma模型跑推理,得到查询向量

做相似度计算,用余弦相似度把查询向量与库里的所有向量比一遍,挑出最像的3段文字

交给大模型回答,把挑出的3段文字作为上下文,连同用户问题一起喂给Gemma 3 1B,让它只基于上下文生成答案

全程无服务器、无网络,数据不出设备,代码用Kotlin 写在Android端,可直接跑在普通手机上

教程:https://farmaker47.medium.com/develop-an-on-device-rag-system-powered-by-gemma-models-f7cdb7bca221

分类

  • 全部 (1553)
  • 科技热点 (624)
  • 前端科技 (6)
  • AI指令集合 (417)
  • 经验分享 (3)
  • 动漫短片创作脚本 (503)

相关最新

  • OpenAI 发布超强小型模型GPT-5.4 mini与nano,速度与性能双丰收!
  • ​滴滴 AI 出行助手“小滴”v1.0 正式上线:支持一句话个性化叫车
  • 百度“秒哒”上线应用生成Skill:开启零门槛全球应用开发新时代
  • ​北京启动“清朗京华·AI 向善”专项行动,严打涉 AI 领域五类网络乱象
  • 腾讯ima上线Skills功能:首发笔记插件并适配OpenClaw等主流工具
  • 百万级智能体“大练兵”!MiniMax 联手腾讯云:RL 沙箱实现全量平稳运行
关于我们 免责声明 用户协议
Copyright ©2026 AI搜索导航 All Rights Reserved
渝公网安备50019002504915号 渝ICP备2025061478号-2
首页 分类
工具
书籍 文章 我的