006:RAG 入门-面试官问你,RAG 为什么要切块?
本文是 refine-rag 系列教程的第六篇,我们来学习一下什么是切块,应该怎么样去切块? 本文所有代码都在:https://github.com/zonezoen/refine-rag 前言 前面花费了挺多时间去学习怎么读取数据的,那么在读取数据之后,我们要做的操作就是切块,那么什么是切块?为什 ...
Stanford-CS336-Lecture-02 Pytorch
title: Stanford CS336 Lecture_02 Pytorch date: 2026-03-10 15:27:23 categories: [人工智能] 本内容为Stanford CS336 Lecture 02,主要不是为pytorch的所有方法进行详细的讲解,而是提供对pyto ...
灾难来袭:必应突然搜索不到博客园的任何内容
自从2022年园子被百度全面降权后,必应成为园子的主要搜索流量来源,我们也逐步习惯了只有必应、没有百度的日子。在这近四年的时光里,必应一直对园子都很友好,搜索排名靠前,新发内容收录很快,保住了园子的基本流量。在被百度离开的日子里,园子没有泪盈,因为至少还有必应。如今 AI 时代已经到来,传统搜索引擎... ...
手搓的一个Oracle数据库物理备份工具,支持本机+异机
各位技术伙伴,给大家分享一款咱们团队「纯手工打造」的 Oracle 数据库物理备份工具! 这款工具历经打磨,核心能力全面升级——不仅支持本机物理备份,还完美适配异机备份场景,可满足不同部署环境下的Oracle数据备份需求。从底层逻辑到实操流程全自主研发,既能精准匹配业务系统的备份节奏,又能规避通用工 ...
【黑客松银牌】我是如何 Arxiv论文推荐 AI对话 保存zotero 网页端
项目地址 https://github.com/ziwenhahaha/daily-paper-reader 简介 手搓的daily-paper-reader迭代了三个月迭代了七百余次commits终于比较满意了。这是一个大家都用得上的一个论文阅读工具。 克服的问题是,每天arxiv上都有很多的论文 ...
LeetCode 236 二叉树的最近公共祖先:python3 题解
经典二叉树递归题。如果 node == p 或 q 或 None,返回 node;然后,left, right = dfs(左子树) (右子树);如果 left 或 right 有值,证明 p 或 q 被找到了,返回有值的那个;如果 left right 都有值,则 p q 分别为 left rig... ...
【JVM】编译执行与解释执行的区别是什么?JVM 使用哪种方式?
一、先明确两个核心概念 1. 编译执行(Compiled Execution) 核心逻辑:先把「源代码」一次性编译成「机器码」(CPU 能直接执行的二进制指令),再运行机器码。 过程:源代码 → 编译器 → 机器码文件(如 .exe)→ 直接运行; 类比:把英文书(源代码)一次性翻译成中文书(机器码 ...
一小时手搓轻量级可代替 Qdrant 的向量数据库
在 AI 应用爆发的今天,我们在做桌面端或边缘端 RAG(检索增强生成)应用时,真的需要动辄部署一套分布式的 Qdrant 或 Milvus 吗?本文将带你从 0 到 1,用纯 Go 语言在**一小时内**手写一个内嵌级的轻量化向量数据库 **GoVector**。它不仅支持 HNSW 高性能图索引... ...
时序数据库是什么?能源行业国产化替换的入门必看
在能源行业一线工作中,你是否经历过这样的场景:智能电表每秒回传数千条电压、电流数据,但系统响应变慢、查询卡顿;风电场数百台风机的振动、温度、功率曲线长期积累,存储成本持续攀升却难以快速识别异常趋势;调度中心需实时调取过去72小时某变电站的负荷曲线做故障回溯,却要等待数十秒——这些并非系统“老化”,而 ...
AI Coding 中的概念 Vibe Coding 和 Spec Coding 简介
〇、前言 在现今 2026 年,学习 AI Coding(人工智能编程) 已经不再是一个“可选项”,而是软件开发领域的生存法则和职业跃迁的必经之路。 从本文开始,博主将会总结一些相关知识和基本的实践,欢迎一起交流。 本文将介绍一下为什么要开始 AI Coding 学习,以及对 Vibe Coding ...
Java 实现企业微信扫码登录
一、场景 Web 系统登录页面“企业微信”图标,点击后调取企业微信扫码登录页面,扫码成功后判断系统账号与企业微信用户ID绑定情况,有则直接登录,无则跳转到绑定登录页面,用户手动输入个人账号密码进行绑定,首次绑定后后续无需再绑定。 二、企业微信应用相关配置 1、新建企微应用 进入企微管理后台,应用管理 ...
CPU ↔ DRAM(内存总线)的可持续数据传输带宽
最大理论带宽 最大理论带宽(Theoretical Maximum Memory Bandwidth),不需要运行复杂的测试,只需要知道两个核心参数:内存频率和内存通道数。 1. 核心计算公式 内存带宽的计算公式如下: \[\text{Max Bandwidth (GB/s)} = \frac{\t ...
searxng-cli:Exa MCP 的开源替代路径,用更少上下文拿到更准的信息
Exa MCP 的体验很接近“为 LLM 优化过的搜索 API”:结果干净、可读、适合直接喂给模型。但对普通用户来说,额度/配额往往是最大阻力——一旦把“搜索”变成稀缺资源,Agent 的研究链路就会被迫降频。 另一端是 SearXNG MCP / Browser MCP:可用、开放,但经常把整页 ...
AI开发-python-langchain框架(3-2-文本文档加载器 )
上节讲如何将文本进行向量化,本节讲讲如何将文本文件加载到程序中,进行下一步处理,langchain 的 TextLoader提供了这个功能。 langchain 的 TextLoader 并非支持所有文本格式,它的核心作用是读取「纯文本类文件」,对非纯文本格式(如带格式的文档、二进制文件)无法直接解 ...
LiteLLM + OpenClaw:多模型 API Key 管理与模型切换实战
当同时使用多个大模型厂商时,API Key 管理与模型切换会变得复杂。本文通过 LiteLLM 构建统一的大模型代理服务,并将其接入 OpenClaw,实现多模型统一管理与动态切换。同时结合 Docker 和 PostgreSQL,实现 Token 使用情况监控。 ...
OpenClaw 教程,来看看这12个实战案例
上一篇我们聊了如何从 5705 个技能里筛选出值得装的 5 个"新手套餐"。 装完之后呢? 很多人私信我说:"技能装好了,然后呢?我到底能用它们干什么?" 这个问题问得好。 如果把 OpenClaw 比作一个工具箱,上一篇教你如何挑工具。这一篇,我们聊聊这些工具能帮你解决什么实际问题。 今天我给你盘 ...
C# 扩展方法只会写 this 吗?C# 14 新语法直接把扩展方法玩出了花
前言 PS: 不是,AI编程都普及了,怎么还有人研究编程语言的语法? 开个玩笑哈哈,一些简单和定制性比较强的代码还是手写比较好,有和AI对话的时间,我都把代码写好了 最近我在给 StarBlog 写一些分析脚本,需要用到扩展方法来简化代码,我想到前段时间看到 .NET10 的更新文档说有新的扩展 ...
MyBatis-缓存与注解式开发
MyBatis的缓存 缓存的作用:通过减少IO的方式,提高程序的执行效率。 mybaits的缓存:将select语句的查询结果放到缓存(内存)中。下一次还是这条select语句的话,直接从缓存中获取,不再查数据库。一方面是减少IO,另一方面不再执行繁琐的查找算法。从而提升效率。 mybatis的缓存 ...
性能干翻235B,单卡私有化部署OpenClaw
基于 Docker + llama.cpp 的本地化 AI 代理平台完整部署指南 本方案已在单卡 22GB 显存(如 RTX 2080Ti)环境下验证,达到性能与功能的较好平衡,适用于 长上下文、低并发、高精度 的私有化 AI 代理场景。 目录 方案说明 llama.cpp 本地模型服务部署 Ope ...


