上一篇我们介绍了 GQA,通过分组共享 KV Head,在注意力质量和推理效率之间找到了实际的平衡点。 至此,从第 25 篇到第 29 篇,我们分别拆解了现代大模型的五个核心设计模块: RoPE:旋转位置编码,让 QK 点积天然感知相对位置。 RMSNorm:去掉均值中心化的简化归一化。 SwiGL ...
深度学习论文精读方法论:软件工程师的系统化指南对于软件工程师而言,深入学术研究领域往往伴随着一种强烈的挫败感:晦涩的术语、复杂的公式以及看似“奇迹”的实验结果,常让人觉得需要补充十年的背景知识才能读懂标题。然而,深度学习并非不可逾越的鸿沟。通过建立一套系统化的阅读协议,工程师可以利用自身的逻辑优势, ...
前言 本文主要描述Event-Driven开发中的ReAct模式,并且使用一个demo,彻底搞懂怎么在实际工作中使用Event-Driven模式 话不多说,我们开始 代码结构 代码地址 . ├── agent.py # EventDrivenAgent 主逻辑,负责接收事件、调用 LLM、执行工具 ...
一边,模型和开发者工具还在继续往真实工作流里走:Gemini 3.5 Live Translate 开始做近实时语音翻译,Kimi-K2.7-Code 开源,DiffusionGemma 探索更快的文本生成,Codex 和 Chrome DevTools 也在继续给 Agent 补浏览器能力。
另一... ...
你有没有遇到过这种情况:跑去问AI一个问题,它回答得滔滔不绝,逻辑清晰,听起来像模像样,但你就是有一种"哪里不对劲"的感觉。要么数据过时,要么答案与你的实际情况毫不相干,要么语气信心满满,内容却一本正经地偏了题。 这种"AI大聪明"的尴尬,困扰过太多人。 其实问题的根源不在于AI笨,而在于技术架构本 ...
一文掌握 Hermes Agent 上下文系统:Context Files 定义全局人格与项目规范,Context References 动态注入代码与 Git 变更,@语法实时加载,让 AI 智能体彻底听话。 ...
有一阵没做游戏了,咱接着回来做中医游戏,这期咱们聊聊怎么给游戏NPC装个"智能大脑",顺便看看开发过程中Hook这个老朋友的新玩法。项目代码在这里[tcm_odyssey] ...
AI语音助手,目前逐渐开始成为主流手机品牌的标准功能。你有没有想过:在你对手机说"帮我定个明天早上八点的闹钟",手机是怎么听懂的? ...
大家对 Hermes Agent 应该不陌生了。 Nous Research 开源的 AI 智能体项目,MIT 协议,GitHub 上 star 已经突破了 18 万。OpenRouter 应用排行榜上也是断层第一。 GitHub:https://github.com/NousResearch/he ...
前言 Human in the loop(人机协作)在企业级 Agent 应用中非常重要——AI 在执关键工具时必须经过人类审批,避免误操作影响业务。我之前用 LangGraph 0.3 裸写了一套(旧文),当时需要在 tool 函数里手动调 interrupt(),很啰嗦。如今有了 DeepAge ...
自进化 (Self-evolution) 是 Agent Harness 的核心模块,拥有自进化能力后 Agent 才能在长期的任务交互中不断成长,总结和改进自己的技能、记录用户的反馈和偏好,从被动应答升级为能够主动复盘和自我成长的 Agent。本文以 CowAgent 开源项目为例,介绍 Agen... ...
Hermes Agent 记忆使用教程 每次对话都要重新交代一遍项目背景和个人偏好,这种重复让人不胜其烦。Hermes Agent 记忆(Memory)系统是实现跨会话持久化、个性化交互的核心能力,分为内置文件记忆与外部记忆提供商两部分。内置记忆开箱即用,轻量高效;外部记忆提供语义搜索、知识图谱等高 ...
上一篇文章末尾使用了在线大模型压缩文本生成摘要,但该方式会消耗Token,不便初学者长期使用,更好的办法是采用离线大模型来生成文本摘要。 一、离线大模型的种类 国内常用的离线大模型有阿里Qwen、智谱GLM、深度求索DeepSeek、百度文心等等,以千问的文本大模型为例,又有Qwen1.5-1.8 ...
传统SOP依赖人工监督、人工核验,存在监管滞后、人工成本高、漏检误检等痛点。依托iNeuOS_Vision机器视觉技术,可实现SOP操作的自动化识别、实时监测、流程校验与异常告警,适配各类工业标准化作业场景,助力工业作业全流程可视化、智能化管控,提升生产标准化水平与作业效率。 ...
一、岗位核心:什么是 Agent Harness?DeepSeek 对这个岗位的定义非常清晰:Model + Harness = Agent模型(Model) 负责"能做什么",Harness(驾驭/ harnessing) 负责"怎么做好"。Harness 涵盖除模型本身之外的所有工程与研究——包 ...
小米XiaoMi-TTS-Local-Skill背景1. 传统TTS的级联式架构典型流程:文本规范化 → G2P(音素转换) → 声学建模 → 声码器生成局限性:误差在各环节累积,难以捕捉复杂语义关系代表技术:Tacotron+WaveNet、FastSpeech系列等2. 基于LLM的TTS的语义 ...
很多人用 DeepSeek、豆包、ChatGPT、Kimi 写数学题、论文推导、技术方案时,都会遇到同一个问题: AI 页面里公式显示得很正常,复制到 Word 以后却变成 \frac{x}{y}、$$...$$、普通文本、图片,甚至上下标和根号全乱了。有没有办法把这些公式导出成 Word 里还能编 ...
流式输出(Streaming)原理与踩坑经验 本人在日常开发中,遇到流式输出相关的问题,一般都需要靠大模型协助定位问题,归其根本是因为我对流式输出的原理认识不足。所以本篇文章记录我学习流式输出的原理,以及在实际开发中遇到的问题。 整体流程: 大模型生成 token ↓ 打包成 chunk(一个或多个 ...
Hermes Agent cron 定时任务使用教程 每天定时汇总数据、检查服务器状态、推送周报——这些重复性工作占据大量时间,却又不得不做。Hermes Agent 内置 cron 定时任务系统,支持自然语言调度、标准 Cron 表达式、任务全生命周期管理,自动执行数据汇总、系统监控、消息推送等重 ...
1.使用模型拟合简单的函数 设想有一个函数,它没有副作用 例如 add(a:float,b:float)->float{ return a+b; } 那么我们理论上可以训练一个模型:它的输入是一个二维向量,它的输出则应当是v[0]+v[1] 于是我们理应可以将任何num = add(f1,f2),替 ...