AI - 第3页 - 网站分类

深度学习进阶（三十）从 Transformer 到 LLaMA：现代 LLM 架构总览

上一篇我们介绍了 GQA，通过分组共享 KV Head，在注意力质量和推理效率之间找到了实际的平衡点。至此，从第 25 篇到第 29 篇，我们分别拆解了现代大模型的五个核心设计模块： RoPE：旋转位置编码，让 QK 点积天然感知相对位置。 RMSNorm：去掉均值中心化的简化归一化。 SwiGL ...

深度学习论文精读方法论

深度学习论文精读方法论：软件工程师的系统化指南对于软件工程师而言，深入学术研究领域往往伴随着一种强烈的挫败感：晦涩的术语、复杂的公式以及看似“奇迹”的实验结果，常让人觉得需要补充十年的背景知识才能读懂标题。然而，深度学习并非不可逾越的鸿沟。通过建立一套系统化的阅读协议，工程师可以利用自身的逻辑优势， ...

Event-Driven Agent 实战：Prometheus 告警 → LLM → Tool Calling → 自动恢复

前言本文主要描述Event-Driven开发中的ReAct模式，并且使用一个demo，彻底搞懂怎么在实际工作中使用Event-Driven模式话不多说，我们开始代码结构代码地址 . ├── agent.py # EventDrivenAgent 主逻辑，负责接收事件、调用 LLM、执行工具 ...

周一上线｜瑞幸把咖啡做进 CLI，Fable 5 短暂登场，Stonk Rider 骑上 K 线图

一边，模型和开发者工具还在继续往真实工作流里走：Gemini 3.5 Live Translate 开始做近实时语音翻译，Kimi-K2.7-Code 开源，DiffusionGemma 探索更快的文本生成，Codex 和 Chrome DevTools 也在继续给 Agent 补浏览器能力。另一... ...

一文读懂AI落地的三驾马车：大语言模型、RAG、多模态AI

你有没有遇到过这种情况：跑去问AI一个问题，它回答得滔滔不绝，逻辑清晰，听起来像模像样，但你就是有一种"哪里不对劲"的感觉。要么数据过时，要么答案与你的实际情况毫不相干，要么语气信心满满，内容却一本正经地偏了题。这种"AI大聪明"的尴尬，困扰过太多人。其实问题的根源不在于AI笨，而在于技术架构本 ...

智能体总是不听话？90% 的人没用对 Hermes 的「上下文」——这才是正确的打开方式

一文掌握 Hermes Agent 上下文系统：Context Files 定义全局人格与项目规范，Context References 动态注入代码与 Git 变更，@语法实时加载，让 AI 智能体彻底听话。 ...

和AI一起搞事情#7. 给游戏NPC接入Hermes？

有一阵没做游戏了，咱接着回来做中医游戏，这期咱们聊聊怎么给游戏NPC装个"智能大脑"，顺便看看开发过程中Hook这个老朋友的新玩法。项目代码在这里[tcm_odyssey] ...

一文读懂AI应用技术：自然语言处理、语音识别/合成、可解释AI

AI语音助手，目前逐渐开始成为主流手机品牌的标准功能。你有没有想过：在你对手机说"帮我定个明天早上八点的闹钟"，手机是怎么听懂的？ ...

Hermes官方桌面版发布了

大家对 Hermes Agent 应该不陌生了。 Nous Research 开源的 AI 智能体项目，MIT 协议，GitHub 上 star 已经突破了 18 万。OpenRouter 应用排行榜上也是断层第一。 GitHub：https://github.com/NousResearch/he ...

DeepAgents - Human in the loop

前言 Human in the loop（人机协作）在企业级 Agent 应用中非常重要——AI 在执关键工具时必须经过人类审批，避免误操作影响业务。我之前用 LangGraph 0.3 裸写了一套（旧文），当时需要在 tool 函数里手动调 interrupt()，很啰嗦。如今有了 DeepAge ...

让 Agent 在对话中成长：自进化机制的五层实现

自进化 (Self-evolution) 是 Agent Harness 的核心模块，拥有自进化能力后 Agent 才能在长期的任务交互中不断成长，总结和改进自己的技能、记录用户的反馈和偏好，从被动应答升级为能够主动复盘和自我成长的 Agent。本文以 CowAgent 开源项目为例，介绍 Agen... ...

每次对话都要重新交代背景？Hermes 记忆系统让你告别重复，智能体比你还懂你的项目

Hermes Agent 记忆使用教程每次对话都要重新交代一遍项目背景和个人偏好，这种重复让人不胜其烦。Hermes Agent 记忆（Memory）系统是实现跨会话持久化、个性化交互的核心能力，分为内置文件记忆与外部记忆提供商两部分。内置记忆开箱即用，轻量高效；外部记忆提供语义搜索、知识图谱等高 ...

15天学会AI应用开发（六）使用离线大模型对文本生成摘要

上一篇文章末尾使用了在线大模型压缩文本生成摘要，但该方式会消耗Token，不便初学者长期使用，更好的办法是采用离线大模型来生成文本摘要。一、离线大模型的种类国内常用的离线大模型有阿里Qwen、智谱GLM、深度求索DeepSeek、百度文心等等，以千问的文本大模型为例，又有Qwen1.5-1.8 ...

[免费试用] iNeuOS_Vision视觉分析在SOP标准工作操作规程的应用

传统SOP依赖人工监督、人工核验，存在监管滞后、人工成本高、漏检误检等痛点。依托iNeuOS_Vision机器视觉技术，可实现SOP操作的自动化识别、实时监测、流程校验与异常告警，适配各类工业标准化作业场景，助力工业作业全流程可视化、智能化管控，提升生产标准化水平与作业效率。 ...

从DeepSeek-Agent Harness研发员岗位看齐

一、岗位核心：什么是 Agent Harness？DeepSeek 对这个岗位的定义非常清晰：Model + Harness = Agent模型（Model）负责"能做什么"，Harness（驾驭/ harnessing）负责"怎么做好"。Harness 涵盖除模型本身之外的所有工程与研究——包 ...

小米XiaoMiTTS-Local-Skill

小米XiaoMi-TTS-Local-Skill背景1. 传统TTS的级联式架构典型流程：文本规范化 → G2P(音素转换) → 声学建模 → 声码器生成局限性：误差在各环节累积，难以捕捉复杂语义关系代表技术：Tacotron+WaveNet、FastSpeech系列等2. 基于LLM的TTS的语义 ...

AI 生成的数学公式复制到 Word 后变乱怎么办？怎么保留可编辑公式

很多人用 DeepSeek、豆包、ChatGPT、Kimi 写数学题、论文推导、技术方案时，都会遇到同一个问题： AI 页面里公式显示得很正常，复制到 Word 以后却变成 \frac{x}{y}、$$...$$、普通文本、图片，甚至上下标和根号全乱了。有没有办法把这些公式导出成 Word 里还能编 ...

流式输出（Streaming）原理与踩坑经验

流式输出（Streaming）原理与踩坑经验本人在日常开发中，遇到流式输出相关的问题，一般都需要靠大模型协助定位问题，归其根本是因为我对流式输出的原理认识不足。所以本篇文章记录我学习流式输出的原理，以及在实际开发中遇到的问题。整体流程：大模型生成 token ↓ 打包成 chunk（一个或多个 ...

每天重复手动运维？Hermes cron 一句话搞定定时任务，彻底告别人工值守

Hermes Agent cron 定时任务使用教程每天定时汇总数据、检查服务器状态、推送周报——这些重复性工作占据大量时间，却又不得不做。Hermes Agent 内置 cron 定时任务系统，支持自然语言调度、标准 Cron 表达式、任务全生命周期管理，自动执行数据汇总、系统监控、消息推送等重 ...

如果函数都能被拟合，指针呢？

1.使用模型拟合简单的函数设想有一个函数,它没有副作用例如 add(a:float,b:float)->float{ return a+b; } 那么我们理论上可以训练一个模型:它的输入是一个二维向量,它的输出则应当是v[0]+v[1] 于是我们理应可以将任何num = add(f1,f2),替 ...