AI
刷新
MagicWorld 实现长时交互视频世界建模

博主头像 MagicWorld 针对当前视频世界模型在长时间交互中易出现运动不合理与场景崩坏的问题,提出了一种面向长时稳定性的交互式建模框架。该方法通过引入基于光流的运动约束提升动态真实性,利用历史检索机制增强跨时间一致性,并通过多步聚合的训练策略优化整体交互序列质量,从而有效缓解误差累积问题。整体上,Mag... ...

【IoTDB 社区】白话时序大模型系列-5:和时序基础模型是什么关系?

博主头像 聊了这么多期时序大模型,大家可能有一个困惑的问题:这些模型一会儿叫“时序大模型”,一会儿又叫“时序基础模型”,很多做大模型的团队也自称“基模团队”。这两个词到底是不是一回事? 今天讨论讨论这件事。 “基础模型”这个词从哪儿来? 2021 年 8 月,斯坦福大学基础模型研究中心(CRFM)发布报告,P ...

夯爆了!Claude Code 最佳实践开源了, 狂斩 57k+ Star,核心玩法、工作流、Agent 等一网打尽!!

博主头像 大家好,我是R哥。 最近 Claude Code 的热度还是很高啊,这篇《Claude Code 官方桌面端正式发布,夯爆了!》都几万阅读了,而且各大社区关于 Claude Code 的讨论也一直很活跃。 可是,很多人拿到 Claude Code 就开始让它写代码了,很多理念、功能都没有真正弄明白, ...

从 Claude Code 动态工作流看 Agent Harness 设计

博主头像 复杂任务不能只靠一个上下文一路做到底。任务需要拆分,上下文需要隔离,验证需要独立,流程也要能在中断后恢复。不同子任务还可以选择不同模型和预算,避免所有事情都挤在同一个执行路径里。 这些设计放在 Claude Code 里,是 Dynamic Workflows;放到更大的 Agent 系统里,其实就... ...

Antigravity Agent Skills

博主头像 Antigravity Agent Skills(智能体技能)技能是一种开放标准,用于扩展智能体的能力。一个技能是一个包含 SKILL.md 文件的文件夹,其中包含智能体在处理特定任务时可以遵循的指令。什么是技能?技能是可复用的知识包,用于扩展智能体能够执行的操作。每个技能包含:如何处理特定类型任务 ...

学会这 5 个 Hermes 插件开发技巧,让 Agent 能力扩展 10 倍

博主头像 Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...

5 分钟上手!Hermes Agent 插件开发保姆级教程,扩展能力从此开挂

博主头像 Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...

Antigravity 2.0智能体

博主头像 Antigravity 2.0智能体 Antigravity 现已支持子智能体,不再仅限于单一的专用浏览器子智能体。 子智能体现在可以是模块化的、专门化的,或由主智能体以编程方式生成的空白助手智能体。它们可以是内置角色、通用克隆体(继承与主智能体相同的提示词和环境),或在需要时动态注册(即主智能体根 ...

在 AI 的流畅回答里,守住自己的判断

AI Agent 的价值不在于替人知道未知领域的真相,而在于把未知变成可提问、可比较、可验证、可追责的结构。真正可靠的 Agent 不只需要 intelligence,更需要 epistemology 与 accountability。 ...

深度学习进阶(二十八)现代 LLM 的核心架构设计其三:Decoder-Only 下的 KV Cache

博主头像 上一篇我们介绍了 SwiGLU,通过引入门控机制让 FFN 能够根据输入动态筛选信息,取代了标准 Transformer 沿用多年的单通路结构。 前两篇的内容都关于结构上的优化,本篇则关于一个核心工程优化。 我们知道,即使是现在的多数大模型,其生成回答的逻辑仍然是自回归生成,即逐个字往外蹦。 因此, ...

<1···345···50>