AI
刷新
深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力

博主头像 上一篇我们把现代大模型的五个核心模块拼回了 LLaMA 这个完整案例中,可以看到注意力机制仍然是计算最密集的部分。 而这个密集程度在序列变长时,会变得越来越恐怖: 标准自注意力的计算复杂度和空间复杂度都是 \(O(n^2)\):序列长度翻倍,计算量翻四倍,内存占用也翻四倍。 而在之前,我们用 KV ...

给 AI Agent 使用 Puppeteer 之前,先定义浏览器边界

Puppeteer 是非常适合 AI coding agent 使用的工具。它用 Node.js API 控制 Chrome 或 Firefox,可以做浏览器自动化、截图、网页抓取、页面检查、网络请求观察和重复性 Web 任务。 但这也是风险来源。 一旦 Agent 能打开浏览器,它就可能接触真实网 ...

六个视频类Agent Skills

博主头像 6 个的视频类Skills: 1. HyperFrames 一句话生成动效视频,文章、推文、产品介绍都能变成 MP4。适合产品宣发、教程开场、社交短视频。 https://github.com/heygen-com/hyperframes 2. video-use 让 coding agent 帮你 ...

工业级 AI Skill 构建指南

博主头像 工业级 AI Skill 构建指南:从单次指令到工程化工作流 在 AI 原生应用的软件工程范式中,我们正经历从“提示词工程(Prompt Engineering)”向“技能工程(Skill Engineering)”的战略跃迁。对于架构师而言,单次 Prompt 的随机性是生产环境的死敌。工业级 S ...

杀疯了!OpenAI 宣布 Codex 可以免费重置额度了,最多可以免费重置 4 次(附重置指南,赶快冲!!)

博主头像 大家好,我是R哥。 奥特曼大善人啊,今天无意间发现 Codex 可以免费重置次额度了,最多可以重置 4 次,没有任何套路,简单粗暴,,重置方法如下。 先说第一种: 首先点击左下角设置菜单: 如果你看不到这个重置菜单项,请更新到最新版本再看下。 然后再点击「1 次可用重置」菜单: 再点击「重置使用次数 ...

FDE-AI落地时代的“最后公里”解决者

博主头像 深度洞察:FDE(前置部署工程师)——AI落地时代的“最后公里”解决者 在人工智能技术的宏大叙事中,我们正处于一个决定性的拐点:AI正在从实验室的惊艳Demo向复杂的企业生产环境(Production Environment)大规模迁移。然而,模型能力的飞跃并不等同于商业价值的自动兑现。当企业发现精 ...

Book to skill 将书籍蒸馏为skill

博主头像 Book to skill 将书籍<<ai agents in action>>蒸馏为skillBook-to-Skill AI Agent 时代诞生的知识转化方法论与工具集,核心是将书籍、专业文章、文档等静态文本知识,通过结构化蒸馏与重构,转化为大语言模型(如 Claude Code)可直接调用、 ...

【IoTDB 社区】白话时序大模型系列-6:为什么只有预测是开箱即用的?

博主头像 时序预测、时序分类、时序填补……时序分析任务其实挺多的,各有各的名字,各有各的场景。 但是,你有没有发现一个现象? 市面上叫得上名字的时序大模型,TimesFM、Chronos、Timer,清一色全是做时序预测的。大家说的"开箱即用"、"零样本"、"预训练直接推理",也都是指时序预测。 为什么分类和 ...

<123···50>