AI
刷新
Search-R1论文浅析与代码实现

博主头像 GitHub: https://github.com/PeterGriffinJin/Search-R1 论文: link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上,基于给定的Search Egine \(R\ ...

OpenAI Codex整合Z.ai GLM-4.6编程

博主头像 背景 OpenAI Codex 是一个由 OpenAI 开发的人工智能模型,它能够理解自然语言(比如中文、英文)指令,并将其实时翻译成可工作的计算机代码。简单来说,你用日常语言告诉它你想要实现什么功能,它就能为你写出代码。技术基础: Codex 是基于 OpenAI 的 GPT-3(生成式预训练变换 ...

读人形机器人32读后总结与感想兼导读

博主头像 1. 基本信息 人形机器人 [加]李向明 著 中信出版集团,2025年07月出版 1.1. 读薄率 书籍总字数23.6万字,笔记总字数115967字。 读薄率115967÷236000≈49.14% 1.2. 读厚方向 当我点击时,算法在想什么? 算法霸权 极简算法史:从数学到机器的故事 算法的陷阱 ...

DAPO代码实现浅析

博主头像 参考verl对dapo的实现,首先咱们看一下入口.sh和.py文件,在./recipe/dapo/文件夹中有以下目录 . ├── config │ ├── dapo_megatron_trainer.yaml │ └── dapo_trainer.yaml ├── dapo_ray_trainer. ...

AI视频换人工具来了!动作表情完美还原,附下载链接

博主头像 近年来,随着AI扩散模型的发展,角色动画技术在电影制作、广告、数字人创建等领域取得了巨大的应用潜力。然而,现有技术大多是“局部”的,即要么专注于脸部、口型替换,要么只能模仿迁移角色的简单动作,且许多模型在生成质量、肢体与表情的控制力以及对不同角色的泛化能力上仍有不足。正是在这样的背景下,Season ...

12. 模型RAG评测

博主头像 12. 模型RAG评测 @目录12. 模型RAG评测模型理解力评测 现实中出现事实性幻觉的常见场景RAG幻觉评测最后: 模型理解力评测 RAG 之所以广受欢迎,是因为它(基于检索到的真实资料)能够减少幻觉。然而, RAG 并不一定意味着幻觉会被完全消除。 现实中出现事实性幻觉的常见场景 上下文提供了 ...

11. Spring AI + ELT

博主头像 11. Spring AI + ELT @目录11. Spring AI + ELTELTDocument Loaders读取Text读取markdownpdfB站:DocumentSplitter‌TokenTextSplitter自定分割器:分隔经验:分块五种策略1)固定大小分块2)语义分块3) ...

读AI赋能04医疗保健

博主头像 1. 概览 1.1. 连AI牙刷都能买到了,它们能通过实时指导来优化你的刷牙姿势 1.2. OpenAI的迭代部署方法是AI发展的总体战略 1.2.1. 一种集体行动方式,为公众提供了持续反馈的机会,以对精心设计、逐步改进的产品版本提供意见 1.3. 技术本身是人类实现大规模积极变革的最行之有效的杠 ...

DAPO浅析

博主头像 论文地址 https://arxiv.org/abs/2503.14476 参考实验:DAPO + vLLM v1 + VeRL —— VOC性能比较 Motivation 没有完整的GRPO训练R1-32B的框架 目标: 降低错误样本的长度 (token-level loss) 训练更加稳定 (o ...

读AI赋能03《1984》

博主头像 1. 乔治·奥威尔 1.1. 《1984》在1949年出版时,全世界的计算机数量比现在一家繁忙的星巴克店里能找到的计算机还要少,就连电视网络都还处于起步阶段 1.1.1. “无知即力量”​“自由即奴役”之类的口号 1.1.2. 国家的全能是通过一个由公共和私人安装的“电幕”组成的庞大网络实现的 1. ...

DeepResearch代码浅析

博主头像 DeepResearch代码浅析 概述 代码:DeepResearch 主要看一下inference下面的ReAct推理流程。 inference ├── eval_data │ ├── example_with_file.jsonl │ ├── example.jsonl │ └── file_c ...

读AI赋能02赋能进化论

博主头像 1. 合成智能 1.1. 在工业时代之前,整个社会的生产力受到极大限制,因为能源是一种稀缺资源 1.2. 回顾历史时,我们往往会通过工业革命带来的最糟糕的产物来看待它 1.2.1. 城市因获取蒸汽动力需要燃烧煤炭而蒙上黑烟 1.2.2. 工人在苛刻的工厂里从事危险的工作,几乎没有任何权利 1.2.3 ...

初试 Microsoft Agent Framework

博主头像 跟着 .NET 官方博客的博文中的示例代码基于 Microsoft Agent Framework 创建非常简单的写博文 Agent 与多 Agent 工作流初步体验一下。基于 Agent Framework 的核心抽象类 AIAgent 与聊天智能体实现类 ChatClientAgent 实现一个... ...

微软智能体框架(Microsoft Agent Framework)介绍

博主头像 背景 微软智能体框架(Microsoft Agent Framework)进行全面深入的分析。该框架于2025年10月1日发布公共预览版,标志着微软在人工智能智能体技术领域的一次重大战略整合 。其核心使命在于解决人工智能领域长期存在的“研究”与“生产”之间的鸿沟,将以研究为驱动、具备动态多代理编排能 ...

读AI赋能01超级能动性

博主头像 1. 超级能动性 1.1. 通货膨胀已成为全球最令人担忧的问题 1.2. 科技行业仍难以摆脱广告业务放缓、投资者情绪转变以及用户参与模式变化带来的叠加影响 1.2.1. 负面结果只是对科技行业在疫情期间出现的招聘、收入和市值激增的一种调整,而这些增长是由政府的刺激措施和被压抑的消费需求所推动的 1. ...

Salesforce实践AI驱动下的4个工程启示

博主头像 引言:当软件测试达到极限 在现代软件开发中,自动化测试是质量保障的基石,但它也带来了一个普遍的挑战:海量的测试失败案例。当系统规模达到一定程度时,诊断和修复这些失败案例本身就可能成为一个巨大的工程瓶瓶颈,拖慢整个开发节奏。 Salesforce的工程团队对此深有体会。他们的测试生态系统规模惊人:每天 ...

<1···345···50>