吴恩达深度学习课程二: 改善深层神经网络 第二周:优化算法(一)Mini-batch 梯度下降
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本周为第二课的第二周内容,2.1和2. ...
大模型核心参数详解:从基础配置到高级调优指南
引言:参数调优的重要性 在大语言模型的应用中,仅仅提供一个好的提示词往往不足以获得理想的输出结果。模型参数的合理配置同样至关重要,它如同给模型调配合适的“工作性格”,直接影响生成文本的质量、风格和适用场景。本文将系统介绍大模型的各类关键参数,帮助你从被动使用者转变为精准调控专家。 一、模型基础结构参 ...
读浪潮将至08大契约
1. 国家的承诺 1.1. 民族国家,作为现今全球政治秩序的核心组成单元,本质上为其公民提供了一份简单而有说服力的契约 1.1.1. 公民让主权领土国家实现权力集中,而国家确保这种权力的集中带来的益处远大于其风险 1.2. 历史已经证明,国家对武力的集中控制,即赋予国家在执行法律和发展军事力量方面的 ...
使用vLLM实测3090和4090的大模型推理性能
使用`vLLM`测试下大模型并发推理场景下3090和4090两张显卡的性能表现,看下4090是否在高并发场景下具备更高的扩展性。
3090显卡和4090显卡在模型推理过程中的显存和GPU使用率都比较接近,1~8并发度场景下,3090和4090的推理性能均保持稳定;在16并发度下3090开始遇到性能瓶... ...
AI 时代的数据库进化论 —— 从向量到混合检索
说明: 本文只是关于数据库发展趋势的个人见解,没有特别深入的向量和混合检索的实现原理,属于很浅显易懂的科普类文章,几乎不需要任何背景知识,大家可以放心阅读。 关于混合检索的原理和最佳实践类文章,有缘再更,欢迎感兴趣的朋友们关注【老纪的技术唠嗑局】微信公众号。 背景 数据的分类 我一般会把数据库中的数 ...
吴恩达深度学习课程二: 改善深层神经网络 第一周:深度学习的实践 课后作业和代码实践
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第二课第一周的课程习题和代码实践 ...
Applied Machine learning and AI for egnineers与NPL with transform等书推荐
Learn Artificial Intelligence (AI), Machine Learning (ML), and Natural Language Processing (NLP) the trio shaping the future. 两本书第二本资源landing.deepset. ...
从0到1实现:AI版你画我猜小游戏
全民AI时代,前端er该如何蹭上这波热度?本文将一步步带大家了解前端应该如何结合端侧AI模型,实现一个AI版你画我猜小游戏。 ...
读浪潮将至07驱动力
1. 驱动力 1.1. 技术持续进步的主要推动力来自那些原始的、与人性紧密相关的因素 1.1.1. 不论是为了满足好奇心、应对危机,还是追求财富、逃避恐惧,技术发展的核心始终在于服务人性的需求 1.1.2. 只要人们有足够的动力去研发和应用技术,技术便会应运而生,并得到推广应用 1.2. 迄今为止, ...
网络图片下载+VideCoding+DeepSeekOCR解析实践
背景 某高校师资网站全面采用网络图片展示,网站是禁止右键使用下载,也不允许复制信息。我们试图采集这些信息,使用目前智能体任务+VibeCoding+Deepsee-OCR解析来突破这个问题。流程拆解第一步 html解析智能体我们方便选择space.coze.cn, 可以自行部署其他开源智能体框架解析 ...
Microsoft Agent Framework 接入DeepSeek的优雅姿势
一、前言 Microsoft Agent Framework 框架发布也有一阵子了,在观望(摸鱼)过后,也是果断(在老板的威胁下)将几个AI应用微服务完成了从Semantic Kernel 框架到Microsoft Agent Framework 框架中的迁移工作。 所以这篇文章,我想记录一下在 ...
2. AI 输出内容导出Word!docx4j+poi-tl 实现Markdown转Word全流程
1.简介 我们在上一章介绍了如果想实现将markdown内容转换为word的话, 如果想要转换后的word内容排版好看的话, 就需要将其转换过程分为两步 markdown→html html→ooxml(Office Open XML) word内容,word元信息本身就是个xml) 上一章节我们使 ...
读浪潮将至06技术浪潮特征
1. 技术浪潮 1.1. 俄乌冲突仍是一个里程碑式的事件,因为它凸显了训练相对不足的战斗力量如何利用消费市场上相对廉价的技术来进行快速组建和武装 1.2. 当技术能够带来如此显著的成本和战术优势时,它的扩散与广泛采用无疑将成为必然趋势 2. 固有特征 2.1. 技术的高度非对称性影响 2.1.1. ...
谷歌Agent Development Kit架构概览
宝子们,今天这个消息真的让我惊呆了!Google搞了个大动作,直接把AI的交互方式给改写了!以前AI都是等你把话说完才回应,现在不一样了,它能一边听你说话一边反应,还能被中途打断,甚至能和其他AI实时协作!这就是谷歌新出的Agent Development Kit(ADK),异步I/O、状态化会话、 ...
DeepCode:把论文和想法变成代码的 AI 工具
DeepCode 是香港大学开源的 AI 编码工具,通过多智能体协作实现论文转代码、需求转网站、描述转后端三大功能。采用 MIT 协议,已获 7900+ 星标。适合科研人员、独立开发者和技术学习者使用,能有效提升开发效率。 ...
吴恩达深度学习课程二: 改善深层神经网络 第一周:深度学习的实践(六)梯度现象和梯度检验
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第二课第一周的内容,1.10到1 ...
关于AI上下文工程重塑人机协作的 5 个颠覆性认知
关于AI上下文工程重塑人机协作的 5 个颠覆性认知 宝子们,AI界的大瓜来了!GAIR团队刚发布了Context Engineering 2.0,这可完全颠覆了我们对人机交互的认知。以前我们总想着怎么设计prompt,现在才发现,context才是关键! “一个人就是各种context的集合。”机器 ...
解密prompt系列63. Agent训练方案:RStar2 & Early Experience etc
当大模型成为Agent,我们该如何教会它“行动”?我们将看到一条演进路线:从优化单一动作(ReTool),到学习长程规划(RAGEN),再到提升思考质量本身(RStar2),最后到一种不依赖外部奖励的、更底层的经验内化方式(Early Experience)。 ...
读浪潮将至05更广泛的浪潮
1. 更广泛的浪潮 1.1. 技术浪潮并非一两种通用技术的简单叠加,而是大约同一时期涌现的众多技术的集群式体现 1.1.1. 以某种或多种通用技术为基础,但又远远超出这些通用技术的范畴 1.2. 通用技术扮演着催化剂的角色 1.2.1. 发明会激发新的发明 1.2.2. 技术浪潮为进一步的科学技术实 ...
AI时代的知识管理秘籍,吴恩达的RAG课必学
家人们,今天来给大家安利一个超宝藏的课程!吴恩达老师的《RAG原理》课程,就在他的AI学习平台上。虽然很多人只是用AI工具,但RAG真的太重要了,原理必须搞懂!就像我们用Google,但懂它怎么工作的,才能用得更溜。这个课程免费,每天一课,五天就能听完,超低投入。学完之后,自己做AI时代的个人知识管 ...



