前言 在之前的讨论中,讨论的都是线性回归,自变量与结果可以通过一条直线来解释。而今天讨论的问题,自变量与结果可能需要曲线来拟合,也就是所谓的 \(x^n\),n>=2 开始探索 老规矩,先运行起来,再探索原理 1. scikit-learn import numpy as np from sklea ...
1. 大语言模型的奇妙历程 1.1. 称其“奇妙”,源于它们展现出的非凡能力 1.2. 强调“探索”,因为我们尚未完全解析它们与人类对话的内在机制 1.3. 定义为“历程”,则是因为大语言模型的发展代表了一项重大技术突破 2. 语言模型 2.1. 传统语言学将语言视为符号处理问题,特别强调词序 ...
1. 智能、思维和意识 1.1. 亲社会行为 1.2. 人类本质上是社会性生物 1.3. 语言的进化并不是为了进行形式逻辑推理,而是一种生物适应机制,以促进人类之间的沟通与和谐共处,并最终推动了人类道德准则的形成和发展 1.4. 神经元不仅在观察他人动作时被激活,在自身需要完成相同动作时也会被激活 ...
背景 我们使用SAAM提示词,来自《基于AI互联网系统架构分析与评估》规划输出文档我们使用Auto模式,默认没有选模型2次迭代更新报告后,点击start now,根据架构改进建议,开始写代码自动生成行动清单,灰色是已经完成后任务。边分析代码边编写阶段任务完成后,形成如下报告。又开始第二阶段任务WeK ...
介绍 (1) 发表:EMNLP'25 (2) 背景 高级 LLM 的正确翻译率较低,导致不同类型的执行错误。本文认为此问题的根本原因是 LLM 的预训练任务和代码翻译任务要求之间的差异。与自然语言不通,编程语言具有其他信息,这些信息表明了代码的执行状态,现有 LLM 仅学习代码的上下文语义,忽略了这 ...
微信自动化神器!用Trae+wxauto-mcp解放双手 你是否想象过,微信消息能自动收发?多个账号能一键管理?今天要给大家介绍的wxauto-mcp,就是这样一个能让微信自动化的神奇工具!它基于wxauto库开发,相当于给微信装了个「智能小助手」,帮你处理消息、节省时间~ ✨ 注意:这个工具 ...
1. 面对面测试 1.1. ChatGPT已经接受了用户数十亿次的“面对面测试”,而用户对其表现的评价也各不相同 1.2. LaMDA不仅能够理解社会概念,还具备心智理论建模能力,而后者被一些人认为是意识产生的关键 1.3. 作为对话伙伴,语言模型还称不上可靠 1.3.1. 它偶尔还会出现拼写错误 ...
零基础用Trae开发VS Code插件,其实很简单 先聊聊Trae:AI编程助手到底是什么? 不知道你有没有听说过Trae这个工具?简单来说,它就是一个能帮你写代码的AI助手。 想象一下:你只需要把需求说清楚,它就能自动生成完整的代码;遇到bug了,你直接问它,它还能帮你调试、修复,甚至自动写测试用 ...
项目演示视频: 15分钟速通yolo12,从环境搭建到推理图片,最后训练自己的数据集_哔哩哔哩_bilibili 1 环境搭建 1.1 python安装 python我们这里使用了3.10,python的下载地址:Python Release Python 3.10.11 | Python.or ...
代码搜索技术经历了由“文本匹配”到“语义检索”,再到“图索引”和“智能体搜索”的持续演进
尽管 LLM 上下文长度已有提升,但仍无法一次性处理整个代码库。 ...
前言 今天我们来讨论一下回归算法当中的数学实现。本人数学也是渣,大学时期概率论一直挂到清考才勉强通过,+_+ !!,如今勇闯机器学习,硬着头皮重新学习了微积分和线代,也是为了记录自己最近的状态,避免过段时间忘记了。描述的时候有不周全的地方,请各位大佬们多担待了 本节将会运用一些数学知识来解释一下相关 ...
NoteGen —— 一款跨平台的 Markdown 笔记应用,致力于使用 AI 建立记录和写作的桥梁,将碎片化知识整理成一篇可读的笔记。 ...
1. 法律 1.1. 法律研究:大语言模型能够快速处理和分析海量法律文献,包括案例、法规和规章制度等,显著提升传统法律研究的效率 1.2. 合同处理:在合同分析和起草方面,大语言模型可以帮助识别存在问题的条款,提供措辞建议,并确保内容符合法律法规要求 1.2.1. 还能生成常见法律文书的初稿,为律师 ...
背景 过去笔者写过关于系统设计原则回顾的文章,今天我们让GPT5帮助分析现有项目架构评估,选用工程项目是WeKnora 是腾讯(Tencent)企业级知识库管理系统. 在Code Buddy IDE 选择GPT5模型,Craft模式。提示词"基于以下26条互联网系统架构设计原则,对当前工程输出系统进 ...
1. GPT 1.1. generative pretrained transformer,即“生成式预训练变换模型” 1.2. “生成式”表明大语言模型不只是像普通深度学习网络那样输出简单的标签,而是能够逐词生成文本内容 1.2.1. 这类模型也常被称为聊天机器人 1.3. “预训练”意味着模型 ...
背景在网络上看到某公司岗位招聘要求:“精通敏捷开发,有将项目延期率压降至10%以内的可验证成果。”今天我们让AI来帮助解答下,大家看下,其实这个要求也是有上下文的。GLM 4.5DeepSeek不连网Qwen3深入研究doubao 1.6 研究报告KIMI-K2Grok V4Gemini 2.5 P ...
前言 书接上文,上一小节简单介绍了多元回归的基本原理、使用方式,本小节来实践:qps与cpu、内存、磁盘io、网络io之间的关系 获取数据 参考一元线性回归的获取方式 from flow import * from datetime import datetime start_time = date ...
1. 导论 1.1. 自2022年ChatGPT惊艳问世以来,大语言模型领域的发展可谓日新月异 1.1.1. 震惊世界的DeepSeek,以及百度的文心大模型、阿里巴巴的Qwen大模型等 1.2. OpenAI于2022年11月面向公众发布了ChatGPT。ChatGPT是一种新型的AI(人工智能) ...
背景 WeKnora 是腾讯(Tencent)开发的一套企业级知识库管理系统,主要用于构建和管理基于大语言模型(LLM)的知识增强应用。从代码结构和功能实现来看,这是一个功能完备的知识管理服务平台,具有以下核心特点:核心功能多源知识导入支持从文件上传(PDF、TXT、DOCX、Markdown等文档 ...
单一的向量近似最近邻查询,往往并不能满足实际业务的需求。用户通常都需要在向量检索中联合标量条件进行过滤,例如数据产生时间,知识库id等。还有一类需求是将全文或者多路向量索引查询的结果进行融合排序。本文解读OceanBase向量索引混合查询的原理和使用,以及产品规划。 ...