1. 计算基础设施 1.1. 人工智能专家系统在20世纪70年代风靡一时 1.1.1. 基于规则的程序,目的是获取特定领域的专家知识 1.1.2. 每个专家系统都需要从领域专家处提取规则,并将其转化为特定的逻辑程序 1.1.3. 开发针对特定应用的专家系统不仅耗时长,而且需要投入大量人力 1.2. ...
介绍 (1) 发表:BuildingTrust'25 (2) 背景 尽管对多智能体 LLM 系统(MAS)的热情越来越多,但与单机准则框架相比,它们在流行的基准测试中的性能往往仍然很少。这一差距强调了系统地分析阻碍 MAS 有效性的挑战的必要性 (3) 贡献 对 MAS 执行轨迹进行了首次系统评估, ...
本文提出了一种无需额外训练的GUI定位框架DiMo-GUI,通过逐级缩放动态聚焦目标区域减少视觉冗余,并分离文本与图标模态独立推理后综合评估确定目标,有效平衡多模态能力。在基准测试中性能显著提升,适用于网页导航和移动应用自动化等场景。 ...
1. LangChain4J 理论概述 目录1. LangChain4J 理论概述最后: LangChain4J 的官方文档:https://docs.langchain4j.dev/ 中文文档地址:https://docs.langchain4j.info/ LangChain4j 的目标是简化将 ...
将 OWASP AI 测试指南落地:通过非人类身份治理构建安全的 AI 基础 人工智能(AI)正成为现代开发流水线中的核心组件。各行各业都面临着关于如何测试与保护 AI 系统的共同难题——必须同时考虑其复杂性、动态性以及引入的全新风险。全新的 OWASP AI 测试指南正是为了应对这一挑战而生。 这 ...
1. 高维数学 1.1. 数学作为人类最重要的智慧成果之一,有望帮助我们揭示大语言模型和人脑的运作奥秘 1.2. 深度学习网络是一种完全透明且可用数学方法分析的复杂数学函数 1.3. 当前,一个专注于探索这些网络模型在高维空间中的几何特性和统计性质的数学新纪元已经来临 1.4. 把各自领域推向一个由 ...
你是否也曾想过拥有一个自己的网站,却被复杂的技术术语和步骤吓退?今天,我要分享一个超简单的方法,只需要30分钟,零代码基础也能免费搭建一个属于自己的个人网站! 先搞懂两个核心工具:GitHub和Hexo 在开始动手前,咱们先来认识一下今天的两位主角:GitHub和Hexo。这两个工具就像一对黄金搭档 ...
在内容量大、更新快、长尾重的业务场景中,推荐系统要同时兼顾“眼下的即时兴趣”和“用户的稳定偏好”,并在一次请求内完成多路候选召回与融合,保证毫秒级延迟。 本文给出一套双向量用户兴趣 + 一次 SQL 多路召回的实践方案,数据库层使用 OceanBase 原生向量能力,结构化与向量同库,避免“两库同步... ...
前言 在之前的讨论中,讨论的都是线性回归,自变量与结果可以通过一条直线来解释。而今天讨论的问题,自变量与结果可能需要曲线来拟合,也就是所谓的 \(x^n\),n>=2 开始探索 老规矩,先运行起来,再探索原理 1. scikit-learn import numpy as np from sklea ...
1. 大语言模型的奇妙历程 1.1. 称其“奇妙”,源于它们展现出的非凡能力 1.2. 强调“探索”,因为我们尚未完全解析它们与人类对话的内在机制 1.3. 定义为“历程”,则是因为大语言模型的发展代表了一项重大技术突破 2. 语言模型 2.1. 传统语言学将语言视为符号处理问题,特别强调词序 ...
1. 智能、思维和意识 1.1. 亲社会行为 1.2. 人类本质上是社会性生物 1.3. 语言的进化并不是为了进行形式逻辑推理,而是一种生物适应机制,以促进人类之间的沟通与和谐共处,并最终推动了人类道德准则的形成和发展 1.4. 神经元不仅在观察他人动作时被激活,在自身需要完成相同动作时也会被激活 ...
背景 我们使用SAAM提示词,来自《基于AI互联网系统架构分析与评估》规划输出文档我们使用Auto模式,默认没有选模型2次迭代更新报告后,点击start now,根据架构改进建议,开始写代码自动生成行动清单,灰色是已经完成后任务。边分析代码边编写阶段任务完成后,形成如下报告。又开始第二阶段任务WeK ...
根据查询出的数据统计,截至2025年7月,全国通过的大模型备案家数为439家,如果算上7月份以及8月份不同省份公布的通过大模型备案的产品应该是再多出一些; 算法备案:4450条 大模型备案:439条 各省大模型登记:233条 数据更新时间:算法备案(截至2025年07月),大模型备案(截至2025年 ...
广州海珠 《广州市海珠区建设人工智能大模型应用示范区实施细则的通知》规定,自 2024 年 6 月 18 日起至 2027 年 3 月 20 日,大规模企业首次完成国家级生成式人工智能(大语言模型)上线备案的,可获得最高 100 万元一次性奖励。政策来源链接:https://www.gz.gov.c ...
介绍 (1) 发表:EMNLP'25 (2) 背景 高级 LLM 的正确翻译率较低,导致不同类型的执行错误。本文认为此问题的根本原因是 LLM 的预训练任务和代码翻译任务要求之间的差异。与自然语言不通,编程语言具有其他信息,这些信息表明了代码的执行状态,现有 LLM 仅学习代码的上下文语义,忽略了这 ...
微信自动化神器!用Trae+wxauto-mcp解放双手 你是否想象过,微信消息能自动收发?多个账号能一键管理?今天要给大家介绍的wxauto-mcp,就是这样一个能让微信自动化的神奇工具!它基于wxauto库开发,相当于给微信装了个「智能小助手」,帮你处理消息、节省时间~ ✨ 注意:这个工具 ...
1. 面对面测试 1.1. ChatGPT已经接受了用户数十亿次的“面对面测试”,而用户对其表现的评价也各不相同 1.2. LaMDA不仅能够理解社会概念,还具备心智理论建模能力,而后者被一些人认为是意识产生的关键 1.3. 作为对话伙伴,语言模型还称不上可靠 1.3.1. 它偶尔还会出现拼写错误 ...
零基础用Trae开发VS Code插件,其实很简单 先聊聊Trae:AI编程助手到底是什么? 不知道你有没有听说过Trae这个工具?简单来说,它就是一个能帮你写代码的AI助手。 想象一下:你只需要把需求说清楚,它就能自动生成完整的代码;遇到bug了,你直接问它,它还能帮你调试、修复,甚至自动写测试用 ...
项目演示视频: 15分钟速通yolo12,从环境搭建到推理图片,最后训练自己的数据集_哔哩哔哩_bilibili 1 环境搭建 1.1 python安装 python我们这里使用了3.10,python的下载地址:Python Release Python 3.10.11 | Python.or ...
代码搜索技术经历了由“文本匹配”到“语义检索”,再到“图索引”和“智能体搜索”的持续演进
尽管 LLM 上下文长度已有提升,但仍无法一次性处理整个代码库。 ...