AI
刷新
电商行业商品标题分词实践

博主头像 背景 词根是一个关键词里面最小的组合单位,不能再被进行任何拆分的一些属性词、名词等。所有关键词都是由词根组合而来的,但有些词本身就是一个关键词。商品标题拆词词根算法是电商领域优化搜索流量、提升标题效率的核心技术。其核心逻辑是通过自然语言处理(NLP)技术将标题拆解为最小不可分割的语义单元(词根),并 ...

DeepSeek-R1源码解读

最近和开发者做了很多DeepSeek-R1模型相关的推理项目,这两天抽时间把hugging face上面的源码拉下来仔细看了一遍,在这里做一个分享。主要是解析MOE部分的代码,包括EP并行的代码实现。 整体结构 查看hugging face上面的modeling_deepseek.py文件和conf ...

大模型VS小模型:论国产数据库运维AI Agent的正确打开方式

博主头像 作者:孙鹏,大衍(北京)科技有限公司研发工程师 首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注! 暴论:通用满血大模型“不适合”用于赋能国产数据库智能诊断运维 在传统数据库运 ...

【前端AI实践】DeepSeek:开源大模型的使用让开发过程不再抓头发

博主头像 有时候你可能正对着屏幕发呆,不知道怎么下手一个 Vue 的流式请求功能。这时候,DeepSeek 就像是你的“编程外挂”,帮你把模糊的需求变成清晰的代码。 下面我们就以几个常见的开发场景为例,看看 DeepSeek 能帮我们做点啥。 解答技术问题:SSE 流式请求怎么写? 假设你正在开发一个 AI ...

基于Trae编写文章实践

博主头像 自动补全编写段落# 实习生教学编程## AI编程 在过去,实习生们需要花费大量时间和精力来完成编程任务,这不仅浪费了他们的时间,也给他们的工作带来了压力。为了解决这个问题,我们开发了一个名为“AI编程”的工具,它可以帮助实习生们更高效地完成编程任务。我们先指导实习生们编写代码,然后再使用AI编程工具 ...

基于DeepSeek V3实现前端HTML5转换Vue.js工程实践

博主头像 背景以下是基于DeepSeek v3 0324版本实现前端HTML5转换Vue.js工程实践使用 Trae IDE编辑,之前Html是基于Readdy.ai生成,原始输入是UI设计图结论 我们基于Trae成功转换html到Vue.js工程。更多意义是:一、技术架构升级价值组件化开发范式跃迁Vue.j ...

不写代码,让 AI 生成手机 APP!保姆级教程

博主头像 你现在看到的 APP,是我完全用 AI 生成的,一行代码都没写!怎么做到的呢? 大家好,我是程序员鱼皮。AI 发展很快,现在随随便便就能生成一个网站,但是怎么纯用 AI 开发能在手机上运行的 APP 呢?网上基本上没有完整的教程。所以,我出手了,下面只用几分钟的时间,我会教大家如何利用 AI 生成 ...

如何分辨大模型的好坏?

博主头像 分辨大模型的好坏是一个多维度的问题,需要从技术能力、实际效果、安全性、成本和应用适配性等多个角度综合考量。以下是一些关键的评估维度和方法: 一、核心能力维度 1、基础能力: 语言理解与生成: 流畅度、语法准确性、上下文连贯性、能否理解复杂指令和隐含信息? 知识覆盖与准确性: 知识广度(涵盖多少领域? ...

AI 聊天应用的 10 条高级需求

博主头像 最新动态 GitHub 开源: https://github.com/experdot/pointer [MIT] 在深度使用了一段时间 Web 端和桌面端的 LLM 聊天工具后,我发现它们的用户体验普遍还有很大的提升空间。 下面是我总结的 10 个核心改进点。 1. 全局检索(Global Sea ...

人人都能“Aha” - 详解 DeepSeek 的“顿悟现象”

博主头像 作者:SpaderMan 在人工智能训练过程中,模型能力的跃迁往往并非线性提升,而是伴随着潜移默化的积累与突现的顿悟。本文以小模型为例,尝试通过强化学习探索 DeepSeek R1 中“顿悟现象”的再现与分析,揭示智能系统从量变到质变的过程。 实践目的 我们实践的目标包括: 探索语言模型在强化学习中 ...

面试精灵发布“媒体按键控制”功能:用耳机按键实现隐蔽式AI面试辅助

博主头像 引言 在面试的激烈竞争中,AI面试助手日益成为面试者的得力助手。在使用面试助手时,你是否曾在视频面试中因手动操作屏幕而暴露辅助工具的使用?是否因无法及时触发回答而错过最佳回应时机?是否担忧面试助手的隐蔽性而不敢使用? 如您所担忧的,各家面试助手和各面试平台之间,确实一直在面试工具的隐蔽性和检测工具之 ...

华为Ascend 910B部署Qwen2.5-VL-32B方案

博主头像 华为Ascend 910B部署Qwen2.5-VL-32B方案 目录一、多模态大模型——Qwen2.5-VL-32B1.1 简介1.2 显存测算1.2.1 Model Memory Calculator工具测算1.2.2 按模型参数量一般测算1.3 算力测算1.3.1 单 Token 理论计算量估算 ...

<1···222324···50>