0

Kthena + vLLM-Ascend:云原生大模型推理的编排与调度实践

云原生技术与AI基础设施深度融合,大模型在 Kubernetes 上的生产级部署成为行业当前核心课题。在千亿参数模型普及的今天,单机显存已无法承载,TP(张量并行)与 PP(流水线并行)成为标配。然而,这种分布式范式的转变,使得习惯于处理无状态微服务的 Kubernetes 原生工作负载抽象(如 D ...

华为云开发者联盟 发布于 2026-04-03 16:06 评论(0) 阅读(0)
0

标书智能体(四)——提示词顺序优化,让缓存命中,输入成本直降10倍

用 Python + React 打造一个开源的 AI 写标书智能体~ 完整代码已开源。 代码很多,文章只放主要代码和提示词,完整代码可以查看开源项目。 Github: https://github.com/FB208/yibiao-simple Gitee: https://gitee.com/y ...

易标AI 发布于 2026-04-03 15:19 评论(0) 阅读(54)
0

一文吃透 Spring AI Alibaba + MCP:服务端搭建 + 客户端调用全流程

掌握 Spring AI Alibaba 与 MCP 协议实战教程!本文详解 MCP 服务端搭建、客户端配置,教你封装本地工具为 MCP 服务,实现大模型安全调用外部接口,附完整代码与测试步骤,快速打通 AI 工具调用链路! ...

LucaJu 发布于 2026-04-03 14:07 评论(0) 阅读(121)
1

Vscode 中 python模块的导入问题

VSCode配置PYTHONPATH解决Python模块导入问题 问题描述 在使用VSCode开发Python项目时,经常会遇到模块导入错误的问题。当项目结构较为复杂,包含多个层级的目录时,Python解释器可能无法正确找到自定义模块,导致ModuleNotFoundError或ImportErro ...

黑心老魔 发布于 2026-04-03 13:59 评论(0) 阅读(53)
0

JetBrains 发布全新 AI IDE:AIR,会不会改变开发方式?

当“AI 辅助编程”从一个可选功能,变成开发工具的核心逻辑,IDE 会变成什么样? 最近 JetBrains 推出的 AIR(AI IDE),给出了一个比较激进的答案:不是在 IDE 里加 AI,而是让 AI 成为 IDE 的基础能力。 这篇文章结合实际开发体验和一些思考,聊一聊 AIR 到底是什么 ...

程序员小崔日记 发布于 2026-04-03 12:43 评论(1) 阅读(241)
1

斯坦福这篇论文,治好了我的 AI 焦虑

斯坦福 Meta-Harness 论文的核心发现是:不改模型权重,仅优化 Harness(状态管理、错误恢复、评估机制等工程系统),性能可拉开 5-6 倍差距。这意味着让 AI 变强,更多是工程问题而非认知问题。AI 产业正分化为三层:大模型本体(大厂战场)、通用 Harness(工程师黄金位)、个... ...

林子里的风 发布于 2026-04-03 11:54 评论(2) 阅读(244)
0

一文解锁 JuiceFS 在 AI 场景中的性能优化

大模型训练的算力规模持续扩张,GPU 算力不断提升的同时,数据访问瓶颈对系统整体性能的影响愈发突出。本地存储性能优异但扩展性有限,对象存储在成本与扩展性上具备优势,却在海量小文件、高并发场景下面临吞吐不足的问题,团队往往需要在二者之间艰难取舍。 为此,分布式文件系统成为平衡高性能与可扩展性的关键方案 ...

JuiceFS 发布于 2026-04-03 11:38 评论(0) 阅读(52)
2

周边店上新!博客园淘宝店上架机械键盘

自从2024年推出博客园周边店,小小的破店一直有个很大的想法,要在店里摆上众多开发者必备的高上大商品——机械键盘。 想要易,落地难, 前两年由于没有找到合适的合作厂商,这个想法一直没能落地。 但我们没有放弃,今年终于将想法变成现实,第一款 机械键盘 于3月31日在博客园淘宝店上架! 根据规格不同,售 ...

博客园团队 发布于 2026-04-03 11:22 评论(3) 阅读(403)
0

AI开发-python-langchain框架(3-19-智能问答-保留会话历史)

基于RunnableWithMessageHistory实现多会话隔离与持久化记忆 在构建LLM对话应用时,多会话隔离与对话历史持久化是从demo走向生产级的关键。本文基于ReAct智能体实践,拆解RunnableWithMessageHistory的会话隔离实现,及可扩展的数据库持久化方案,助力快 ...

万笑佛 发布于 2026-04-03 11:02 评论(0) 阅读(57)
0

Bun.js探索超快全能工具链,为何被越来越多大厂及前端开发者使用

今天不搞虚的,就跟大家唠唠一个最近特别火的工具——Bun。尤其是那些对启动速度、交互体验、工程统一性要求极高的项目,为啥都开始认真选它 ...

ayuday 发布于 2026-04-03 10:36 评论(1) 阅读(136)
0

从 CLI 调用到 SDK 集成:GitHub Copilot 在 .NET 项目中的最佳实践

从 CLI 调用到 SDK 集成:GitHub Copilot 在 .NET 项目中的最佳实践 从命令行调用到官方 SDK 集成的升级之路,说起来也算是一段经历,今天就分享我们在 HagiCode 项目中踩过的坑和学到的东西。 背景 GitHub Copilot SDK 在 2025 年正式发布后, ...

Newbe36524 发布于 2026-04-03 10:02 评论(0) 阅读(115)
1

AI价值:理性评估三维度

最近,我经常去参加一些企业的技术选型评审会。在会上,我发现了一个极其普遍且有些滑稽的现象:不管是做电商的、做SaaS的还是搞传统制造的,大家PPT里的AI规划永远指向同一个终局--“预计明年替代X个人力,降低Y%的成本”。 每当这时候,我都想按下暂停键,像个老教授一样敲敲黑板:“各位,如果咱们花大价 ...

wang_yb 发布于 2026-04-03 09:56 评论(2) 阅读(104)
0

MySQL 数据库日志总结(二)

日志信息滚动切割 在应用binlog日志过程中,经常需要对日志文件进行日志切割(滚动更新),可以有效避免日志文件数据量过大问题; 在某些场景中,如果需要对binlog日志文件进行备份操作时,也可以对原有使用的binlog日志文件进行滚动更新; 常用的日志滚动更新方法: # 方法一: mysql> f ...

讲文张字 发布于 2026-04-03 09:43 评论(0) 阅读(71)
0

SpringCloud进阶--Redis与分布式

Redis与分布式 Redis是一个基于内存的高性能数据库! 主从复制 主从复制:将一台Redis服务器的数据复制到其他Redis服务器,前者是主节点(Master),后者是从节点(Slave),数据的复制是单向的,只能从主节点到从节点。Master以写为主,Slave以读为主。 这样的好处有: 实 ...

NE_STOP 发布于 2026-04-03 09:40 评论(0) 阅读(62)
2

写了10年代码的人,在AI编程时代反而最值钱

AI 编程工具(Claude Code / Cursor)每次都从零写代码,因为它们不知道你已有的成熟模块。本文以一个维护10年的 C++ 流媒体技术栈(26模块、10万行代码)为案例,分析了 AI 时代"成熟模块"为什么比"会用 AI"更值钱,并介绍了一种让 AI "从八十分开始"的思路。 ...

海滨code 发布于 2026-04-03 09:18 评论(3) 阅读(368)
1

用300行代码手写Spring核心原理

本文将带你深入了解Spring框架的核心原理,通过300行代码的迷你版本来展示Spring最核心的特性:IoC(控制反转)、DI(依赖注入)和MVC(模型-视图-控制器)模式的实现。 mini版Spring实现思路 实现过程 自定义注解 在Spring框架中,注解是非常重要的组成部分。我们的迷你版也 ...

程序员Seven 发布于 2026-04-03 09:00 评论(0) 阅读(121)
4

.NET 高级开发 | 配置系统原理、实现一个配置中心

目录配置和选项配置(Configuration)读取配置配置拦截配置优先级选项(Options)实现自定义配置提供器实现配置中心 配置和选项 ASP.NET Core 模板项目下会有 appsettings.json、appsettings.Development.json 两个配置文件,我们可以通 ...

痴者工良 发布于 2026-04-03 08:51 评论(0) 阅读(495)
1

电子小白之电感:通过无线充电带你彻底搞懂电感

一个让电流“慢下来”的神奇元件 如果你曾经用过无线充电器,一定有过这样的体验:手机放上去,不需要插线,电量就开始增加了。这背后究竟是怎么做到的?答案就藏在一个叫电感的电子元件里。 很多人觉得电感很抽象,不好理解。今天,我们就用无线充电这个鲜活的例子,把电感这个“隐形高手”彻底讲明白。 一、电感是什么 ...

Tlink 发布于 2026-04-03 08:43 评论(0) 阅读(138)
1

Microsoft Agent Framework 1.0 正式发布:Agent Skills 补齐后,.NET AI Agent 开发真正进入工程化时代

Microsoft Agent Framework 1.0 正式发布:Agent Skills 补齐后,Agent 开发真正进入工程化时代 如果你最近在关注微软的 AI Agent 技术栈,这次发布值得认真看。 Microsoft Agent Framework .NET 1.0.0 正式上线。 这 ...

「圣杰」 发布于 2026-04-03 08:34 评论(1) 阅读(332)
1

自动生成用例:基于OCR+ LLM的设计方案(附落地指南)

当产品经理甩过来一份50页的需求文档,要求"这周把测试用例写完"时,你会怎么做?手动复制粘贴到Excel?还是让AI直接读图生成用例? 随着AI技术的普及,OCR(光学字符识别)与LLM(大语言模型)的结合,彻底打破了“手写用例”的效率瓶颈。今天给大家分享一套可落地的《自动生成用例:基于OCR+ L ...

狂师 发布于 2026-04-03 08:32 评论(0) 阅读(180)