跳至主要內容
如何让大模型输出稳定的 JSON:从踩坑到最佳实践

如何让大模型输出稳定的 JSON:从踩坑到最佳实践

一、为什么大模型输出的 JSON 总"翻车"?

你是否有过这样的经历:

你:请返回一个 JSON 格式的用户信息
AI: 好的,这是你要的 JSON:
    ```json
    {
      "name": "张三",
      "age": 25
    }
    ```
    希望这对你有帮助!

郑天祺大约 11 分钟大模型大模型JSON输出提示词工程
模型微调面试详解:SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

大模型微调面试详解:SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

基模越来越强,微调还有没有必要?这篇文章从面试和工程落地角度,系统讲清楚 SFT、RLHF、RL、PPO、DPO 这些概念,以及基模变强后它们的破局点在哪里。

一、先说结论:微调没有消失,只是价值变了

基模越来越强,不是让 SFT、RLHF、RL 消失,而是让它们从"补能力"转向"控行为、控偏好、控成本、控风险"。

打个比方:基模就像一个越来越聪明的"通才大学生",以前你需要手把手教他客服话术、报告格式、业务流程。但现在这个大学生自学能力极强,你给他一份说明书(Prompt),他就能干得不错。甚至你花三个月培训出来的"专才",下一代基模一发布,直接就能追上。


郑天祺大约 38 分钟大模型大模型模型微调SFTRLHF面试
Claude Code 大厂面试题汇总:源码泄露、Agent Loop、系统提示词、工具链、上下文管理、安全机制全拆解

Claude Code 大厂面试题汇总:源码泄露、Agent Loop、系统提示词、工具链、上下文管理、安全机制全拆解

一、Claude Code 源码是怎么泄露的?泄露了什么?

面试官常见问法: "你了解过 Claude Code 的源码泄露事件吗?从中学到了什么?"

泄露经过

2026年3月31日,有人发现 Claude Code 的 npm 包(v2.1.88)体积异常——59.8MB,比正常版本大了 10 倍。

生动例子:


郑天祺大约 25 分钟大模型ClaudeCode大模型面试
RAG 实战:Document Loader 文档加载器详解

2026年RAG大厂面试题汇总:向量检索、混合检索、Rerank、幻觉处理高频问题与回答思路

一、RAG 是什么?为什么需要 RAG?

面试官常见问法: "为什么不让 LLM 直接回答,非要用 RAG?"或者"LLM 的知识截止问题你怎么解决?"

LLM 的三大知识缺陷

① 知识截止——训练数据有截止日期,昨天发生的事它不知道。你问它"2026年3月发布的 XX 框架有什么特性",它要么瞎编要么说不知道。

② 私有数据无法触达——公司的内部文档、客户数据、业务规则,这些 LLM 从来没见过,直接问就是胡说。


郑天祺大约 23 分钟大模型RAG大模型面试向量检索
Transformer 大厂面试题汇总:应用开发者视角

Transformer 大厂面试题汇总:应用开发者视角

现在不管你投什么岗位,面试官都可能问一句:你了解 Transformer 吗?

很多录友的反应是:"我又不训练模型,Transformer 和我有什么关系?"

关系大了。

  • 你用的 Token 怎么计费的?
  • 上下文窗口为什么有上限?
  • 为什么模型会"忘记"前面的内容?
  • 为什么长对话质量越来越差?
  • 为什么 Prompt 结构化比大段文字效果好?

郑天祺大约 27 分钟大模型Transformer大模型面试
LangChain 1.0 完全指南:从入门到深入

LangChain 1.0 完全指南:从入门到深入

适用人群: AI 应用开发者、LLM 工程师、后端开发者

背景

从混乱到秩序

2022 年,机器学习工程师 Harrison Chase 创建了 LangChain 开源项目,初衷是解决 LLM 应用开发中的"巴别塔困境"——OpenAI、Anthropic、Cohere 等厂商 API 格式各异,开发者需要为每个项目重复实现对话管理、提示模板、工具调用等基础设施,这些工作占据了 80% 的开发时间。


郑天祺大约 12 分钟大模型LangChain大模型AI框架
RAG 实战:Document Loader 文档加载器详解

RAG 实战:Document Loader 文档加载器详解

一、前言

在 RAG(检索增强生成)架构中,Document Loader 文档加载器是整个链路的入口第一环

核心作用:把本地文件、网页、数据库、知识库等各类异构数据源,统一解析为 RAG 标准的 Document 文档对象,为后续文本分割、向量化、向量入库、检索召回提供原始素材。

没有文档加载器,RAG 就无法接入外部私有知识库,也就失去了「私有数据增强大模型」的核心能力。


郑天祺大约 6 分钟大模型RAG大模型文档加载
提示词工程从入门到精通:解锁大模型的“沟通密码”

提示词工程从入门到精通:解锁大模型的“沟通密码”

你有没有过这样的经历?给大模型发一句“写一篇文案”,得到的结果平平无奇;但换一种说法,它却能产出惊艳的内容——这背后,藏着提示词工程的魔力。

提示词工程(Prompt Engineering)不是“玄学”,而是一门“和大模型高效对话的方法论”。就像我们跟不同的人沟通需要调整语气、话术一样,面对大模型,好的提示词能让它精准get你的需求,无需修改模型参数,就能解锁其80%以上的能力。

这篇博客将从“新手入门”到“高手精通”,用最通俗的语言+可直接复制的示例,带你吃透提示词工程,让大模型成为你的“得力助手”,而非“无效工具”。


郑天祺大约 11 分钟大模型提示词
构建 ReAct+RAG 智能体:从零打造个性化数字人 Demo

构建 ReAct+RAG 智能体:从零打造个性化数字人 Demo

前言

在大模型技术迅猛发展的今天,单纯依赖 LLM 的参数知识已无法满足复杂业务场景的需求。ReAct(Reasoning + Acting) 赋予模型动态推理与行动能力,RAG(Retrieval-Augmented Generation) 解决知识实时性与准确性问题,而个性化数字人则将二者融合,为用户提供拥有特定角色设定、记忆与知识体系的 AI 助手。

本文将带你从零开始,构建一个集 ReAct 推理框架 + RAG 知识检索 + 个性化角色记忆 于一体的数字人 Demo,代码可直接运行。


郑天祺大约 13 分钟大模型ReActRAGAI Agent
深入理解 AI Agent:从概念架构到工程实践

【进阶篇】深入理解 AI Agent:从概念架构到工程实践


前言

随着大语言模型(LLM)能力的快速跃升,AI Agent 已从理论概念走向规模化落地。它不再是简单的"问答机器",而是能够感知环境、自主规划、调用工具、持续记忆、完成复杂任务的智能体系统。

本文将系统拆解 Agent 的核心概念组成、决策机制、典型应用场景,以及任务拆解方法论(CoT / ToT),同时深入讲解记忆模块设计与工具调用实现,帮助你从原理到实践全面掌握 Agent 工程。


一、Agent 的概念组成


郑天祺大约 12 分钟大模型AI Agent大模型架构设计
2