一、为什么大模型输出的 JSON 总"翻车"？

你是否有过这样的经历：

你：请返回一个 JSON 格式的用户信息
AI: 好的，这是你要的 JSON：
    ```json
    {
      "name": "张三",
      "age": 25
    }
    ```
    希望这对你有帮助！

郑天祺大约 11 分钟

模型微调面试详解：SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

大模型微调面试详解：SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

基模越来越强，微调还有没有必要？这篇文章从面试和工程落地角度，系统讲清楚 SFT、RLHF、RL、PPO、DPO 这些概念，以及基模变强后它们的破局点在哪里。

一、先说结论：微调没有消失，只是价值变了

基模越来越强，不是让 SFT、RLHF、RL 消失，而是让它们从"补能力"转向"控行为、控偏好、控成本、控风险"。

打个比方：基模就像一个越来越聪明的"通才大学生"，以前你需要手把手教他客服话术、报告格式、业务流程。但现在这个大学生自学能力极强，你给他一份说明书（Prompt），他就能干得不错。甚至你花三个月培训出来的"专才"，下一代基模一发布，直接就能追上。

郑天祺大约 38 分钟

Claude Code 大厂面试题汇总：源码泄露、Agent Loop、系统提示词、工具链、上下文管理、安全机制全拆解

一、Claude Code 源码是怎么泄露的？泄露了什么？

面试官常见问法： "你了解过 Claude Code 的源码泄露事件吗？从中学到了什么？"

泄露经过

2026年3月31日，有人发现 Claude Code 的 npm 包（v2.1.88）体积异常——59.8MB，比正常版本大了 10 倍。

生动例子：

郑天祺大约 25 分钟

RAG 实战：Document Loader 文档加载器详解

2026年RAG大厂面试题汇总：向量检索、混合检索、Rerank、幻觉处理高频问题与回答思路

一、RAG 是什么？为什么需要 RAG？

面试官常见问法： "为什么不让 LLM 直接回答，非要用 RAG？"或者"LLM 的知识截止问题你怎么解决？"

LLM 的三大知识缺陷

① 知识截止——训练数据有截止日期，昨天发生的事它不知道。你问它"2026年3月发布的 XX 框架有什么特性"，它要么瞎编要么说不知道。

② 私有数据无法触达——公司的内部文档、客户数据、业务规则，这些 LLM 从来没见过，直接问就是胡说。

郑天祺大约 23 分钟

Transformer 大厂面试题汇总：应用开发者视角

现在不管你投什么岗位，面试官都可能问一句：你了解 Transformer 吗？

很多录友的反应是："我又不训练模型，Transformer 和我有什么关系？"

关系大了。

你用的 Token 怎么计费的？
上下文窗口为什么有上限？
为什么模型会"忘记"前面的内容？
为什么长对话质量越来越差？
为什么 Prompt 结构化比大段文字效果好？

郑天祺大约 27 分钟

LangChain 1.0 完全指南：从入门到深入

适用人群： AI 应用开发者、LLM 工程师、后端开发者

背景

从混乱到秩序

2022 年，机器学习工程师 Harrison Chase 创建了 LangChain 开源项目，初衷是解决 LLM 应用开发中的"巴别塔困境"——OpenAI、Anthropic、Cohere 等厂商 API 格式各异，开发者需要为每个项目重复实现对话管理、提示模板、工具调用等基础设施，这些工作占据了 80% 的开发时间。

郑天祺大约 12 分钟

RAG 实战：Document Loader 文档加载器详解

一、前言

在 RAG（检索增强生成）架构中，Document Loader 文档加载器是整个链路的入口第一环。

核心作用：把本地文件、网页、数据库、知识库等各类异构数据源，统一解析为 RAG 标准的 Document 文档对象，为后续文本分割、向量化、向量入库、检索召回提供原始素材。

没有文档加载器，RAG 就无法接入外部私有知识库，也就失去了「私有数据增强大模型」的核心能力。

郑天祺大约 6 分钟

提示词工程从入门到精通：解锁大模型的“沟通密码”

你有没有过这样的经历？给大模型发一句“写一篇文案”，得到的结果平平无奇；但换一种说法，它却能产出惊艳的内容——这背后，藏着提示词工程的魔力。

提示词工程（Prompt Engineering）不是“玄学”，而是一门“和大模型高效对话的方法论”。就像我们跟不同的人沟通需要调整语气、话术一样，面对大模型，好的提示词能让它精准get你的需求，无需修改模型参数，就能解锁其80%以上的能力。

这篇博客将从“新手入门”到“高手精通”，用最通俗的语言+可直接复制的示例，带你吃透提示词工程，让大模型成为你的“得力助手”，而非“无效工具”。

郑天祺大约 11 分钟

构建 ReAct+RAG 智能体：从零打造个性化数字人 Demo

前言

在大模型技术迅猛发展的今天，单纯依赖 LLM 的参数知识已无法满足复杂业务场景的需求。ReAct（Reasoning + Acting） 赋予模型动态推理与行动能力，RAG（Retrieval-Augmented Generation） 解决知识实时性与准确性问题，而个性化数字人则将二者融合，为用户提供拥有特定角色设定、记忆与知识体系的 AI 助手。

本文将带你从零开始，构建一个集 ReAct 推理框架 + RAG 知识检索 + 个性化角色记忆 于一体的数字人 Demo，代码可直接运行。

郑天祺大约 13 分钟

深入理解 AI Agent：从概念架构到工程实践

【进阶篇】深入理解 AI Agent：从概念架构到工程实践

前言

随着大语言模型（LLM）能力的快速跃升，AI Agent 已从理论概念走向规模化落地。它不再是简单的"问答机器"，而是能够感知环境、自主规划、调用工具、持续记忆、完成复杂任务的智能体系统。

本文将系统拆解 Agent 的核心概念组成、决策机制、典型应用场景，以及任务拆解方法论（CoT / ToT），同时深入讲解记忆模块设计与工具调用实现，帮助你从原理到实践全面掌握 Agent 工程。

一、Agent 的概念组成

郑天祺大约 12 分钟

跳转到:

如何让大模型输出稳定的 JSON：从踩坑到最佳实践

一、为什么大模型输出的 JSON 总"翻车"？

大模型微调面试详解：SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

一、先说结论：微调没有消失，只是价值变了

Claude Code 大厂面试题汇总：源码泄露、Agent Loop、系统提示词、工具链、上下文管理、安全机制全拆解

一、Claude Code 源码是怎么泄露的？泄露了什么？

泄露经过

2026年RAG大厂面试题汇总：向量检索、混合检索、Rerank、幻觉处理高频问题与回答思路

一、RAG 是什么？为什么需要 RAG？

LLM 的三大知识缺陷

Transformer 大厂面试题汇总：应用开发者视角

LangChain 1.0 完全指南：从入门到深入

背景

从混乱到秩序

RAG 实战：Document Loader 文档加载器详解

一、前言

提示词工程从入门到精通：解锁大模型的“沟通密码”

构建 ReAct+RAG 智能体：从零打造个性化数字人 Demo

前言

【进阶篇】深入理解 AI Agent：从概念架构到工程实践

前言

一、Agent 的概念组成