不是告诉你选什么，而是教你如何做选择。

一、核心命题：私有化还是不上？

判断框架：三圈交集

        数据敏感度
           ◯
          ╱ ╲
         ╱   ╲
        ╱  ∩  ╲
       ╱       ╲
      ◯─────────◯
   用量规模    定制深度

郑天祺大约 16 分钟

大模型收费政策全景分析

产品经理视角：定价是产品，不是价格。

一、为什么豆包必须收费——产品经理的五个维度

1.1 背景：豆包是谁

豆包是字节旗下的大模型应用产品，基于云雀大模型（字节自研），2024年上线，主打C端对话场景，同时提供API服务。

关键数据（截至2026年中）：

日活：数千万级
定位：大众化AI助手，对标ChatGPT
技术底座：云雀大模型（字节自研，未完全开源）

郑天祺大约 15 分钟

如何让大模型输出稳定的 JSON：从踩坑到最佳实践

一、为什么大模型输出的 JSON 总"翻车"？

你是否有过这样的经历：

你：请返回一个 JSON 格式的用户信息
AI: 好的，这是你要的 JSON：
    ```json
    {
      "name": "张三",
      "age": 25
    }
    ```
    希望这对你有帮助！

郑天祺大约 11 分钟

模型微调面试详解：SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

大模型微调面试详解：SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

基模越来越强，微调还有没有必要？这篇文章从面试和工程落地角度，系统讲清楚 SFT、RLHF、RL、PPO、DPO 这些概念，以及基模变强后它们的破局点在哪里。

一、先说结论：微调没有消失，只是价值变了

基模越来越强，不是让 SFT、RLHF、RL 消失，而是让它们从"补能力"转向"控行为、控偏好、控成本、控风险"。

打个比方：基模就像一个越来越聪明的"通才大学生"，以前你需要手把手教他客服话术、报告格式、业务流程。但现在这个大学生自学能力极强，你给他一份说明书（Prompt），他就能干得不错。甚至你花三个月培训出来的"专才"，下一代基模一发布，直接就能追上。

郑天祺大约 38 分钟

Claude Code 大厂面试题汇总：源码泄露、Agent Loop、系统提示词、工具链、上下文管理、安全机制全拆解

一、Claude Code 源码是怎么泄露的？泄露了什么？

面试官常见问法： "你了解过 Claude Code 的源码泄露事件吗？从中学到了什么？"

泄露经过

2026年3月31日，有人发现 Claude Code 的 npm 包（v2.1.88）体积异常——59.8MB，比正常版本大了 10 倍。

生动例子：

郑天祺大约 25 分钟

RAG 实战：Document Loader 文档加载器详解

2026年RAG大厂面试题汇总：向量检索、混合检索、Rerank、幻觉处理高频问题与回答思路

一、RAG 是什么？为什么需要 RAG？

面试官常见问法： "为什么不让 LLM 直接回答，非要用 RAG？"或者"LLM 的知识截止问题你怎么解决？"

LLM 的三大知识缺陷

① 知识截止——训练数据有截止日期，昨天发生的事它不知道。你问它"2026年3月发布的 XX 框架有什么特性"，它要么瞎编要么说不知道。

② 私有数据无法触达——公司的内部文档、客户数据、业务规则，这些 LLM 从来没见过，直接问就是胡说。

郑天祺大约 23 分钟

Transformer 大厂面试题汇总：应用开发者视角

现在不管你投什么岗位，面试官都可能问一句：你了解 Transformer 吗？

很多录友的反应是："我又不训练模型，Transformer 和我有什么关系？"

关系大了。

你用的 Token 怎么计费的？
上下文窗口为什么有上限？
为什么模型会"忘记"前面的内容？
为什么长对话质量越来越差？
为什么 Prompt 结构化比大段文字效果好？

郑天祺大约 27 分钟

LangChain 1.0 完全指南：从入门到深入

适用人群： AI 应用开发者、LLM 工程师、后端开发者

背景

从混乱到秩序

2022 年，机器学习工程师 Harrison Chase 创建了 LangChain 开源项目，初衷是解决 LLM 应用开发中的"巴别塔困境"——OpenAI、Anthropic、Cohere 等厂商 API 格式各异，开发者需要为每个项目重复实现对话管理、提示模板、工具调用等基础设施，这些工作占据了 80% 的开发时间。

郑天祺大约 12 分钟

RAG 实战：Document Loader 文档加载器详解

一、前言

在 RAG（检索增强生成）架构中，Document Loader 文档加载器是整个链路的入口第一环。

核心作用：把本地文件、网页、数据库、知识库等各类异构数据源，统一解析为 RAG 标准的 Document 文档对象，为后续文本分割、向量化、向量入库、检索召回提供原始素材。

没有文档加载器，RAG 就无法接入外部私有知识库，也就失去了「私有数据增强大模型」的核心能力。

郑天祺大约 6 分钟

深入理解 AI Agent：从概念架构到工程实践

【进阶篇】深入理解 AI Agent：从概念架构到工程实践

前言

随着大语言模型（LLM）能力的快速跃升，AI Agent 已从理论概念走向规模化落地。它不再是简单的"问答机器"，而是能够感知环境、自主规划、调用工具、持续记忆、完成复杂任务的智能体系统。

本文将系统拆解 Agent 的核心概念组成、决策机制、典型应用场景，以及任务拆解方法论（CoT / ToT），同时深入讲解记忆模块设计与工具调用实现，帮助你从原理到实践全面掌握 Agent 工程。

一、Agent 的概念组成

郑天祺大约 12 分钟

跳转到:

企业私有化大模型方法论

一、核心命题：私有化还是不上？

判断框架：三圈交集

大模型收费政策全景分析

一、为什么豆包必须收费——产品经理的五个维度

1.1 背景：豆包是谁

如何让大模型输出稳定的 JSON：从踩坑到最佳实践

一、为什么大模型输出的 JSON 总"翻车"？

大模型微调面试详解：SFT、RLHF、DPO、PPO、强化学习和基模变强后的优化价值

一、先说结论：微调没有消失，只是价值变了

Claude Code 大厂面试题汇总：源码泄露、Agent Loop、系统提示词、工具链、上下文管理、安全机制全拆解

一、Claude Code 源码是怎么泄露的？泄露了什么？

泄露经过

2026年RAG大厂面试题汇总：向量检索、混合检索、Rerank、幻觉处理高频问题与回答思路

一、RAG 是什么？为什么需要 RAG？

LLM 的三大知识缺陷

Transformer 大厂面试题汇总：应用开发者视角

LangChain 1.0 完全指南：从入门到深入

背景

从混乱到秩序

RAG 实战：Document Loader 文档加载器详解

一、前言

【进阶篇】深入理解 AI Agent：从概念架构到工程实践

前言

一、Agent 的概念组成