Transformer 大厂面试题汇总:应用开发者视角
现在不管你投什么岗位,面试官都可能问一句:你了解 Transformer 吗?
很多录友的反应是:"我又不训练模型,Transformer 和我有什么关系?"
关系大了。
- 你用的 Token 怎么计费的?
- 上下文窗口为什么有上限?
- 为什么模型会"忘记"前面的内容?
- 为什么长对话质量越来越差?
- 为什么 Prompt 结构化比大段文字效果好?
大约 27 分钟
现在不管你投什么岗位,面试官都可能问一句:你了解 Transformer 吗?
很多录友的反应是:"我又不训练模型,Transformer 和我有什么关系?"
关系大了。