大模型从零开始(三) 蒙混过关

阅读提示/免责声明

🤐实际上,本文最开始是面经分享,但是实际上基本都是个人项目相关内容,脱敏后等于所剩无几了。所以就改成随便写写经验,或者说感受了。
🕊️本文涉及的所有内容均来自于作者个人体验,如有不符,纯属林子大了什么鸟都有。选择大于努力,坚定守住,就有办法。

选岗

由于各家公司会起各种乱七八糟天花乱坠的名字来招聘,那么大多数时候还是需要根据 JD 具体情况具体分析,以下仅介绍一些普遍情况:

笔试

一般情况下,是大杂烩选择题(机器学习、深度学习/大模型、数据结构、线性代数等)和算法题,对于大模型算法,基本必定包含一道模拟传统机器学习相关的题目(numpy)。
不过笔试基本不会卡很严格,本人基本很少写对那道机器学习模拟的题目,印象里也没有挂过笔试。业务部门的逻辑一般还是看简历,笔试达到公司的基本及格线就行了。

技术面

  1. 最重要的还是项目,项目有的聊才能控制在候选人的舒适区,否则问八股和场景题(尤其是场景题)就很折磨且很容易挂了。
  2. 手撕代码除了个别厂以外,熟练掌握 hot100 就够用了,非数据结构算法题以外基本只需要熟悉 self-attention 及其各种常用变体。当然,在越来越卷的大环境下,被考到了 shuffle 实现、蓄水池采样、RoPE、GRPO Loss 之类的也不要奇怪。
  3. 如果面试官开始就介绍了自己部门的业务,在没话聊/最后反问的时候可以把自己的经历往他们部门业务上面套,讨论一些普遍存在但是没有万能解法的问题。
  4. 能够用尽可能精简的语言让一个完全不懂的人快速理解自己项目的场景和可能存在的难点。
  5. 想清楚为什么要做这个场景,虽然这一般不是你能决定的。
  6. 想清楚为什么这个场景需要引入大模型。
  7. 想清楚为什么选择了这个/这些大模型。
  8. 想清楚为什么要用监督微调,为什么要用 RL。
  9. 想清楚结果涨点的原因,熟悉自己的结果评测方案。
  10. 准备至少两篇最新的论文(最好不是机器之心量子位新智元在头条发过的),能够快速讲出 reasonable 的创新点。
  11. 熟悉热门大模型的底层架构及设计理念。
  12. 尽可能把面试比较密集地安排,以战养战是上上策。

HR 面/大老板面

  1. 真诚谦逊皮实乐观是必杀技。
  2. 能够通俗地讲清楚项目干了啥,怎么解决难点的。
  3. 职业规划/实习想获得什么,尽可能和部门的业务 match 一些。
  4. 想清楚不垂直经历怎么解释(例如非科班、开发转算法)。
  5. 传统问题准备一下,优缺点、最大困难及解决、兴趣爱好。
  6. 反问团队构成,包括但不限于纯算法组/算法同学占比、校招生/正式工/实习生比例等。
  7. 不建议询问工作强度,问了也没用还留个婉拒奋斗的坏印象。
  8. 自我介绍相比技术面可以偏多元一点。
  9. 想清楚为什么不走学术路线/坚定走这个技术方向。
  10. 通过之前面试反问提前了解岗位 base 地,规避踩雷。
  11. 有在等其它心仪 offer 流程的情况下不建议反问出结果时间,对面可能理解为在催流程。



正在加载今日诗词....

📌 Powered by Obsidian Digital Garden and Vercel
载入天数...载入时分秒...