阿里春招之旅(五)

这是阿里云四面(总监面)的覆盘,一如二面的遭遇(别问,一问就是凉经-^-),却不知道能否有二面的好运气了。。。

这次的面试不长,只有50min,实在是被问题狂轰乱炸得不要不要的…
下面是这次面试内容的重难点:

  1. 分布式系统:如何使用分布式技术加快训练深度学习模型?调度器如何设计?
    加快DL模型训练过程具有很高的现实意义,可以从数据与模型以及分布式训练三个大方面考虑:数据方面,考虑样本下采样与特征下采样;模型方面,可以考虑减小复杂度,如模型压缩(剪枝)的方法;分布式技术方面,pytorch框架提供了分布式训练的接口(nn.distributedataparallel)。另外混合精度训练技术也可以加快DL模型的训练过程。
    参考资料:
    PyTorch分布式训练简明教程
    All Reduce
    混合精度训练-Pytorch
  2. 进程管理(OS):进程、线程和协程的联系与区别?进程调度策略?进程切换的实现细节是怎么样的?

结语
虽然我投的是算法岗,但是前辈并没有问算法细节,反而是通过你叙述项目的时候,找到需求点(比如:如何在大数据情况下,缩短DL模型训练时间),从而迁移到他所熟悉的领域(分布式存储与计算)。所以,可以知道了解目标部门的核心技术应该是这一面的突破点。

如果觉得不错,请素质三连哈~~
有疑问,欢迎评论、共同探讨-v-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章