Shopee Tech Ops MRE(Machine Reliabilitiy Engineering)是SRE的一个横向细分领域。MRE的使命是确保Shopee 基础设施和操作系统层面24/7的高效和可持续性运转,从容量、成本和效能出发,组建和维护海量集群,为SRE和业务部门提供可持续发展的基础设施资源以及稳定高效的OS能力支撑服务。通过工程化和服务化手段来优化传统运维模式中低效,繁复的操作,并建设高效的资源供给生产线。

岗位描述:

  • 针对业务需求对 Linux Kernel 定制开发、稳定性改进、维护更新;
  • 结合各类业务特点对服务器硬件和 Linux 内核进行性能调优;
  • 负责与Linux Kernel相关的前沿新技术的研究和应用

岗位要求:

  • 全日制本科,5年以上相关工作经验;
  • 精通Linux内核,至少阅读过2-3个主要模块(调度、文件系统、网络、I/O、内存管理等)的源代码;
  • 熟悉复杂系统软件的设计、开发和调优;
  • 有较强的定位分析问题的能力,对softlockup、 hardlockup、死锁、panic、OOM等日常问题有丰富的排查经验,能用工程化的方式系统地提升操作系统稳定性;
  • 有丰富的 Linux 调优和调试经验,熟悉 perf、systemtap 、ebpf 等;
  • 了解容器相关技术(cgroup v2、namespaces、ebpf)的实现,阅读过相关源代码者优先;
  • 具有Linux Kernel 调优和定制经验者优先;
  • 有向upstream提交patch经验者优先。

Apply for this Job

* Required

  
  
+ Add Another Employment