【工作职责】
1、负责端侧推理产品的研发,支持LLM、SD等模型在端侧的部署应用;
2、负责端侧客户项目的推进与持续交付,获得商业上的成功;
3、参与端侧相关国家项目的方案设计、研发与交付;
【任职要求】
1、本科及以上学历,计算机相关专业,具有扎实的计算体系结构的基础;
2、熟悉C++/python,有较强的工程编程能力;
3、熟悉Windows、Android或其他嵌入式平台研发;
4、具有1年及以上大模型部署推理相关工作经验,或者端侧AI模型落地经验。
5、了解1种或者多种业界常用大模型推理框架,如:TVM、Llama.cpp、vLLM、SGLang