职位描述
1. 负责面向产品的NLP算法研发,包括但不限于语义理解、文本摘要、可控文本生成等;
2. 负责大模型微调算法研发,包括全参数微调和低参数微调;
3. 负责大模型推理算法的研发和优化,不断提升模型推理的效率;
4. 深入理解业务,针对实际场景规划并落地合适的基础算法,不断优化效果和性能。
职位要求
1. 熟练掌握NLP和ML基础理论和算法,熟练掌握Transformer模型架构和原理;
2. 熟练使用Python语言进行算法开发,熟练使用PyTorch、TensorFlow中至少一种深度学习框架;
3. 熟悉模型低参数微调技术,掌握Prompt Tuning、P-Tuning、LoRA中至少一种微调技术;
4. 熟悉大模型推理优化技术,包括但不限于layer fusion、kernel fusion和量化等技术;
5. 责任心强,有良好的沟通能力和团队合作能力。