1. C++技术栈,有过大模型推理实践经验,包括但不限于VLLM,FasterTransformer,tensorrt-l|m等框架使用经验,有过ort等自定义算子开发经验,triton server开发经验。
2. Base杭州,2-6年经验均可