岗位职责:
1、负责基于通用基座大模型结合领域数据构建垂直领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLM Agents等LLM关键技术方向;
2、负责完成基于大模型的应用产品开发,保障大模型项目落地应用,并根据用户反馈持续优化效果和用户体验;
3、紧跟业界大模型、多模态等方向研究进展,探索前沿技术,形成系列算法/大模型解决方案,指导算法团队研发落地工作。
任职资格:
1、计算机科学等相关专业,本科及以上学历;
2、具有3年以上机器学习算法的相关项目工作经验,有大模型场景开发,多模态大模型的设计、自然语言处理/知识图谱的工作经验;
3、对大模型相关技术熟悉(prompt设计,微调,训练,大模型工程化)、了解ChatGPT4.0等API使用及原理;
4、熟练掌握Python等编程语言,以及常用的机器学习框架(如TensorFlow、PyTorch等),深入理解机器学习、深度学习原理,熟悉各种主流模型和应用场景;
5、对向量库技术有深入了解,如Milvus,Faiss,Weaviate等,并能应用于大规模向量检索任务;
6、熟练掌握docker容器化技术及linux操作,能通过后台查看相关报错及服务部署;
7、具备良好的数据分析和处理能力,能够定制化处理数据、构建数据集;
8、具备良好的团队合作精神和沟通能力,能够在压力下有效工作。