AI评测工程师（LLM方向）-上海招聘网

联系方式

联系人：上海米哈游网络科技股份有限公司

联系电话：152****5633

打电话联系前先投递一份简历，面试成功率提高60%！

(联系我时，请说是在上海易职邦上看到的)

职位描述

工作职责：我们希望你参与 1. 建设可持续演进的大模型评测体系； 2. 提升评测自动化程度与评测效率； 3. 推动评测数据、评测框架与评测方法持续迭代； 4. 用系统化评测驱动模型能力提升。 1. 负责大语言模型（LLM）评测体系建设，包括评测方案设计、评测指标定义、评测流程标准化等，建立可持续演进的评测能力体系； 2. 负责评测框架开发与维护，建设自动化、可扩展、高可靠的评测系统，提高评测效率与覆盖度； 3. 负责 Public Benchmark 与 In-house Benchmark 的建设与维护，包括评测集构建、数据清洗、版本管理、持续迭代与优化； 4. 根据模型迭代重点与业务需求，持续补充评测维度，动态优化评测集结构，提升评测集有效性与区分度； 5. 深入分析模型能力边界与问题分布，识别模型优势、短板与退化风险，建立问题发现与质量拦截机制； 6. 跟踪行业模型发展趋势，对主流模型进行横向评测与能力分析，量化模型能力变化与行业水平； 7. 参与模型训练与迭代过程中的评测建设，支撑模型研发闭环。任职要求： 1. 本科及以上学历； 2. 熟练掌握 Python，具备较强工程能力与代码能力； 3. 具备较强的问题分析能力、实验设计能力与自主探索能力； 4. 有大模型评测相关经验，包括但不限于评测框架开发、Benchmark 构建、数据集建设、模型能力分析等； 5. 有 LLM Eval 相关经验，对模型训练与迭代过程中的评测方法有一定理解； 6. 熟悉开源 Benchmark、评测框架或评测方法论，对评测集构建、优化与质量分析有实践经验；面向对象： 2027届及之后毕业的在校生