「AI Infra 工程师(web3 明星创业公司招聘」

发布时间:2025-05-31 11:56

职位描述

职位描述
我们正在寻找一位具备深厚技术背景的 AI 工程师(系统 Infra 方向),专注于 AI 模型部署与推理
优化。候选人需对各种 AI 推理框架的优劣势有深入理解,能够高效完成模型推理的加速与优化,
特别是在端侧或云端的部署方面表现突出。同时,对模型量化、蒸馏等优化技术有实际经验和深
刻认知。
岗位职责
● 评估主流推理框架(如 TensorRT、ONNX Runtime、TVM 等),分析其适用场景及性能优劣。
● 根据业务需求选择最优框架并进行深度优化,确保性能与资源消耗的最佳平衡。
● 在端侧(如嵌入式设备或移动设备)或云端实现高效的模型推理部署。
● 应用先进的推理加速技术(如算子优化、内存管理优化),提升推理速度并降低资源消耗。
● 掌握量化技术(如 INT8、FP16)以及蒸馏方法,减少模型体积并提升推理效率。
● 通过优化和压缩手段,让模型适配算力受限的环境。
● 设计并实施性能监控工具,实时分析模型在生产环境中的运行表现。
● 持续优化系统性能,及时解决瓶颈问题。
● 与团队成员及其他部门协作,提供技术指导,推动 AI 技术的广泛应用。
职位要求
● 熟练掌握主流推理框架(TensorRT、ONNX Runtime、TVM 等),并具备框架深度优化的经验。
● 对模型量化(如 INT8、FP16)和蒸馏技术有实际项目经验,能够优化模型性能和资源利用率。
● 熟悉算子优化、内存分配等底层技术细节,有能力优化推理速度。
● 具备在端侧设备(如移动端或嵌入式)或云端部署 AI 模型的经验。
● 有完整的项目经历,从模型优化到生产部署,并能快速响应和解决实际问题。
● 精通 Python 和 C++,能够编写高效的推理代码并解决复杂技术问题。
● 对 GPU、TPU 或其他硬件加速平台有实际操作经验。
● 逻辑思维清晰,能快速分析问题并提出高效解决方案。
● 具备优秀的团队合作和沟通能力,能与不同部门无缝对接。
加分项
● 曾参与过大规模推理系统的优化和落地项目。
● 有异构计算平台(如 GPU、TPU 或 FPGA)的深度优化经验。

网址:「AI Infra 工程师(web3 明星创业公司招聘」 http://www.mxgxt.com/news/view/1433433

相关内容

AI 领域明星企业招聘 UIUX
Web3风口吹进娱乐圈:周星驰ins发招聘、周杰伦出售NFT
【深圳市巨星创艺新媒体有限公司招聘
【包装设计工程师招聘】
Web3龙头公司一览(2025/5/22)
500万年薪招不到CTO,AI创业潮里的虚幻与真实
招聘美工(科信公司)
专访王欣:从快播的“技术无罪”,到Web3的“技术公平”
公关公司艺人工资待遇(招聘要求)
「明星工作室招聘」

随便看看