職位描述
職位描述:- 端到端與視覺語言動作模型 VLA 工程師- 構建場景理解系統(tǒng)(物體屬性推理、空間關系解析)- 設計跨模態(tài)對齊機制,提升指令-視覺-執(zhí)行的連貫性- 設計并優(yōu)化視覺-動作和視覺-語言-動作端到端模型- 開發(fā)多模態(tài)視覺語言模型,實現(xiàn)圖像-語言-動作的聯(lián)合理解- 優(yōu)化模型在邊緣設備的部署效率(TensorRT/MNN)- 開發(fā)zero-shot場景適應框架職位要求:- 精通Transformer架構及微調技術(LoRA/P-tuning)- 精通CLIP/BLIP/Flamingo等VLM架構,熟悉對比學習、跨模態(tài)注意力機制- 掌握提示工程技巧,有機器人領域微調經驗優(yōu)先- 有機器人移動或者操作任務(抓取/導航)數(shù)據(jù)集構建經驗優(yōu)先- 在視覺-語言多模態(tài)領域發(fā)表頂會論文者加分
企業(yè)介紹
它石智航(TARS)正式成立于2025年2月5日,是一家由 AI 驅動的具身智能技術公司。它石智航的使命是以物理世界 AI 和通用機器人技術為核心,構建可信賴的超級具身智能系統(tǒng),讓高性能 AI 規(guī)模化地融入人類社會的生產與生活中。它石智航的愿景是成為全球具身智能領域的領軍企業(yè)。TARS的創(chuàng)始團隊是迄今為止具身智能領域“AI 全棧能力最強戰(zhàn)隊”:CEO 陳亦倫博士是中國具身智能、自動駕駛領域技術及產業(yè)的領軍人;董事長李震宇曾任百度智能駕駛事業(yè)群總裁,是中國無人駕駛領軍人物;首席科學家丁文超博士,原華為“天才少年”,是具身智能領域青年科學家、復旦大學機器人研究院研究員,曾從0到1主導華為智駕端到端決策網(wǎng)絡,打造復旦大學首個人形機器人;首席架構師陳同慶是清華大學博士,國家重大專項首席科學家,原華為 ADS 智能導航部部長,空間感知首席技術專家,深耕工業(yè)制造、AI、自動駕駛、機器人等產業(yè),引領多個產品成功商用。