AI Data Research Engineer ― AIモデル性能を決める「データ設計・評価ループ」の中核エンジニア ―
19日前 更新
テックリード、アプリケーションエンジニア
東京都(岩本町駅)
600-1200万円
正社員
自社サービスありリモートワーク可フルリモート可服装自由オンライン選考可フレックス制度あり新規立ち上げ新技術に積極的ベンチャー企業グローバル展開
事業概要
■AI開発プラットフォームの提供、AIコンサルティング事業 ■AIデータプラットフォーム「harBest(ハーベスト)」を運営。 「harBest」は、AI・人工知能開発に必要な機械学習用データを、副業アプリに登録しているクラウドワーカーを通じて収集・作成するサービスです。
仕事内容
■ 募集背景 APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。
近年、 - LLM / VLM / 画像・動画モデルなど 扱うモデルの高度化 - 本番運用を前提とした データ量・品質要件の急激な引き上げ - 顧客ごとに異なる 「モデル性能を左右するデータ要件」
が同時に進み、モデルそのもの以上に「データ設計と評価ループ」がプロダクトの競争力を左右するフェーズに入っています。
現在は、
- データ設計や評価改善が属人的になっている
- モデル改善のボトルネックがデータ側にあるが、体系化しきれていない
という課題を抱えており、AIモデルの性能を「データの観点から」引き上げられるエンジニアをR&Dの中核メンバーとして迎えたいと考えています。
■ このポジションの役割
本ポジションは、モデルを作るエンジニアではありません。 モデルが「本番で機能する状態」を、データ設計で実現するエンジニアです。
- LLM / VLM / 画像・動画モデル向けの 学習データ設計
- データ前処理・アノテーション方針の設計・改善
- モデル評価指標の設計、評価結果の分析
- 学習 → 評価 → データ改善 の フィードバックループ構築
- モデル開発チーム・プロダクトチームとの連携
「なぜ精度が出ないのか」「どのデータをどう変えるべきか」をデータ側から考え、実行する役割です。
■ 主軸(最も期待する領域)
- AIモデル向けデータ設計・前処理・品質管理
- モデル評価とデータ改善ループの設計
- Pythonを用いたデータ処理・分析
■ 扱う対象例
- LLM / VLM 向けテキスト・画像・動画データ
- 物体検知・画像認識モデル向けデータ
- アノテーションデータ・メタデータ
※モデルの重み設計やアルゴリズム研究が主業務ではありません。
「データ × モデル性能」の実運用設計が中心です。
■ 任せたい裁量・意思決定範囲
- 学習データの設計方針・品質基準の策定
- モデル評価指標・評価方法の設計
- アノテーション改善・再設計の判断
- モデル改善に向けた データ戦略の主導
データに関する意思決定を、エンジニアとして主体的に担っていただきます。
求められるスキル・人物像
■ 必須スキル 以下すべてを満たす必要はありませんが、学習データや評価設計について「自ら考え、改善した経験」を重視します。
- 機械学習モデル(分類・検出・生成系など)を扱い、モデル性能向上を目的として学習データの設計・改善に関与した実務経験(研究・プロダクトいずれも可)
- Python を用いて、学習・評価用データの前処理、加工、検証を自ら設計・実装した経験
- モデル評価結果を踏まえ、「データをどう変えれば性能が改善するか」を考え、実際に施策を実行した経験(再アノテーション、データ追加、分布調整、ラベル定義の見直し等)
■ 歓迎スキル - LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験 - アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験 - 精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験 - 学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験 - Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方 - 研究コミュニティでのアウトプットとして、学会等での論文発表/査読付き発表などの実績がある方 - 生成AI(LLM/AIエージェント等)を用いた開発経験があり、エージェント設計・ツール連携(Function calling等)・RAG/検索・マルチモーダル文書理解(VLM/OCR)・安全運用(ファクトチェック/ガードレール)・タスク特化ベンチマークによる継続評価のいずれかに知見/実装経験(または強い関心)がある方 - 強化学習を含む学習手法や、課題設定〜分析〜実装〜検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験 - Robotics・Physical AI領域におけるデータ作成(IL用データ収集・VLA学習用データの生成・評価設計等)の経験がある方
■求める人物像 - モデル単体よりも 「データと評価で性能を上げる」ことに面白さを感じる方 - 研究だけでなく、実運用されるAIプロダクトに関わりたい方 - モデル開発者と対話しながら、データ設計をリードしたい方 - AIプロダクトの“裏側の要”として責任を持ちたい方
※純粋なアルゴリズム研究のみを志向する方には向きません。
勤務地・給与・その他情報
想定年収、待遇・福利厚生、
選考プロセスなどを確認するには会員登録が必要です
利用規約、レバテックID利用規約、レバレジーズグループ・プライバシーポリシーをご確認のうえ、同意いただける場合は会員登録へお進みください。
- 勤務地
- アクセス
- 勤務時間
- 想定年収
- 雇用形態
- 休日・休暇
開発環境・現場
▼ サーバサイド・バックエンド 言語:Python (Django), Node.js データベース:Postgres ▼ フロントエンド Web 言語:Typescript (React, Next.js) Mobile 言語:Typescript (React Native) ▼ インフラ・SRE クラウド:AWS, GCP コンテナ:Docker, Kubernetes CI/CD:Github Actions ▼ その他 API:REST, GraphQL データ処理・AI連携:Google Vertex AI, AWS SageMaker など
このPJ・案件で使われている技術
- プログラミング言語
- TypeScriptPython
- フレームワーク・ライブラリ
- ReactNode.js
- データベース
- PostgreSQL
- 支給PC
- 現場で選択可能(Windows/Mac)
得られる経験・キャリアパス
- AIモデル性能を左右するデータ設計の実戦経験
- LLM / VLM 等の最新モデルを「使い切る」視点
- 学習 → 評価 → 改善を回す 実運用の知見
事業内容の詳細
■ APTOについて AI開発において多くの企業が直面する「データ準備の課題」を解決するために設立されたスタートアップです。 クラウド型のデータ収集・アノテーションプラットフォームを提供し、AIモデルの開発・運用に必要な高品質データの整備を効率化しています。 主力サービスには、社内外の作業者によるデータ作成を一元管理できるAIデータプラットフォーム、幅広い領域に対応した学習用データセットの提供、AIモデル開発を支援する受託ソリューションなどがあり、大手企業を中心に導入が進んでいます。 また、スマートフォンアプリによるクラウドワーカーの活用や、多言語・多地域でのデータ収集ネットワークの構築を通じて、グローバルなAI活用にも対応できる体制を整えています。
■ 当社の挑戦について 「技術革新をリードする高品質なAIデータを産み出し続ける」ー これが私たちの掲げるミッションです。 AIモデルは年々高度化・多様化しており、それに伴い求められる学習データも膨大かつ高品質であることが求められます。 APTOは、スマホアプリやSaaSプラットフォームを通じて、企業とクラウドワーカー双方にとって「使いやすく、正確で、速い」データ収集・アノテーション体験を提供しています。 日本のみならず、アフリカ・東南アジア・欧州など海外との連携も進行しており、今後はRAG/LLM/VLMなど、次世代AI向けの指示データ作成や専門アノテーションにも注力していきます。
この企業の他の求人
同じ職種の求人
同じ業種の企業
- ITエンジニア・デザイナーの求人・転職TOP
- ITエンジニア・デザイナーの求人・転職を探す
- テックリードの求人
- AI Data Research Engineer ― AIモデル性能を決める「データ設計・評価ループ」の中核エンジニア ―

























