モデルエンジニア

世界に通用する音声AIを創り上げる挑戦的なポジション

700 - 1100 万円東京 IT ビジネス / システムアナリスト

募集要項

会社概要: 同社は、エンターテインメントサービスの企画～開発までを行なっています。
業務内容: 音声生成（TTS）技術の中核エンジニアとして、モデルのFine-tuning・推論最適化からサービス統合まで一気通貫で推進します。世界に通用する音声AIを創り上げる挑戦的なポジションです。
TTSモデル（Qwen-TTS、Orpheus等）のFine-tuning・話者／感情制御の実装
GPU上での推論効率化（バッチング、KV cache、量子化、同時実行数チューニング）
音素タイムライン生成のTTSパイプラインへの統合（アバターのリップシンク等への応用）
推論基盤の構築・運用、レイテンシ（TTFS）とサービス品質の管理
応募条件: 必要業務経験：
TTSモデル（Qwen-TTS、Orpheus、VITS、Fish-Speech等）のFine-tuning・追加学習の実務経験
話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験
音声データセットの構築・前処理パイプライン（音声/テキストアライメント等）の開発経験
GPU上での推論最適化の実務経験
推論基盤の選定・導入・最適化経験
REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験

語学：
英語：上級
給与: 700 - 1100 万円
勤務地: 東京

BRSコンサルタント
Hirohito Ezawa
Industrial