NEW
求人番号:JN -062026-205241 掲載日:2026-06-04

モデルエンジニア

世界に通用する音声AIを創り上げる挑戦的なポジション
700 - 1100 万円 東京 IT ビジネス / システムアナリスト

募集要項

会社概要
同社は、エンターテインメントサービスの企画~開発までを行なっています。
業務内容
音声生成(TTS)技術の中核エンジニアとして、モデルのFine-tuning・推論最適化からサービス統合まで一気通貫で推進します。世界に通用する音声AIを創り上げる挑戦的なポジションです。
  • TTSモデル(Qwen-TTS、Orpheus等)のFine-tuning・話者/感情制御の実装
  • GPU上での推論効率化(バッチング、KV cache、量子化、同時実行数チューニング)
  • 音素タイムライン生成のTTSパイプラインへの統合(アバターのリップシンク等への応用)
  • 推論基盤の構築・運用、レイテンシ(TTFS)とサービス品質の管理

応募条件
必要業務経験:
  • TTSモデル(Qwen-TTS、Orpheus、VITS、Fish-Speech等)のFine-tuning・追加学習の実務経験
  • 話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験
  • 音声データセットの構築・前処理パイプライン(音声/テキストアライメント等)の開発経験
  • GPU上での推論最適化の実務経験
  • 推論基盤の選定・導入・最適化経験
  • REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験

語学:
  • 英語:上級
給与
700 - 1100 万円
勤務地
東京
Hirohito Ezawa
BRSコンサルタント
Hirohito Ezawa
Industrial
メールでお問い合わせ

おすすめの求人