短い音声ファイルでの音声からの文字起こしはできましたので,本稿では長い音声・動画での文字起こし(できるだけ無料で)に実装したいです.
Python + CycleGanでオリジナルデータでの学習を実行します.本稿ではディアブロス(原種)とディアブロス亜種の変換を実施します.
画像生成系のCycleGanを実装します.Python + CycleGanで茶毛のウマをシマウマに変換します.
Python + ESPNetで学習した人を検出するセマンティックセグメンテーションのモデルを使って,クロマキー合成を実施します.
Python + ESPNetでCityscapesデータセットから人のみを抽出した仮のオリジナルデータで学習を実施します.
PythonでAI系をやっていると,CUDA・TensorFlow・PyTorchのversionの違いでつまずくことがありますので,version対応について記述します.
Python, ESPNetでCityscapesデータセットから人のみを抽出して,仮のオリジナルデータを生成します.
Python + ESPNetでCityscapesデータセットから人のみを抽出して,仮のオリジナルデータを生成します.
Python + ESPNetでCityscapesデータセットでセマンティックセグメンテーションの学習を実施します.