Skip to content
pythonで長い音声・動画からの文字起こしを実装する

短い音声ファイルでの音声からの文字起こしはできましたので,本稿では長い音声・動画での文字起こし(できるだけ無料で)に実装したいです.

pythonで音声からの文字起こしを実装する

本稿では,音声データからテキストに変換する文字起こしを実装します.

Python + CycleGanでオリジナルデータでの学習を実装する

Python + CycleGanでオリジナルデータでの学習を実行します.本稿ではディアブロス(原種)とディアブロス亜種の変換を実施します.

Python + CycleGanで茶毛のウマをシマウマに変換する

画像生成系のCycleGanを実装します.Python + CycleGanで茶毛のウマをシマウマに変換します.

Python + ESPNetでクロマキー合成を実施する

Python + ESPNetで学習した人を検出するセマンティックセグメンテーションのモデルを使って,クロマキー合成を実施します.

Python + ESPNetをオリジナルデータで学習する(学習編)

Python + ESPNetでCityscapesデータセットから人のみを抽出した仮のオリジナルデータで学習を実施します.

CUDAとTensorFlow,PyTorchのversion対応について

PythonでAI系をやっていると,CUDA・TensorFlow・PyTorchのversionの違いでつまずくことがありますので,version対応について記述します.

Python, OpenCVで指定した色の抽出と別の色への置換を実装する

Python, ESPNetでCityscapesデータセットから人のみを抽出して,仮のオリジナルデータを生成します.

Python + ESPNetをオリジナルデータで学習する(データ生成編)

Python + ESPNetでCityscapesデータセットから人のみを抽出して,仮のオリジナルデータを生成します.

Python + ESPNetをCityscapesデータセットで学習する

Python + ESPNetでCityscapesデータセットでセマンティックセグメンテーションの学習を実施します.