Redditで見つけた「月額AIツールを解約して自作した」という話
朝のコーヒー片手にRedditのr/passive_incomeを覗いていたら、ちょっと気になるスレッドを見つけたんだよね。
「月30ドル払ってたAIクリップ生成ツールを解約して、無料で無制限に使えるやつを自分で作った」っていう投稿。
動画から自動でショート動画を切り出してくれるツールってあるじゃん。OpusClipとか、ああいう系のやつ。
YouTubeの長い動画を、TikTokやShorts用の縦長クリップに自動で変換してくれる便利なやつ。海外のクリエイターはみんな使ってるらしい。
でも月30ドルって、日本円にすると4500円くらい。ブロガー兼派遣エンジニアの俺からすると、けっこう痛い出費だよね。
その投稿者が言うには、Whisper(OpenAIの文字起こしAI)とFFmpegを組み合わせて、自分のPC上で動かす無料版を作ったと。コードも公開してくれてて、「もう課金する必要なくない?」って書いてあった。
そもそも何をしているツールなのか
仕組みを噛み砕くと、こんな感じ。
まず長尺動画から音声を抜き出して、AIで文字起こしする。次にその文字起こしをLLM(ChatGPT的なやつ)に読ませて、「ここがバズりそうな切り抜きポイントだよ」って判定させる。
最後にFFmpegというオープンソースの動画編集ツールで、その部分だけ縦長にトリミングして字幕を付ける。
これを全部自動でやってくれるのが月額ツール。それを「APIとオープンソースだけで再現したぜ」っていうのが今回の話。
稼ぎ方のロジック
このツールで作ったショート動画をTikTokやYouTube Shortsに大量投稿して、再生数で広告収入を得る。あるいは自分の本業に誘導する導線にする。
海外の事例だと、1本の長尺動画から10本以上のショートが量産できるから、コンテンツの「コスパ」が爆上がりするんだよね。
50代の日本人にとっての壁を冷静に見てみる
正直、面白そうだなと思ったんだよ。でもさ、ちょっと待てよと。
まず技術的な壁。Whisperを自分のPCで動かすには、最低でもPythonの環境構築ができる必要がある。GitHubからコードをクローンして、ライブラリをpipで入れて、エラーが出たら自力で潰す。
派遣エンジニアやってる俺はギリギリ触れるけど、エンジニア未経験の50代には正直キツい領域だと思う。
次に言語の壁。Whisperは日本語にも対応してるけど、LLMに「バズるポイントを選んで」って指示するプロンプトは、英語コンテンツ前提で組まれてることが多い。
日本語の長尺動画から日本語の切り抜きを作る場合、プロンプトを書き直さないと精度が落ちる。
あとはマシンスペック。Whisperの一番精度が高いモデルを動かそうとすると、それなりのGPUが要る。普通のノートPCだと、10分の動画で1時間以上かかったりする。
そもそも50代がショート動画で勝てるのか問題
これが一番大きい壁かもしれない。TikTokやShortsの主戦場って、若い世代の感性で動いてる場所じゃん。
50代がそこに殴り込んでも、よっぽど特化した専門性がないと埋もれる。
判定:そのままは使えない、でもアレンジ次第で化ける
結論から言うと、Reddit投稿者のやり方をそっくり真似るのは50代には厳しい。
技術ハードル、言語の壁、若者ネイティブのプラットフォーム文化、どれも逆風が強すぎる。
でも、考え方の一部は十分使えると思ってる。
たとえば「月額SaaSを解約して、APIの組み合わせで安く済ませる」という発想。これは50代こそ取り入れるべき節約思考だよね。
俺もブログ運営でいろんなツールに課金してきたけど、よく考えたら無料で代替できるものがけっこうある。
ChatGPTのAPI直叩きで月数百円に抑えたり、画像生成も無料枠で回したり。月数千円浮けば、サーバー代1年分くらいになる。
まとめ:50代は「自作」より「組み合わせ」で勝負
海外の若い人たちは「無料ツールを自作する」エネルギーがあるけど、50代はそこに時間を投下するより、既にある無料ツールを賢く組み合わせるほうが現実的だと思う。
長尺動画をショートにする発想自体は悪くない。ただ、それを自分でゼロから作るんじゃなくて、無料プランがあるツールを使い倒したり、自分の専門領域に合わせた切り口で投稿する。
50代の強みは、若い世代にはない「14年分の経験談」みたいなコンテンツの厚み。技術で殴り合うより、語れる中身で勝負したほうがいい。今日の発見はそんな気づきだったな。
