AKOOLトーキングフォトの使い方|静止画から動画を作成

AKOOLのトーキングフォト(Talking Photo)は、静止画像から人物が話している動画を生成するAI機能です。写真に命を吹き込み、あたかも本人が話しているかのような動画を作成できます。

SNSコンテンツ、プレゼン資料、教育コンテンツなど、様々な用途で活用できます。

トーキングフォトとは?

トーキングフォトは、1枚の静止画から人物が話している動画を生成する機能です。AIが顔の動きを解析し、入力した音声やテキストに合わせて自然なリップシンク(口の動き)と表情を生成します。

できること

  • 写真を動画化:静止画の人物が話しているように見える動画を作成
  • テキスト→音声→動画:テキストを入力するだけで音声と動画を同時生成
  • 音声アップロード:自分の声や音声ファイルを使って動画化
  • 表情・動きの調整:プロンプトで表情やジェスチャーを指定可能

リップシンクとの違い

リップシンク機能は既存の動画の口の動きを変更するのに対し、トーキングフォトは静止画から動画を生成します。

機能 入力 出力 用途
トーキングフォト 静止画 + 音声/テキスト 話している動画 写真から動画を作成
リップシンク 動画 + 音声 口の動きを変更した動画 動画の吹き替え・翻訳

基本的な使い方

トーキングフォトの使い方を4ステップで解説します。

AKOOLトーキングフォト編集画面

トーキングフォト編集画面

ステップ1:画像をアップロード

  1. ダッシュボードの左メニューから「トーキングフォト」を選択
  2. 「Choose an Image or Drag & Drop」をクリック
  3. 人物の顔が写った画像をアップロード

適した画像:正面を向いた顔がはっきり写っている画像が最適です。解像度は1024×1024以上を推奨。

ステップ2:音声を設定

音声の設定方法は2つあります。

方法A:テキストから音声を生成

  1. 「Add script」タブを選択
  2. 話させたいテキストを入力(最大1000文字)
  3. 音声(ボイス)を選択
  4. 「Generate Audio」をクリック

方法B:音声ファイルをアップロード

  1. 「音声をアップロード」タブを選択
  2. 音声ファイル(MP3, WAV等)をアップロード
  3. 長さは5〜60秒まで対応

ボイスクローン対応ボイスクローン機能で作成した自分の声を使うこともできます。

ステップ3:表情・動きを調整(オプション)

「プロンプト」欄に表情や動きの指示を入力できます。

  • 「大きくうなずく」
  • 「笑顔で話す」
  • 「真剣な表情で」
  • 「手を使ったジェスチャーを追加」

「Give me some ideas」をクリックすると、プロンプトの例が表示されます。

ステップ4:生成&ダウンロード

  1. 利用規約の同意チェックボックスをオンにする
  2. 「生成する」ボタンをクリック
  3. 処理完了後、プレビューで確認
  4. 「ダウンロード」ボタンで動画を保存

高品質な動画を作るコツ

適した画像の選び方

  • 正面向き:顔が正面を向いている画像が最適
  • 高解像度:1024×1024ピクセル以上を推奨
  • 顔がはっきり:顔が画像の中心にあり、大きく写っている
  • 自然な表情:口を閉じた自然な表情がベスト
  • 良い照明:顔に影がなく、均一に照らされている

避けるべき画像:横顔、サングラス着用、顔が小さい、ぼやけている、複数人が写っている画像は品質が低下します。

音声設定のポイント

  • テキストは短めに:長すぎると不自然になりやすい
  • 句読点を活用:自然な間を作るために句読点を入れる
  • 声質を選ぶ:画像の人物に合った声を選択

クレジット消費量

トーキングフォトのクレジット消費は、生成する動画の長さによって変わります。

動画の長さ 消費クレジット
〜15秒 約5クレジット
15〜30秒 約10クレジット
30〜60秒 約20クレジット

※クレジット消費量は目安です。実際の消費量は処理内容により変動します。

詳しくはクレジットの仕組みガイドをご覧ください。

活用事例

SNSコンテンツ

  • Instagram/TikTok:イラストや写真を動画化してリール/ショート動画に
  • YouTube:サムネイル画像から短い紹介動画を作成
  • X(Twitter):静止画の投稿を動画化して目を引くコンテンツに

プレゼン資料

  • CEOや創業者の写真を使った動画メッセージ
  • マスコットキャラクターが話すプレゼン動画
  • 製品説明の動画ナレーション

教育・研修

  • 歴史上の人物が語る教育コンテンツ
  • 多言語対応のトレーニング動画
  • バーチャル講師による解説動画

マーケティング

  • インフルエンサーの写真を使った広告動画(許可取得済みの場合)
  • AIモデルを使った商品紹介
  • パーソナライズされた動画メッセージ

よくある質問

イラストや絵画も動かせる?

はい、人物のイラストや絵画も動かせます。ただし、リアルな人物写真と比較すると品質は低下する場合があります。

複数人が写っている写真は使える?

1枚の画像につき1人の顔のみ対応しています。複数人を動かしたい場合は、それぞれ別の画像で生成してください。

動物やペットの写真は使える?

トーキングフォトは人間の顔に最適化されています。動物の写真は期待通りの結果にならない場合があります。

生成した動画の著作権は?

有料プランで生成した動画は商用利用可能です。ただし、使用した画像の権利は別途確認が必要です。詳しくは商用利用ガイドをご覧ください。

まとめ

AKOOLのトーキングフォトは、静止画から人物が話す動画を簡単に作成できる機能です。

  • 静止画 + テキスト/音声から動画を生成
  • プロンプトで表情やジェスチャーを指定可能
  • SNS、プレゼン、教育など幅広い用途で活用
  • 正面向きの高解像度画像がベスト

まずは無料で試して、トーキングフォトの可能性を体験してみてください。

AKOOLでトーキングフォトを試す 料金プランを見る