機能ガイド
AKOOLトーキングフォトの使い方|静止画から動画を作成
AKOOLのトーキングフォト(Talking Photo)は、静止画像から人物が話している動画を生成するAI機能です。写真に命を吹き込み、あたかも本人が話しているかのような動画を作成できます。
SNSコンテンツ、プレゼン資料、教育コンテンツなど、様々な用途で活用できます。
トーキングフォトとは?
トーキングフォトは、1枚の静止画から人物が話している動画を生成する機能です。AIが顔の動きを解析し、入力した音声やテキストに合わせて自然なリップシンク(口の動き)と表情を生成します。
できること
- 写真を動画化:静止画の人物が話しているように見える動画を作成
- テキスト→音声→動画:テキストを入力するだけで音声と動画を同時生成
- 音声アップロード:自分の声や音声ファイルを使って動画化
- 表情・動きの調整:プロンプトで表情やジェスチャーを指定可能
リップシンクとの違い
リップシンク機能は既存の動画の口の動きを変更するのに対し、トーキングフォトは静止画から動画を生成します。
| 機能 | 入力 | 出力 | 用途 |
|---|---|---|---|
| トーキングフォト | 静止画 + 音声/テキスト | 話している動画 | 写真から動画を作成 |
| リップシンク | 動画 + 音声 | 口の動きを変更した動画 | 動画の吹き替え・翻訳 |
基本的な使い方
トーキングフォトの使い方を4ステップで解説します。
トーキングフォト編集画面
ステップ1:画像をアップロード
- ダッシュボードの左メニューから「トーキングフォト」を選択
- 「Choose an Image or Drag & Drop」をクリック
- 人物の顔が写った画像をアップロード
適した画像:正面を向いた顔がはっきり写っている画像が最適です。解像度は1024×1024以上を推奨。
ステップ2:音声を設定
音声の設定方法は2つあります。
方法A:テキストから音声を生成
- 「Add script」タブを選択
- 話させたいテキストを入力(最大1000文字)
- 音声(ボイス)を選択
- 「Generate Audio」をクリック
方法B:音声ファイルをアップロード
- 「音声をアップロード」タブを選択
- 音声ファイル(MP3, WAV等)をアップロード
- 長さは5〜60秒まで対応
ボイスクローン対応:ボイスクローン機能で作成した自分の声を使うこともできます。
ステップ3:表情・動きを調整(オプション)
「プロンプト」欄に表情や動きの指示を入力できます。
- 「大きくうなずく」
- 「笑顔で話す」
- 「真剣な表情で」
- 「手を使ったジェスチャーを追加」
「Give me some ideas」をクリックすると、プロンプトの例が表示されます。
ステップ4:生成&ダウンロード
- 利用規約の同意チェックボックスをオンにする
- 「生成する」ボタンをクリック
- 処理完了後、プレビューで確認
- 「ダウンロード」ボタンで動画を保存
高品質な動画を作るコツ
適した画像の選び方
- 正面向き:顔が正面を向いている画像が最適
- 高解像度:1024×1024ピクセル以上を推奨
- 顔がはっきり:顔が画像の中心にあり、大きく写っている
- 自然な表情:口を閉じた自然な表情がベスト
- 良い照明:顔に影がなく、均一に照らされている
避けるべき画像:横顔、サングラス着用、顔が小さい、ぼやけている、複数人が写っている画像は品質が低下します。
音声設定のポイント
- テキストは短めに:長すぎると不自然になりやすい
- 句読点を活用:自然な間を作るために句読点を入れる
- 声質を選ぶ:画像の人物に合った声を選択
クレジット消費量
トーキングフォトのクレジット消費は、生成する動画の長さによって変わります。
| 動画の長さ | 消費クレジット |
|---|---|
| 〜15秒 | 約5クレジット |
| 15〜30秒 | 約10クレジット |
| 30〜60秒 | 約20クレジット |
※クレジット消費量は目安です。実際の消費量は処理内容により変動します。
詳しくはクレジットの仕組みガイドをご覧ください。
活用事例
SNSコンテンツ
- Instagram/TikTok:イラストや写真を動画化してリール/ショート動画に
- YouTube:サムネイル画像から短い紹介動画を作成
- X(Twitter):静止画の投稿を動画化して目を引くコンテンツに
プレゼン資料
- CEOや創業者の写真を使った動画メッセージ
- マスコットキャラクターが話すプレゼン動画
- 製品説明の動画ナレーション
教育・研修
- 歴史上の人物が語る教育コンテンツ
- 多言語対応のトレーニング動画
- バーチャル講師による解説動画
マーケティング
- インフルエンサーの写真を使った広告動画(許可取得済みの場合)
- AIモデルを使った商品紹介
- パーソナライズされた動画メッセージ
よくある質問
イラストや絵画も動かせる?
はい、人物のイラストや絵画も動かせます。ただし、リアルな人物写真と比較すると品質は低下する場合があります。
複数人が写っている写真は使える?
1枚の画像につき1人の顔のみ対応しています。複数人を動かしたい場合は、それぞれ別の画像で生成してください。
動物やペットの写真は使える?
トーキングフォトは人間の顔に最適化されています。動物の写真は期待通りの結果にならない場合があります。
生成した動画の著作権は?
有料プランで生成した動画は商用利用可能です。ただし、使用した画像の権利は別途確認が必要です。詳しくは商用利用ガイドをご覧ください。
まとめ
AKOOLのトーキングフォトは、静止画から人物が話す動画を簡単に作成できる機能です。
- 静止画 + テキスト/音声から動画を生成
- プロンプトで表情やジェスチャーを指定可能
- SNS、プレゼン、教育など幅広い用途で活用
- 正面向きの高解像度画像がベスト
まずは無料で試して、トーキングフォトの可能性を体験してみてください。