2025年8月4日

はじめての動画生成AIモデル Veo ~アパレルEC担当者が知っておきたい「画像から動画を作る」プロンプトの基本~


Content
商品詳細ページにおける商品のイメージ動画、店舗スタッフの着こなし動画など、アパレルECサイトの運営で動画コンテンツの重要性はますます高まっています。しかし、"動画制作はコストも時間もかかる..."とお悩みの方も多いのではないでしょうか?

そんなお悩みを解決するのが、ユーザーの皆さんが保有する商品画像やコーディネート画像から動画を自動で生成するGoogleのAIモデル「Veo」です。

この記事では、アパレルECサイトの担当者様向けに、Veoの能力を最大限に引き出す「プロンプト(指示文)」の書き方を、具体的なシーン別に徹底解説します。この記事を読めば、誰でも簡単に、Veoを使って自社の商品やブランドの魅力を伝える動画を作れるようになります。(Google Cloudを使って実際に作る方法については次回記事で記載します。)

Veoとは

Google DeepMindが開発した、テキストや画像から高品質な動画を生成するAIモデルです。

今回はGoogle Cloudで提供されるVeoについて紹介いたします。

主な特徴は以下の通りです。

  • Google CloudのVertex AI上で提供

  • テキスト・画像をインプットとして受け取り、高解像度の動画を生成

  • 映画的なスタイルや自然なカメラワークに対応

  • 映像全体を通じた一貫した動きと構図を実現

  • (2025年7月現在)動画1秒当たり$0.5の利用費用が発生

  • (2025年7月現在)動画の開始時点の画像と終了時点の画像を読み込み自然な形で動画を生成

 

なぜ「良いプロンプト」が重要なのか?

Veoは高機能な動画生成モデルですが、万能なサービスなわけではありません。優れた「プロンプト」がより良い動画を生み出します。

例えば以下のような入力画像に対するプロンプトの良い例と悪い例を見てみましょう。

入力画像:

悪い例

プロンプト:
ジャケットを着た男性を歩かせて

これでは、ジャケットを着た男性が不規則に歩くだけの、制御性が低い動画が生まれる可能性があります。

良い例

プロンプト:
夜の薄暗い路地を歩く、着古したレザージャケットを着たスタイリッシュな男性のミディアムショット。カメラはゆっくりと彼の後ろを追い、ジャケットの質感と自信に満ちた歩き方を強調する。照明は一つの暖かい街灯で、長くドラマチックな影を落とし、神秘的でクールな雰囲気を作り出している。

→物語と個性が際立ち、ジャケットの魅力と男性の雰囲気をより引き出す映像が生成されやすくなります。

写真から動画を作るためのVeoプロンプト基本構造

一般的にはインプットした画像をもとに動画に自然な動き与えるために、以下の要素をプロンプトに含めることが重要です。Google Cloudで用意されているプロンプトガイドに沿ってみていきましょう。

要素 説明 アパレルECでの例
入力画像の説明 アップロードした画像の内容を簡潔に説明。 「白い背景に正面を向いて立つ女性モデル」「ハンガーにかけられた赤いニット」
アクション (Action) 画像内の被写体にどのような動きをつけてほしいか。 「ゆっくりと振り返り、微笑む」「ニットの袖が風になびく」「商品が360度回転する」
カメラの動き 動画全体や被写体に対するカメラの動きを指定。 「モデルにズームインする」「商品をローアングルから捉える」
スタイル (Style) 動画全体のテイストや雰囲気。 「シネマティックな雰囲気」「ミニマルでスタイリッシュな印象」
背景の変化 (Optional) 必要に応じて、元の画像から背景を変化させる指示。 「背景をぼかす」「背景に街の風景を追加する」
雰囲気 (Ambiance) 動画の色味や光の加減。 「自然光のような明るさ」「温かみのある色調」

これらの要素を組み合わせ、インプットした画像の内容を明確に伝えつつ、期待する動きを記載することで、より指示に沿った動画を生成することができます。

アパレルECサイト向け動画用プロンプト作成 基本編

では以上の基本構造を取り入れて、どんなプロンプトにも共通する基本の4つの要素をマスターしプロンプトを作成してみましょう。

これら4つの要素を組み合わせるだけで、AIへの指示が驚くほど明確になります。

項目 要素 説明 アパレルECでのプロンプト例
① 主要素 誰が、何をするか 動画の核となるキャラクターとアクション 新作のトレンチコートを着たモデルが前に歩く
② 副次要素 どこで、どんな状況か 世界観、背景、天気、雰囲気、音など 雨の渋谷の通りで、背景には傘をさし行き交う人々
③ 技術仕様 どう撮るか カメラワーク、ライティング、スタイル コートの撥水生地にクローズアップ、浅い被写界深度、映画のようなスタイルで
④ 時間的指示 どのくらいの長さで、どう動くか 尺、カット割り、動きの速度 8秒のシークエンスで、3秒間歩き、その後5秒かけて生地にズームインする

アパレルECサイト向け動画用プロンプト作成 実践編

ではこれまでの内容をもとにモデル着用写真に動きをつけていきましょう。

目的: 静止画のモデルに、ブランドの世界観を反映した自然な動きと背景を与えることで、商品の着用感をよりリアルに、そして魅力的に伝え、顧客の購買意欲を刺激する。

画像:

プロンプト:


シーン全体の描写:
インプットしたモデルの静止画から作られる、エレガントで映画のような動画。トレンチコートをリアルで憧れを抱かせる設定で見せる。

①主要素
主役となる被写体:
クラシックなベージュのトレンチコートをシンプルな白Tシャツの上に羽織った20代後半の日本人女性モデル。表情は穏やかで自信に満ちている。

②副次要素
背景の設定:
最初の白い背景のまま保つ

照明と雰囲気:
シーンは暖かく自然なゴールデンアワーの光に包まれ、コートに柔らかなハイライトを生み出し、彼女の肌の色を美しく見せる。雰囲気は洗練されていて穏やか。

③技術仕様
カメラワーク:
最初は腰から上を映すミディアムショットで開始。彼女が歩くのに合わせて、カメラは完璧なフレームを保つためにわずかにスムーズにドリーバックする。彼女とコートに焦点を合わせるため、浅い被写界深度(f/2.8)を使用。

映像スタイル:
映画のよう、リアル、高精細、4K。カラーパレットは暖かく魅力的で、ベージュ、ソフトホワイト、そして太陽光の暖かいトーンが中心。

④時間的指示
8秒間のアクションシーケンス:
最初の3秒間、モデルは自信を持って数歩前に進む。トレンチコートは彼女の動きに合わせて自然に揺れる。
次の5秒間、彼女は立ち止まり、コートの襟に優しく触れ、カメラの方へ少し顔を向けて柔らかく微笑む。


作成された動画:

 

最終的にモデルの方が画面に近づきすぎてしまいましたが、おおむね指示通りの動画が生成されました。

品質をより高めるために

実はVeoにはEnable prompt enhancementという機能があり、上記で記載した長文で詳細な指示がなくとも意図を汲み取って作成しようとしてくれます。

また、今回の作成した動画のように終わり方があまり気に入らないなどの課題に対しては動画の最後のシーンをインプット画像として与える機能もあります。

 

次回の記事ではこれらプロンプトとは別にVeoが持っている機能から動画の質を高める方法について解説していきたいと思います。

2025年8月4日 はじめての動画生成AIモデル Veo ~アパレルEC担当者が知っておきたい「画像から動画を作る」プロンプトの基本~

Category Google Cloud

ご意見・ご相談・料金のお見積もりなど、
お気軽にお問い合わせください。

お問い合わせはこちら