AI画像生成初心者必見!DALL-E 3で簡単に魅力的な画像を作成
- 直樹 竹内
- 3月14日
- 読了時間: 6分
更新日:3月25日

AIと聞いて思い浮かぶ中の一つに画像生成が話題になっていますね。絵が描けない人でも、文章(「黒髪 ロング 女の子」みたいな)を入力するだけで、それっぽい画像を作れるのだから驚きです。存在は知っているけど画像生成したことが無いと言う人も多いかと思います。今回はDALL-E 3を使い簡単に画像生成を試してみようと思います。
そもそも画像生成AIとは?
画像生成AIは、テキストプロンプト(指示文)から新しい画像を作り出す技術です。イラストや写真風の画像など、ユーザーが自由に想像したビジュアルを簡単に生成できるため、デザイン、エンターテインメント、ブランディング、研究など幅広い分野で活用されています。
画像生成ってどれを使ったらいいの?
AIで画像生成をするためには、特定のモデルやサービスを利用します。以下に主要な画像生成ツールやサービスをピックアップし、それぞれの特徴を紹介します。
有名な画像生成AIモデルやツール
1. Stable Diffusion
概要: Stability AIが開発したオープンソースモデル。ローカル環境やクラウドで自由に実行可能。
メリット:
無料で利用でき、商用利用も(一部条件ありで)可能。
自分でカスタマイズしたり仕組みを理解できる。
高いクオリティの画像を生成可能。
デメリット:
環境構築が必要(ハードウェアのスペックが重要)。
初心者向けではない部分もある。
2. DALL-E 3
概要: OpenAIが提供する画像生成モデル。Web上で簡単に利用可能。
メリット:
直感的なUIで操作が簡単。
初心者でもすぐに使える。
デメリット:
APIは有料。トークン数(リクエスト数)による課金制。
動作はブラックボックスで、仕組みのカスタマイズなどは不可。
商用利用には制約がある。
3. MidJourney
概要: Discordを通じて動作する画像生成ツール。
メリット:
簡単な設定で利用可能。
高品質なアート作品を生成可能。
デメリット:
有料プランが大半を占める。
カスタマイズ性は低い。
この記事では、簡単に利用が可能なDALL-E 3使い画像生成を試していきます。
DALL-E 3って?どうやって使うの?
DALL-E 3は、OpenAIが開発した最新の画像生成モデルです。その特長の1つは、自然言語の指示を正確に理解し、美しい画像を生成する能力です。そのため、複雑な説明や細かい条件を指示しても、驚くほど細部まで忠実に応えてくれます。
DALL-E 3と聞くと知らない方も多いかもしれませんが、現在はChatGPTのアプリに統合されている為ChatGPTから実行することができます。
DALL-E 3を使うステップ
OpenAIアカウントを作成:まずはOpenAI公式サイトからアカウントを作成しましょう。
ChatGPTにアクセス:ChatGPTを起動します(OpenAIの提供するプラットフォーム、現在はChatGPTのアプリにも統合されています)ChartGPTからDALL-E 3を利用することができます。
プロンプト(指示文)を入力:テキスト欄に生成してほしい画像の説明を書き込みます。
a cozy cabin in the snowy mountains with warm light coming from the windows at dusk
(夕暮れ時に窓から暖かい光が差し込む、雪山の居心地の良い小屋)このように具体的に指示することで、ほぼその通りの画像を作り出してくれます。

生成された画像を確認・ダウンロード:数秒で結果が画面に表示されます。気に入った画像はそのままダウンロードも可能です。
DALL-E 3の特長
プロンプトへの忠実性:指示通りの画像を生成する点で非常に優秀。たとえば、「猫が本を読んでいる姿」のようなユニークな内容でもしっかり表現してくれます。
フィルターによるクリーンな生成:不適切な内容や繊細なテーマに対する規制があるため、安全な利用が可能です。
言語対応力が高い:日本語の指示文にも対応しているため、英語が苦手な方でも安心して使えます。
ChatGPTを活用する
DALL-E 3は現在統合されChatGPTから利用ができるようになっています。
画像生成は本来であれば英語でプロンプト(指示文)を実行する必要がありますが、ChatGPTを活用して日本語でチャット形式でやりとりから画像生成をすることも可能です

注意点や制約DALL-E 3で画像生成する上で注意点や制約があります。
不適切なコンテンツやセンシティブな内容は禁止。
暴力的、差別的、性的な内容
現実世界で他人を傷つける可能性があるもの
偽情報を生む可能性があるようなもの(例: 政治的プロパガンダ)
有名な人物や著作権のあるキャラクターの描写に制約。
有名人や架空のキャラクター(例: 映画やアニメのキャラクターなど)をそのまま正確に再現しようとすることには制約があります。
そのため、「〇〇という俳優そっくりな人物」や「ディズニーキャラクター風」などのように入力しても、予想通りには生成されないことが多いです。
有名な人物や著作権のあるキャラクターの描写に制約。
現時点で画像のサイズ(アスペクト比など)や解像度を直接指定することはできません。DALL-E 3は基本的に正方形(通常1024×1024ピクセル)で画像を作成します。
また、画像の一部だけを改変するといった高度な編集機能も、ChatGPT上でのDALL-E 3利用ではまだ提供されていません(ただし、生成後に別ツールで編集することは可能です)。
プロンプトの重要性
生成される画像の質は、入力するプロンプト(指示文)の内容に大きく依存します。
曖昧な内容を書いた場合、期待と異なる画像が生成されることがあります。
悪い例:「かわいい猫」
良い例:「柔らかい毛並みの白い猫が、窓辺で朝日を浴びながらリラックスして座っている」
商用利用のルール
作った画像の著作権や商用利用についてのポリシーは、生成される画像が個々のサービス規約に従います。
OpenAIの規約では生成した画像を商用利用できますが、利用用途が法律や規約に違反しないことが条件です。
プランによる画像生成の上限
無料プランだと数個程度でプラン上限になり一定期間画像生成ができなくなります

まとめ
今回は簡単に画像生成を試してみるという観点でDALL-E 3で画像生成を試してみました。現在はChartGPTに統合されたことによりDALL-E 3が簡単に使えるようになって便利になっています。それっぽい画像は今回のように簡単に作成が可能ですが、目的によっては制約などがある為望んだ結果が得られない場合もあります。本格的に画像生成をしてみたい、沢山画像を生成したいという場合はDALLE-3含め画像生成系のwebサービスに有料登録をすることを考えてみるのも良いかもしれません。
もう一歩踏み込んだ画像生成をしたいと言う場合は今現在人気で王道とも言えるStable Diffusionを試してみるのが面白いと思います。興味がありましたら次回の記事でお会いできればと思います。皆さんも良いAIライフを!