イラスト自動生成AI「Midjourney」だけじゃない AIが描き出すイラスト生成「Stable Diffusion」

テクノロジー

トップの画像はAIが生成したイルカの画像で写真ではない。いまAIに文章で指示するだけで画像を描くサイトが熱く盛り上がっている。特に有名なのが、NASA(アメリカ航空宇宙局)の技術者も務めたデイビッド・ホルツさんが代表を務めるAI研究チームが開発した画像生成AI「Midjourney(ミッドジャーニー)」が話題となっている。さらに英Stability AIが発表した画像生成AI「Stable Diffusion」も注目を集めている。

画像生成AI「Midjourney(ミッドジャーニー)」

この画像生成サービスは、Midjourney社が開発・運営する、チャットアプリケーション・Discord上での画像生成サービスで、スラッシュコマンド「imagine」と共に好きな英語を入力すると、60秒以内に4枚のイラストが出力される。



設定変更をすることで出力するイラストを高解像度化(アップスケーリング)したり、スタイルや構図の似ている新しいイラストを出力したりすることもできる。
現在の「Midjourney」はベータ版であり、無料版トライアルは約25回イラストを作成することが可能。有料版は月額10ドル(約1330円)からで、企業向けライセンスも用意している。
画像の生成にはコラボレーションツール「Discord」を使う。MidjourneyのDiscordサーバに入り、コマンドを使って生成したい画像の内容を英語で指示すると、AIが1分前後で指示した画像を出力する仕組みとなっている。

生成した画像の権利はユーザーに帰属するが、規約上はMidjourneyチームや他のユーザーが生成画像を取得し、加工、公開できる。
Midjourney

https://www.midjourney.com/home/




使用方法は

①「Midjourney」のトップ画面にアクセスし、「Join the beta」ボタンを押し、招待とアカウント登録をする。
②入力したメールアドレスに招待メールが届くので、リンクをクリックし、ログインする。
③ログイン直後の画面からは絵の指示が出せないため「初心者部屋」に入る。
④一番下の入力欄に/imagine と入力し、Enterを押す。その後、/imagine prompt と表示されるので、英語で描いて欲しい絵のキーワードを入力しEnterを押す。
⑤画面が少しずつ変化し、数十秒~1分ほどで画像が表示され完成する。

高性能画像生成AI「Stable Diffusion」

「Midjourney(ミッドジャーニー)」に対抗するかのようにイギリスのスタートアップ企業Stability AIが高性能画像生成AI「Stable Diffusion」を一般向けに公開している。
Stable Diffusion Demo

Stable Diffusion 2-1 - a Hugging Face Space by stabilityai
Discover amazing ML apps made by the community




「Stable Diffusion」は「Midjourney」と同じように、AIに対して文章を入力することで画像を生成できる。さらにデモサイトは直ぐに登録なしで使用可能。継続的に使用する場合は、DreamStudioのアカウントに登録すれば誰でも無料で利用可能だ。


AI技術者向けコミュニティサイトのHuggingFaceにはコードやドキュメントが公開されており、AIを試すことができるデモページも存在する。配布されているモデルについては、ライセンスを明記することで営利・非営利を問わず使用が許可されているのも特徴。

Stable Diffusionが最も得意としているのは、よりリアルで写真のような画像で、適切な文章を入れるだけで実在の動物をかけあわせたような架空の動物や、実際に撮影された写真のような精密な画像が生成できる。

さらに注目すべきは、Stable Diffusionがアニメ調のイラストも高い精度で生成可能な点だ。ネット上にはStable Diffusionを利用して作成されたイラスト風の画像も投稿されている。そのまま使用されても問題なさそうな品質のイラストに仕上がっている。

AI画像がフェイクに利用されないか心配となる緻密さ

「Midjourney」「Stable Diffusion」ともに一目見ただけでは本物と見間違えるほど、リアルに仕上がる。
次の画像はデモサイトでキーワードを「交通渋滞(traffic jam)」で生成したものだ。




この仕上がりは驚嘆の一言に尽きる。反面、フェイク画像として利用されないか心配になるほどだ。
こういった技術を使うときには利用者の良心にかかってくるといえるだろう。
「Stable Diffusion」のデモサイトでは1つ実行するのに約4分かかっており、混雑時にはエラーが出ることもある。もっと多数の画像を生成したい場合は、ローカル環境の構築を考えてみるのが良いと思う。

参考
「神絵が1分で生成される」 画像生成AI「Midjourney」が話題
https://www.itmedia.co.jp/news/articles/2208/02/news124.html
Midjourneyの使い方とコツ
https://kigyolog.com/article.php?id=1690
「画像AIに絵を描いてもらうためのテキストを作るAI」が公開 どのような文章を入力したらいいのか分からないとの声を受け開発
https://nlab.itmedia.co.jp/nl/articles/2208/25/news126.html
言葉で指示した画像を凄いAIが描き出す「Stable Diffusion」 ~画像は商用利用も可能
https://forest.watch.impress.co.jp/docs/review/1434893.html

コメント

タイトルとURLをコピーしました