目次

はじめに

本書のねらい

 この本はAIによる画像生成をテーマに、その背景にある先端技術を楽しんでもらえるようにフォーカスを合わせています。優しい口調にして、デジタルアートやゲーム、VTuberやメタバースといった最新のビジュアルアートやクリエイティブに興味がある人が、理解できる本を目指しています。

 AIによる画像生成を扱いますが、難しい数学を一切使わずに読めるように工夫し、プログラミングや絵画の経験がない中高生でも読めるような平易な日本語で執筆しています。

本書の構成

 本書は以下の3部で構成されています


 ・Part1「AI画像生成を使ってみる」 第2章~第4章

  ─MidjourneyとDream Studio、そして無料で使えるGoogle ColabでのStable Diffusionを使って「文字を使って絵を描く」プロンプトエンジニアリングの楽しさを体験することができます。

 ・Part2「論文から学ぶ Stable Diffusion」 第5章

  ─Stable Diffusionに至るまでの歴史と論文を、数式を使わずにアルゴリズムの概要を順を追って解説していきます。技術の内部に興味がない人は読み飛ばしても大丈夫です。

 ・Part3「AI神絵師は人類にどんな影響を与えているのか」 第6章~第10章

  ─実際に何でも描ける「AI神絵師」になったら、何が起きるのか?筆者の体験や、有名イラストレーターの852話(はこにわ)さんとの対談やコラボレーション、法律面やメディアの歴史を振り返りながら、この技術が人類にどんな影響を与えているのかを考察していきます。

この本は3つの「欲求」から書き起こされています。

 最初に、このテキスト画像生成技術を使い始めたときは『落書き感覚ですごい絵を描きたい』という欲求が自分を動かしていました。さらに『神絵師の視点で世の中を見てみたい』というふたつ目の欲求も強くなっていきました。その後すぐにコンピュータサイエンスやインタラクティブ技術の研究者として『この技術をブラックボックスのまま使うなんて勿体ない!知りたい!伝えたい!』という3つ目の欲求が根っこにあることに気づきました。

 まずは上手に絵を描くプロンプトを学びつつ、次にAIテキスト画像生成の「お気持ち」つまりアルゴリズムを理解するために論文を読み漁りました。そこで、関連したアルゴリズムの解説と歴史を一気にまとめてみたら、気が付いたらこの書籍を書いていて、技術書典13で発表していました。それが、2022年9月11日に公開した「グリー技術書典部誌 2022 年秋号」への寄稿、「AIとコラボして人気絵師になる」です。この書籍はそこから1ヵ月で、大幅に加筆した内容になっています。原稿執筆の期間だけでも、毎日のようにStable Diffusionや派生技術を利用したモデルやサービスが産まれています。毎日のように人々をあっと驚かせるような画像やクリエイション、応用が生まれ、そして事件や炎上などの論争も起きています。

 本書でも可能な限り紹介していきますが、全てを扱うことは不可能ですので、その更新の速度、熱量、方向性、信頼すべきソースの探し方、読み方を感じ取って頂ければ幸いです。この技術により「人類がどこに向かっているのか?」を自分の言語で他者に言語や画像で表現できるまで理解できるようであれば、長期にこの技術を俯瞰することができるでしょうし、本書の読者として十分なゴールになると思います。

本書の対象読者と関連書籍

 主に最先端の絵を描く技術に興味がある人、そしてこの技術の未来に興味がある人向けに、長い賞味期間で楽しめる書籍を目指しています。「この本を読めば美しい絵が生成できる『魔導書』だと思ったのに!」というライトな方にも役に立つと思います。

 もし眼福のみを望まれる方は、表紙をご提供いただいたクリエーター852話さんによる「Artificial Images: Midjourney/Stable DiffusionによるAIアートコレクション」(株式会社インプレスR&D・2022年9月23日発行)を併せて購入されることをお勧めします。プロンプトの研究としても、AI画像生成時代の美的感覚の育成という意味でも、大変おすすめです。

「AI神絵師」とは……?

 本書のタイトルにもなった「神絵師」ですが、英語では様々な表現があります。God painter, divine painter, amazing painter,...。著者としては日本語で「KAMIESHI」……圧倒的な画力でみんなとキャッキャッと交流できる人……という意味で使っています。単なるprompt wizardではなく、AIとコラボしつつ、自らの手で絵を作る『神の手を持つ』という意味で「Godhand Illustrator」……そんな存在を仮の用語として定義しておきます。この本の執筆を通して、「AI神絵師」なる概念を新しく構築していきたいと考えています。

表記関係について

 本書に記載されている会社名、製品名などは、一般に各社の登録商標または商標、商品名です。会社名、製品名については、本文中では©、®、™マークなどは表示していません。

巻頭言のさいごに

 人間の想像力と欲望によってドライブされるAIの進化スピードに負けないように、たったの2ヵ月で2冊の書籍を書くという挑戦を許してくれた家族、最初のきっかけをくれたグリー技術書典部の部員、本書の出版にひとつ返事で応援してくれたREALITY株式会社の荒木英士CEO、素敵な表紙を描いてくださった852話さん、対談まで実現してくれた編集の山城敬さん。そして本書を発見してくれた皆さんに感謝を記させていただきます。


 この本を人類の創造力と相互理解の未来に捧げます。

2022年10月12日 白井暁彦(Twitter@o_ob)

第1章 冒険の始まり:AIとコラボして神絵師になる

 「AIとコラボして神絵師になる」


 この言葉で皆さんは何を思い浮かべたのでしょうか?


 ・ロボットのような機械が、人間の代わりに筆をもって絵を描く

 ・「AIとコラボ」するってどういうことだろう?

 ・そもそも「AI神絵師」とは何だろう?頼んだものを何でも描いてくれる人?感動できる絵を描く人?


図1.1: AI画像生成サービス「Midjourney」によって生成した画像

 そのどれもが、みなさんの「頭の中で勝手に想像して描いた妄想」であるはずです。この本は「その妄想」を「文字列だけ」で美麗な画像を生成できてしまう、AI画像生成技術について、仕事にも趣味にも使える幅広い人向けの先端技術の解説として「どう理解すればいいのがわかる」を目的としています。

 この本は、2022年8月24日の筆者によるこんなつぶやきからはじまりました。

図1.2: 筆者による2022年8月24日のTwitter(@o_ob)でのつぶやき

 「例のAIが描いた絵です、プロンプトは秘密です!」いまはこんなこと、怖くて呟けないです……。それというのも、本書で解説する「Stable Diffusion」が公開されたこの日(2022年8月23日)から、世界は、人類とデジタルイラストレーションの歴史は変わってしまいました。

 「例のAI」とは当時は「DALL-E」1や「Midjourney」という、「Stable Diffusion」よりもほんの少し前の、『文字列から高品質な画像を生成する技術』を意識してつぶやいたと記憶しています。ちょっと新しい技術に敏感な方々がDALL-EやMidjourneyを使って、フェイクニュースのような画像やSF小説の表紙のような絵をTwitterのタイムラインで紹介し始めました。テキストベースの画像生成機械学習モデル2を使っており、インパクトのある絵が文字列から生成されます。たしかにシロウトが描くには緻密すぎる画風で、写実的で、魅力的ではありました。「上手か下手か?」で訊かれたら『明らかに自分より上手』という印象を受けました。

 しかし招待が必要だったり、有料のクレジットを使うことで利用できるサービスなので、そんな技術をちょっと離れた専門家である自分は「ナナメに見ていた面」もあったと思います。pixivやBOOTHといった人気の絵師さんがチヤホヤされるSNSで「『例のAIで描きました』と言って、自分の絵を見てもらおうという人が出てきてもおかしくないだろうな……」ぐらいの気持ちでつぶやきました。当時はまだ自分事として捉えていなかったのだと思います。

図1.3: Stable Diffusion によるイラスト生成例(筆者とのコラボで制作)

 その後、自分が「Stable Diffusion」を試してみたら、全く考えが変わりました。たしかにちょっと触ってみるだけで、本当に簡単にすごい絵が生成されます。

 ときどきものすごく気持ち悪い絵にもなりますが、それでも高確率で印象深い画像が生成されます。最初は『綺麗な絵が生成されて癒やされるなあ……』という気持ち、そして気が付けば夢中でMidjourneyやDreamStudioのクレジットを使い切っている自分がいました。頭の中で、アドレナリンのような何かが発火して、眠るのを忘れて絵を作り続けました。

 でも何だか、不思議な気持ちにもなりました。

 『これは、自分が描いた、と言えるものなのか?」

 そんな疑問が心の中に残りました。

 Stability.AI社によってリリースされた「Stable Diffusion」は、Midjourneyと同じようにテキストベースで画像生成できる機械学習モデルを、誰でも無料で使えるライセンスとしてリリースしたのです。そんな「お金を払ってでもAIに絵を描かせたい」という人々が夢中になっている最中に、です。

 私が他人事のようにつぶやいた日から数日で、招待された人やライセンスを買った人だけでなく、「誰でも使える」という状態になりました。そして懸命にAIに絵を描かせている人々だけでなく、AIに絵を描いてもらおうとは思っていなかった人々まで巻き込んで、日々、すごい勢いで、新しい技術や議論がタイムラインを賑わせています。


 人類バンザイ!でも……。


 前提として、私自身、人間が描く行為は大好きです。自身も学生時代はマンガを描いてました。現在は、とあるメタバース関連企業で研究開発のディレクターを担当している博士(工学)です。デジタルハリウッド大学大学院というデジタルコンテンツマネジメントの専門家を育成する大学院の客員教授でもあります。過去形でなく、現在進行形の描き手として、研究ノートや教室のホワイトボードに解説図を描き、クリエイターとして、動画の絵コンテ、レイアウト、キャラクターデザイン、指示書や発明の図解など、マンガやスケッチを日常的に描いています。

 新しい体験や映像を作ったり、頭の中にあることを伝える上で、絵を描くスキルはとても重要です。そう……「人間の手で描くイラストレーションを愛している」と思います。「AIで描けるなら人間は絵を描かなくていい」ってことはないと思いたい……人類バンザイ!しかし、Stable Diffusionによって、世の中の理解もどんどん変わっていきます。


 ・「AIによる画像生成でコンテストに優勝するなんて、けしからん!」

 ・「AIは誰かが描いたものを盗んでいるんじゃないの?」

 ・「日本の著作権法、世界の法律ではどうなっているの?」


 本書はこのような話題もあえて扱っていきます。後で読んだら『2022年の頃はこんなことで炎上していたんだ……』といった歴史の記録になることでしょう。

 それはそれとして、日々の業務でのスケッチは心の状態の向き不向きに関係なくサッサと描いてしまいたいです。「落書き」ぐらいの気軽な感覚で「有名なアーティストさんに依頼して描いてもらったかのようなクオリティの高い絵」が生成されるなら、道具として「自分のものにしてみたい!」と思う人も多いでしょう。


 さあ、冒険の始まりです!


 AIとコラボして神絵師になりましょう。気軽な気持ちで、人類が開いてしまったパンドラの箱を、最後まで覗き込んでいきましょう。

1. 正式な表記は「DALL·E」および「DALL·E2」ですが、日本語フォントでの読みやすさのため、本書ではそれぞれ「DALL-E」、「DALL-E2」と表記します

2. 広義にはその脳のネットワーク構造等を意味しますが、本書では主に「機械学習によって獲得したモデル」で「入力→モデル→出力」を意味します。

試し読みはここまでです。
この続きは、製品版でお楽しみください。