Twitterのアイコン Facebookのアイコン はてなブログのアイコン

創作現場における生成AIの進展と課題

新しいサービスが日々発表され、様々な分野で進展している「生成AI」。文章・画像・音楽・音声などを扱えることから、創作現場でも活用されるようになった。一方で生成AI使用には様々なリスクやデメリットがあり、警戒感を示す人も多い。今、生成AIはどこまでのことができるのか、どのような使い方をされているのか、その利点やリスクは何か。実例とともに生成AIのあり方に迫った。

記事をpdfで見る(画像クリックで別ウィンドウ表示)

記事または映画評のサムネイル画像(A3用紙サイズ/横長)

ルーツ2024年4月号


創作現場における生成AIの進展と課題


ブラック・ジャックと生成AI

生成AI(ジェネレーティブAI)がどんどん社会に普及している。多彩な質問に対して自然な文章で返答することができる会話型AIの「ChatGPT」や、AIが画像を生成してくれる「Stable Diffusion」、AIが楽曲を作曲してくれる「Amper music」など、ジャンルも幅広い。Amazonの電子書籍出版サービスで電子書籍を登録する時には、文章や画像、翻訳において、出版するコンテンツを生成AIベースのツールによって作成した場合は申告することを義務付けられるようになったし、『Adobe』の「Photoshop」や「Illustrator」といった既成の著名なアプリケーションも、生成AI機能を備えるようになった。

「ChatGPT」は文章の添削・校正・要約、アイデアの提案、多言語間の翻訳で力を発揮する他、エクセル関数やプログラミングを行ってくれたり、カスタマーサポート的な役割を担ってくれたりもする。生成AIは、作業の効率化や生産性の向上、バリエーションが多い創作などの面において、人々の活動に広く寄与していくと考えられる。

一方で生成AIに対し、使用上のリスクを指摘する声もある。例えば「人間の仕事を奪う可能性がある」「本物と見まがうような音声や画像を生み出すことができ、詐欺やなりすましに使われる可能性がある」といったものだ。また、アルゴリズムによる人種などの差別といった偏り、意図しない情報の外部流出、生成手段や生成物の知財権をどう明確にするかなども大きな課題であると考えられている。

生成AIは現在、どこまでのことが可能になっているのか。そして、どのようなことに注意すべきなのか。創作現場における活用例を以下で詳しく見てみよう。

2023年11月、手塚治虫の代表作で、無免許の天才外科医であるブラック・ジャックが活躍する医療漫画「ブラック・ジャック」連載50周年記念企画として、「TEZUKA2023 ブラック・ジャック 機械の心臓—Heartbeat MarkII」という読み切り作品が「週刊少年チャンピオン2023年52号」に掲載された。本作品の大きな特徴は、制作段階で生成AIを活用していること。使われたアプリケーションは「ChatGPT(GTP-4)」と「Stable Diffusion」で、プロット(あらすじ)・ト書きの生成やキャラクター制作、漫画のコマ素材生成に用い、シナリオの練り上げ、ネームの作成、最終的なコマ割りやペン入れは人の手によって行われたという。

 
■シナリオ制作

プロットづくりには「ChatGPT」を活用。その中でプロジェクトを手掛けた「TEZUKA2023」のメンバーは、「生成AIの一番大きな課題は、人間が入力するプロンプトにある」と考えた(筆者注:「プロンプト」は生成AIに指示する時に使う命令書のようなもの。ここでは、意図した通りの成果物を得るために的確に指示するのが難しい、ということを意味する)。そこで、クリエイターと生成AIの仲立ちをしてくれる「インタラクティブプロンプトAI(以下、仲介AI)」を開発。クリエイターが「生成AIのプロンプト」に関する知識を必要とせず、また複雑な指示を与える必要もなく、「ジャンル」「テーマ」「登場人物」「ストーリー構造」「時代・場所」などの要素を容易に指定したり、AIへの指示や質問・回答のやりとりを繰り返すだけでプロットの作成やブラッシュアップが行ったりできる環境を整えた。

また、作品の世界観や物語の設定を統一するために、『はこだて未来大学』と『村井研究室』『手塚プロ』が共同で「ブラック・ジャック」200話と他の手塚短編作品200話を全て文字化して分析。そして“手塚治虫作品らしさ”を構成する要素とパターンを見出した。ただChatGPTに追加学習をさせる機能はないため、先述した仲介AIにデータやストーリー構造、登場人物の性格などをインプットさせ、“ブラック・ジャック作品らしい”アウトプットができるようにしたという。

プロット作成を行ったクリエイターは、手塚治虫の息子の手塚眞、『私立探偵 濱マイク』シリーズなどで知られる林海象、脚本家・演出家として多彩な活躍をしている舘そらみ、手塚プロ×2チームの計5チーム。この5チームがAIへの質問→回答→質問のキャッチボールを何十回も繰り返し、プロットを作成していった。そして林氏のプロットが採用され、シナリオ制作へと移ったが、登場人物の感情や葛藤、人物同士の関係性、緊迫感や達成感など人間の心理面といった要素はAIには書き切れなかったという。プロットからト書きも制作してみたが、AIが作った台詞はどうしても説明的になってしまったため、台詞はほぼ全て書き直された。一方で出来事の面白さや意外性、全体のストーリー展開の骨格には“手塚治虫らしさ”があり、意外性も散りばめられていたそうだ。そうした経緯を経て作品化されたプロットは以下のような内容となった。

ピノコを連れて医療とAIの最先端技術が集まる企業を訪れたブラック・ジャックは、CEOから女性患者を診てほしいと依頼を受ける。患者には「AIを活用した完全な機械の心臓」が移植されていたが、完全なはずの心臓に血腫が発生していた。過去に同様の症状である本間血腫を治せなかったトラウマを持つブラック・ジャックは一度手術を断るが、ピノコの「どこからどこまでが人間なのか?」という問いに、この難題に立ち向かう決意をする。


■キャラクター制作

本作にはCEOの川村とマリアという2人の新キャラクターが登場する。川村のモデルは「TEZUKA2023」プロジェクトに参加しているメンバーであり、本人の顔写真を元に画像生成を行ったそうだ。一方、川村の娘・マリアはいくつかの条件をテキストで指定し、ゼロから生成した。いずれも「Stable Diffusion」が用いられており、手塚治虫風の画風を出力できるようにAIをカスタマイズしたという。

かつては「画像生成は学習データの範囲を超えない」という壁があり、例えば「かなり誇張した巨大な鼻」を持ったキャラクターを生成するのは難しかったという。しかし「Stable Diffusion」はテキストによる条件付けができ、かつ安定した出力が可能。「老齢の男性のモブキャラ」といった条件付けを行うことで、条件に合った調整がなされ、物語に矛盾しないキャラクター生成がほぼクリアできたそうだ。作品内に描かれてはいないが、ピノコを大人にしたり、ブラック・ジャックを太らせたりといった誇張表現も可能だという。

また、様々なアングルのブラックジャックとピノコの画像をAIで生成し、構図や位置関係の参考画像とする、という用い方もされたそうだ。

こうしてAIをフル活用して作り上げられた作品は「登場人物の表情にメリハリがない」「背景の書き込みが弱い」など、いくつかの弱点を指摘されながらも、奥深いテーマが盛り込まれたストーリーに仕上がり、高い評価を受けている。

各シーンで活躍する生成AI

「TEZUKA2023」プロジェクトの例に限らず、生成AIを活用した創作はすでに様々なシーンで行われている。

■絵画・デザイン・映像作品

2022年、米国コロラド州で行われた美術コンテストにて、AIを用いて制作された絵画作品が新進デジタルアーティスト部門で受賞し、物議を醸した。「AIアートを使って作品を生む人間は『芸術家』と言えるのか」といった批判もあったし、「AIの使用はPhotoshopなどの画像編集ソフトを用いるのと変わらない。ただし、受賞するほどの出来栄えにするには人間としての創造性が必要となる」と擁護する意見もあったという。

アトランタのラッパー、LIL YACHTYが2023年に世に出したアルバム『Let’s Start Here』のアートワークには生成AIが用いられた。AI独特の不気味な「潰れた顔」が印象的なジャケットとなっている。

デトロイトの映像制作会社『Waymark』が制作した12分の映像作品『The Frost』では、なんと全てのショットが画像生成AIにより生成されたそうだ。

■ライティング

ライティングの分野では第170回芥川賞を受賞した九段理江氏が、受賞作『東京都同情塔』に文章生成AIを活用したことを明かしている。AIの言葉をそのまま使っている部分は143ページあるうちの1ページに満たない程度とのこと。ユニークなのは、「ChatGPTに“取材”しながら書いた」という点で、「こういった人物が小説に出てきたら読者はどう感じるか」「この文体はどう思うか」といったことをヒアリングしたという。

生成AI×芥川賞ということで色眼鏡で見られることも多いが、実際に作品を読むと、省力的な問題や作家としての力不足を補うために生成AIを活用したとは感じられない。人間や社会、文化に対する深い洞察やイマジネーションがなければ成立し得ない作品であり、読み手は作者が作り上げた独特の世界観に魅了されるとともに、漠然と感じていた社会に対する感情を言語化されたような心持ちになるはずだ。

■音楽・ボーカル

画像生成AIの「Stable Diffusion」を開発した『Stability AI』は「Stable Audio」という音楽生成AIサービスもリリースしており、ジャンルや寄せたいアーティスト名、テンポ、入れたい楽器などをプロンプトで指定すれば音楽を生成できるということで人気を博している。また「Suno AI」は「車を運転している時にノリノリになれる曲」といったように、作りたい音楽の簡単な説明を入力するだけでボーカル・歌詞付きの楽曲を生成できるという機能を持つソフトだ。

 音声分野での生成AIの進化は目覚ましく、音声生成AIで作った「AIによるカバーソング」がSNSを中心に人気となった。著名なアーティストなどの声をAIに似させて思い思いの楽曲を歌わせるもので、模倣のクオリティも高く、非常に大きなポテンシャルを秘めているが、基本的に声の主に無断で行われており、アーティストの権利やリスペクトを鑑みて制限していくべき例と言えるだろう。

■ゲーム

生成AIとゲーム制作は相性が良く、積極的に利用されている。例えば“日本初のゲームAI専門会社”『モリカトロン』が生成AIの可能性と課題を検証する試みとして制作した『Red Ram』は、ユーザーが5つの質問に答えるだけでAIがテキスト、イラストをすべて自動生成し、マーダーミステリーのシナリオを作ってくれるソフトで、ゲームに必要な要素の多くがAIで生成できることが分かる。

また技術の進展により、シナリオからキャラクターデザイン、音楽、セリフがAIで生成できるのみならず、長い時間と多くの人数を要していたプログラミングや不具合のチェックなどの工程もコンピューターで行えるため、大幅に時間を短縮できるようになったという。『Game Developers Conference』の主催団体が3千人以上のゲーム開発者を対象に行った調査では、回答者の31%が「個人的に生成AIを仕事で使っている」と答えたそうだ。

生成AIが仕事を奪う危険性

生成AIが進展する一方で危惧されることの一つが、これらの技術が声優やイラストレーターといった創作に携わる様々な人々の仕事を奪うことだろう。生成AIがイラストを担えるとなればイラストレーターの仕事が奪われ、声を当てられるとなれば声優の仕事が奪われる可能性がある。こうした「生成AIの脅威」から表現や働き手を守るための動きは、国内外で活発化している。

アメリカでは俳優でつくる労働組合が、報酬の引き上げなどとともに、「このままでは人間の演技がAIに取って代わられる」として、俳優を保護するための規制などを求めて4カ月にわたるストライキを起こした。日本でも声優が所属する『日本俳優連合』が、生成AIを声優の“表現”に対する脅威だとして、「生成AI技術の活用に関する提言」を発表。「新しい技術の進化による社会の発展は望ましい」とした一方で、ガイドラインの策定や著作権法の見直し、「声の肖像権」の設立などを訴えた。

各プラットフォームも生成AI対策に動き出しており、『Tiktok』は2023年9月に生成AIコンテンツを明示する機能を試験的に導入したことを発表。同年11月には「YouTube」を運営する『Google』が、AI生成コンテンツの明示を義務づけた他、ユーザーや音楽会社が、アーティストなどの歌声を生成AIで模倣した動画の削除をリクエストできる機能を導入した旨を発表した。

日本では、2024年1月、生成AIのルールづくりに向けて、日本の産学連携の業界団体が設立された。『慶應義塾大学』などの4つの大学や日本の大手企業、『Microsoft』や『Amazon』の関連会社の日本法人など合わせて33の企業と団体が参加しており、今後は生成AIに関するルール作りに向けた提言や、教育プログラム開発・人材育成、生成AIの活用事例の共有などを行っていくとしている。

生成AIは善か悪か

「生成AIを使って作品を作った」と聞いた時、個人的にはある種の抵抗感を持ってしまうところがある。筆者の場合は「独創性の欠如」「創作者の個人的な経験・知見から生まれる思想・価値観の欠如」「その連鎖による創作物の全体的な質の低下」といったことを想起してしまうようだ。著作権の問題をクリアしたとしても、生成AIは(クリエイターが培ってきた技術や思想、価値観などを込めずとも)非常に短い時間でテキストや画像、音楽をアウトプットできてしまうことから、似通った表現が生まれがちであり、粗製濫造につながる危険性は高いと言えるだろう。

ただ、「TEZUKA2023」プロジェクトや九段氏の作品が示すように、使い方によっては創作を補助し、クリエイターのクリエイティビティを刺激するポテンシャルを秘めているのも確かだ。ChatGPTに創作関連のお題を出したり相談をしたりすると、こちらが驚くほどに創造的な回答を返してくれることが多い。例えば、「言葉が通じない世界での面白いドラマを考えてみてください」と入力したところ、以下のような回答をしてくれた。

興味深いテーマですね! 言葉が通じない世界で展開されるドラマは、文化の違いやコミュニケーションの重要性などを探求する面白いストーリーを生み出すことができます。以下に、そんなドラマのアイデアをいくつか提案します

タイトル: “言葉の彼方”

ストーリー概要:
舞台は現代の都市で、突如として地球上の人々が言葉を理解できなくなるという事件が発生します。ある日、世界中の人々が目覚めると、自分の言葉は通じなくなっています。主人公は、この混乱した状況の中で生き延びるために様々な人々と出会い、コミュニケーションをとる方法を模索します。
主人公は、偶然にも同じく言葉が通じなくなった他の人々と共に、言葉ではなく身振りや表情、そして共通の感情や目的を通じてコミュニケーションを取る方法を見つけます。彼らは文化や言語の壁を超えて共に行動し、新たなコミュニティを形成していきます。
しかし、やがて彼らはこの言葉の奇妙な消失が何者かの陰謀によるものであることを知ります。主人公たちは、言葉を奪った人物や組織を追跡し、事件の真相に迫っていきます。
このドラマは、言葉のみならず、身体言語や共通の感情を通じたコミュニケーションの重要性を描きながら、異文化間の理解と連帯の力を探求します。

このようなドラマは、言葉が通じないという普遍的なテーマを通じて、視聴者にコミュニケーションの本質や人間関係の複雑さについて考えさせることができます。

創作をしている時、どれだけ頼れる仲間がいても、際限なく「このアイデアをどう思うか」と聞いたり、「もっと良い例を出してほしい」と駄目出ししたりするのは難しいが、生成AIはどんな時でも何度でも対応できるという利点もある。言わばいつでも相談できる仲間であり、アイデア出しに参加してくれるブレーンであり、様々な指示に応えてくれるアシスタントなのだ。ChatGPTが回答してくれる例は、若干掘り下げが足りなかったり、社会への洞察に欠けている面があったりと、「もっとこうすれば良いのに」と思わせることが、かえって使用者のクリエイティビティを刺激してくれるようにも感じる。また、生成AIが取り扱える分野は上で示したように多岐にわたっており、発想力はあるが絵心のないクリエイターが生成AIを駆使して上質な映像やゲーム作品を創作するといった活用例も増えていくだろう。

終わりに

生成AIは有用であり、危険なもの。だからこそ、「是」か「非」かで判断するのではなく、どのように活用すべきか見極めることが肝要だと言える。「自分が楽をするためではなくて、人間が自分の限界、つまり能力の限界や思考の限界を乗り越えるために、AIを使うのが大事なんじゃないか」とは九条氏の言葉だ。また「TEZUKA2023」プロジェクトで生成AIに対する疑義に対する回答として、『慶應義塾大学』の栗原氏は以下のような答えを行っている。「AIは優秀な道具。道具は使い方次第」である、と。

view more-特集企画の一覧へ-