イベント
AI社会を生きるクリエイターの今と未来のあるべき姿とは。有識者とAIを語り合う特別講義,第1回「LivAI(リヴァイ)塾」聴講レポート
このセッションでは,「AI社会を生きるクリエイターの今と未来のあるべき姿を考える」をテーマに,AIの専門家である登壇者3名が意見を交わした。
LivAI(リヴァイ)公式サイト
生成AIは「あなたをサポートする24時間勤務の助手」
セッションの序盤,清木氏があらためて生成AIについて紹介を行った。そもそもAIとは,人間の知能を模倣し,学習・推論・判断などを自動で行う技術であり,大量のデータからパターンを学習し,新しいデータに対して予測や判断を行う。その中で生成AIは,学習したデータをもとに新しいコンテンツやアイデアを生成するAIを指し,テキストや音楽,画像などさまざまなメディアに適用できる。
現在,最もよく知られている生成AIの1つがChatGPTだろう。清木氏は「事実を尋ねるのは,ハルシネーション(幻覚)が起きるため,現時点だとあまりいい使い方ではない」と指摘する。ハルシネーションの一例として,ChatGPT(GPT-3.5)に藤崎詩織(「ときめきメモリアル」の登場人物)のことを尋ねたところ,「サクラ大戦」の登場人物であると説明されたという事例が示された。
それらを踏まえて清木氏は,生成AIを「あなたをサポートする24時間勤務の助手」と表現した。ChatGPTのようにテキストを生成する大規模言語モデル(LLM)の生成AIは,「世界中の物事をまんべんなく知っている知識人」だが,うろ覚えのことを自信満々に言いがちだ。また時事ネタも得意ではないという。
その一方で,要約や翻訳といった与えられた情報を加工することや,常識的に結論を導くこと,そしてプログラミング言語などは得意である。
画像生成AIは「ひたすら世界中の画像を模写し続けてきた職人」であり,自分で表現したい絵はとくにないが,人から依頼されるといろいろ描いてくれる存在だという。加えて特定の絵柄やジャンルなどを指定されると,その指示に沿った絵ばかりを描くようになる。
こうした生成AIの大きな特徴として,清木氏は「24時間スタンバイしていて,いくら無茶ぶりされても怒らない」ことを挙げていた。
生成AIの重要なフェーズである「学習」と「推論」についても説明があった。ここで言う学習とは,人間が生み出したさまざまな物事を大量に分析し,そこからパターンを学習することだ。ポイントとなるのは,元のデータを丸暗記するのではなく,さまざまな抽象度でパターンを見つけ出すことである。
清木氏は,テキストの最初が「昔々」であれば,次は「あるところに」というワードが続く,あるいは「まったく」であれば「ない」というワードで受けるといった,抽象的なパターンの例を示した。
なおChatGPTのように,人間と同等かそれ以上に賢いAIの学習を行うためには,膨大な量のデータを入力し,スーパーコンピュータを何か月も動かし続けるような大量の計算が必要だ。人も時間もお金もかかるため,このクラスのAIを作れるのは世界でも一握りの企業に限られる。そうして学習した結果は,LLMや基盤モデルなどの「モデル」と呼ばれるデータになる。
推論は,人間が出した指示に対して,モデルの中にある学習したパターンを当てはめ,知的に見えるアウトプットを生成する──テキストや画像などを出力することを指す。
なお推論に必要な計算量は,学習に比べて少ないそうだが,ChatGPTクラスともなると家庭のPCでは難しいとのこと。そのためモデルを持っている企業は,生成AIを使ったテキストや画像の出力サービスを有料で提供できるというわけである。
生成AIの基本情報を紹介したところで,専門家3名による現在のAI事情についてテーマが移った。
鳥海氏は,OpenAIが2020年にChatGPT GPT-3を発表したことにより,皆に「これはいける」と思わせたことがエポックメイキングだったと語る。GPT-3の開発には膨大な人と時間,予算がかかっているわけだが,OpenAIがそれを実現したことから,GoogleやMetaなどが「同じことをやれば,同じ性能を出せる」とあとを追いやすくなったのだ。
清木氏もGPT-2までは「英語だと人間っぽいテキストを書く」という印象だったのが,GPT-3から一気に量が質に転化する瞬間が訪れ,LLMでさまざまなことができる世界になったと表現する。
また三宅氏はゲーム開発の観点から,GPT-2のミドルクラス程度であれば,サーバーを経由しなくともゲームに使えたことに言及した。しかしGPT-3以降は,ゲームに使うにはサーバーが必須となり,そのぶん金銭的な負担が発生する。ChatGPTにゲーム内のテキストを書かせるにしても,現時点では人間のシナリオライターで十分であり,あまり必要がない。
「ゲーム会社がそこに対してお金を払うのか,それともゲーム用サービス料金を設定するのか」と,三宅氏は疑問を呈する。その一方で「プラットフォーマーが特別な課金モデルを用意し,たとえばプレイヤーが月額300円払うと,ゲーム内の村人が賢くなって会話の受け答えをしてくれる。払わないプレイヤーの村人は,ただ挨拶するだけ」といった,ChatGPTをゲームに活用する例を挙げた。
ここで鳥海氏は,人狼ゲームをプレイするうえで求められるAI技術の発展を目的とする「人狼知能大会」の自然言語部門を紹介した。これまで古き良き言語処理を使って,いかにもな感じの会話がAI間で続いていたのだが,2023年にChatGPTを使うようになると,より高度な会話が交わされるようになったという。
その半面,処理に時間がかかるようになったため,返事が遅くなったとのこと。とくにGPT-4を使っている場合は,「誰が人狼だと思うか」という問いに対して,30秒くらい間を置いてから「誰だろうね」と答えるケースがあったそうだ。
ただ,そうした問題は会話だから無視できないのであって,「samansa」のようなAIがユーザーの相手をする出会い系アプリならばあまり気にならない。鳥海氏によると,実際の「samansa」は「よろしくお願いします」といった投稿をすると,AIがユーザーのプロフィールを参照して,翌日には「趣味が一緒ですね」みたいな返事をしてくるそうだ。
1990年代前半,日本で台頭したプレイバイメールにも話題は及んでいる。これは,定期的にプレイヤーが自身の行動をハガキや封書などに記して運営チームに送ると,その結果が送り返されてきて,それに沿ってまたプレイヤーが行動を記して送る……というやりとりを繰り返して進行するゲームだ。その運営チームの役割を生成AIに任せれば,毎日のようにゲームを進行させるのも可能になるのではないかということだった。
生成AIについて2023年に語るということ
テーマが「生成AIについて2023年に語るということ」に移ると,清木氏は,生成AIが日進月歩の技術であり,「何ができるのか」といったディスカッションをしても,すぐに内容が古くなるという大前提を説く。現在,ユーザーが使っていて「品質が低い」「使いにくい」と思うような部分は,すぐに修正されていくことを,ここ1年前後の事例とともに紹介した。
まず「生成AIを使うには長い呪文を唱える必要がある」と捉えている人は,現状でもまだ多い。実際,Stable Diffusion v2.1は,プロが描いたものから小学生の落書きまで学習しているため,「illustration, a cat playing a video game」(猫がゲームを遊んでいるイラスト)というプロンプト(呪文)を入力すると,なかなか高いクオリティのものは出力されない。そこで「masterpiece」(傑作)や「best quality」(最高クオリティ)といったキーワードを強調する必要があった。面白いところでは「unreal engine」も,そうしたキーワードの1つであるそうだ。
ところが,先日リリースされたDALL-E 3は「ビデオゲームを遊んでいる猫の絵画」という日本語をプロンプトとして入力しただけで,かなり高いクオリティのものが得られる。さらにChatGPTとDALL-E 3を統合した場合には,追加のプロンプト入力が可能となり,たとえば「全体的に可愛く」といった指示も可能だ。
清木氏は「外注のイラストレーターにコミュニケーションを取っているような感覚で絵が描けていく。この1年で,ひたすらプロンプトを練り込むような作業は何だったんだろう,みたいな話になっている」とコメントしていた。
また「AIによる画像生成はガチャみたいなものだから,数百枚数千枚と生成して,その中からベストのものを選ぶ」という認識も,もはや過去のものだという。2023年初頭,被写体のポーズや構図などを制御可能にする技術であるControlNetが登場し,見本となる画像を入力すると,それに沿った画像が出力されるようになっている。見本はしっかり描かれたものだけでなく,線画やいわゆる棒人間のようなものでも構わない。
「生成AIは学習データが怪しいので商用では使えない」──つまり,著作権などの問題が生じかねないという認識も古いとのこと。たとえば2023年9月に一般提供が開始されたAdobe Fireflyは,Adobe Stockに収録された素材や完全に権利がフリーな素材など,権利関係がきちんとクリアになっているものしか学習していないことを謳っている。
セッションの冒頭で言及された「大規模言語モデルには事実を尋ねてはいけない」という課題──ハルシネーションの問題も,すでに解消に向けて研究開発が進められているとのことだ。
ChatGPTのマルチモーダル化が始まっており,テキストだけでなく,画像や音声を扱えるようになっていることも紹介された。
さらにChatGPTにExcelなどのデータファイルを入力し,チャットで指示するだけで,それなりの分析をしてくれるAdvanced Data Analysisも登場している。綺麗に作られすぎていて機械が処理できないExcelデータも,雰囲気を察した分析ができるところがポイントだ。
ゲーム開発において,「絵が描けるだけの生成AIは使えない」という認識もあるが,それも覆されつつあるという。2Dの画像を入力すると3Dモデルがテクスチャ付きで生成されるCSM.aiや,画像だけでなくテキスト入力も可能なDreamGaussianが紹介されていた。ただ,現時点ではまだゲーム開発に使えないレベルとのこと。
また,テクスチャの貼られていないモデルを入力し,テキストやコンセプト画像で指示を出すと,それを元にテクスチャが生成されるMeshyというツールも存在する。
これらの事例から,清木氏は「毎月のように新しいトピックが出てきて,できることが増えていく状況。今は『これができない』と言われていることも,数か月後にはできるかもしれない」とコメントした。
そして,生成AI技術の変化の本質を「アイデアを出す,柔軟に分析する,絵を描く,動画を作る,コードを書く。これまで人間しかできないと思われてきたジャンルのタスクが,機械でできるようになったということ」であると指摘する。
すなわち,人に頼むしかなかった部分であり,これまで人間しかできないと思われてきたジャンルのタスクが機械ができるようになった。しかも,機械なので多くの作業をやらせても疲れることがなく,いつでもタスクを依頼できるというわけである。さらに技術の進化に伴い,性能は段々高くなり,利用コストは下がるというメリットもある。
これらをまとめて,清木氏は「手作りしていたものを大量生産できるようになった。産業革命の知的労働版と言えるかもしれない」との見解を示す一方,「手作りがいい,人間が作ることに良さがあるという価値観も当然残っていく」と語った。
クリエイターの生成AIとの付き合い方
クリエイターは生成AIとどのように付き合っていけばいいか。この問いに対し,清木氏は「助手ができるだけであって,依頼するのはあくまでもクリエイター自身」と回答した。たとえばアートディレクターは,これまでアーティストに依頼してコンテンツを制作してきたが,今後は生成AIのユーザーすべてがアートディレクターになる認識とのこと。
その一方,生成AIの利用コストが安くなると,それによって多くのユーザーがコンテンツのクオリティを高められるようにもなる。したがって,生成AIをしっかり活用していかないと,ほかと差が付いてしまうということも起こり得るとも指摘していた。
三宅氏はゲーム開発の観点から,「生成AIは,生成物とゲームクリエイターとの接続ポイントを何も考えてくれない」と持論を語った。たとえば生成AIにプログラミングさせたとして,そこからプログラマーにコードを渡すのかどうかという部分は,ゲーム業界側が考えなければならないというのだ。
そして,それはアートやデザイン,音声などのあらゆる分野に及び,より大きな業界──たとえば鉄鋼業界では扱わない分野が多くを占めるため,ゲーム業界が取り組まなければならないと見解を述べる。
さらに,「生成物とゲームクリエイターをつなぐトンネルのようなものを作った人は,ゲーム業界の歴史に名を残すかもしれない」と三宅氏は語る。たとえばコンピュータは,40年かけて現在のスマートフォンの形に収束したが,それはエンジニアではなくUIデザイナーの業績である。そして現在,一番優れたUIデザインができるのはゲーム業界であるという。
鳥海氏によると,2023年前半に「これから来るAI絡みの職業」として,プロンプトエンジニア──つまりプロンプトを上手に書く人が挙げられていた。しかし前述のとおり,今やプロンプトを必死になって工夫することはバカバカしいくらいの話であり,清木氏は「むしろ外注を含むチーム内のスタッフに何かを依頼するときに,どう伝えたらうまく進行するかを考えるスキルが必要になる」と語る。
それは人と人,人とAIをつなぐスキルであり,三宅氏が指摘したようなAIではできない部分でもある。清木氏は「AIは,誰がやっても同じ結果になりそうなことが得意。一番根幹にある,『何をやるのか』という動機の部分を人間側が持っていないと難しい。それ以外のところが,どこまでAIに置き換えられるのかは,1年後を見ないと分からない」と説明を加えていた。
生成AIが出力した生成物のオリジナリティに関しても言及された。「生成AIは学習したものしかアウトプットできない」といったことが語られるが,生成AIはパターンを学習しているため,それらの組み合わせによって学習データの中にはなかったようなものを生成することもあるという。
このようなパターンの組み合わせによって生まれてくるものに,クリエイティビティはないのかといった議論もあるそうだ。その一方では学習データから生成物を出力している以上,「人類を一歩先に進めるような新しい何か」を生み出すことはできないだろうという見解も示された。
ゲームに関する事例では,ChatGPTに対応したインディーゲームがSteamから配信を拒否されたことがある(現在は配信されている)。一方,Epic Gamesのティム・スウィーニー氏は「Epic Gamesストアでは,新しい技術を使ったゲームを歓迎する」という旨を表明した。
またBOOTHやpixivFANBOXなど,創作活動の収益化が可能な国内の各サービスでは,ゲームに限らず生成AIによるコンテンツの出品を制限している。これは生成AIが急速に普及したため,権利関係の社会的な合意が形成されるのを待ちたい,というのが表立った理由である。Steamも対外的に,そのように説明している。
清木氏は,生成AIによって制作コストが下がるため,大量にコンテンツが投稿されて場が荒らされることへの対策なのではないかという見解を示す。生成AIによってクオリティの高いコンテンツが増えていくのであればいいが,とにかく低い制作コストで作られたものばかりが増えると,真面目に作っている人のコンテンツが埋もれてしまうというわけである。
一方,受け手側にも,クリエイターが生成AIを使うことに違和感を持つ人がいる。イラストレーターが生成AIが出力したかのようなイラストを投稿したところ,炎上したため,レイヤー分けされた元データを公開して,自身が描いたことを証明しようとしたという事例があるのだ。
そうした違和感の根幹について,清木氏は「創作は人間のみに許された行為である」という意識があり,「生成AIは,人間の生み出してきた創作物をフリーライドしている」という感覚があるのではないかと説明する。
また,クリエイターが苦労してコンテンツを作っているという部分に価値があり,生成AIを使っていると,手を抜いている,ひいてはズルをしているような感覚を受けるのではないかとも指摘していた。
実際,VOCALOID(ボーカロイド)が登場したときにも似たような議論があった。しかし,VOCALOIDは音楽の1ジャンルであり,聴くかどうかは個人が選択できる状態だった。生成AIはもっと不可逆な形で人々の生活に入り込んでくることが予想できるため,それがどのように受容されていくのかがポイントとなると,清木氏は語っている。
AIによって仕事は奪われていくのか
「AIによって人間の仕事が奪われていくのか」という話題になると,鳥海氏が「ディープラーニングが台頭した頃に同じような議論をしたが,今となってはそうでもない。生成AIも似たようなことになるのではないか」とコメントした。また,写真が登場した当時を引き合いに出し,「絵を描くという創造的な行為を奪われたはずだが,今なお,絵を描く行為自体は残っている」と語り,仮にAIの描いた絵が大量生産されても,それとは違う形で人間の描いた絵が残っていくだろうと説明する。
ゲーム開発において,これまでは大規模なチームだけが大規模なゲームを作れた。三宅氏は,生成AIによって400人のチームと4人のチームが見かけ上,同じ量のコンテンツを作れるようになり,大規模チームの優位性が崩れると話す。もちろん重要なのは量より質だが,生成AIによって質もどんどん上がっていくと予想できる。
そうなると,最終的には受け手側が選ぶことになると三宅氏は語る。400人で作ったゲームと4人で作ったゲームの規模が同じであれば,おそらく前者のほうが質は高くなるだろうが,前者は4年に1作,後者は半年に1作というペースでリリースされたときに受け手はどちらを選ぶのか。そこは世に問うというのが,三宅氏の見解である。
セッションの終盤には,清木氏が「生成AIで最終的なコンテンツを作るのではなく,コンテンツを作る人間を生成AIがいかにサポートするのか,いかに人間の力をエンハンスドしていくのかを考えることが,人類を次のステップに上げる分析において重要な視点」と指摘する。その一方で,「それを手抜きやズルと思われることについて,どうやって社会的な認識を揃えていくのか」という課題を示した。
鳥海氏は,生成AIが世界的に利用されるようになってまだ1年も経たないため,「我々は生成AIのことを何も知らない」「これからいろんなことが分かってきて,それに応じて社会もどんどん変わってくる。当然,社会と技術は常に相互関係になるので,その中でぐるぐる回しながらどんどん発展していく」と語る。「今はズルという人もいるが,5年後はそんなことを思わなくなる。構造自体が変わるので考え方も変わり,今は問題視されていることが問題ではなくなる。それを見据えて,いろいろやっていくしかない」と見通しを述べた。
そして,三宅氏は「ゲームデザインの探究に生成AIが使われるようになる」と指摘した。これまでのゲームデザインは,人間がパラメータを手動で変更し,実際にプレイして試すことを繰り返していたが,今は生成AIがゲームデザインを作っては試すことを自動で繰り返し,面白いものを見つけ出すという形で進められるようになりつつあると話していた。
LivAI(リヴァイ)公式サイト
- この記事のURL:
キーワード