話題の文章生成AIを使えば自動でゲームレビューが書けるぜ!!!
……といったノリの企画を立てたところ、想像以上に難しく、思ったようにはいきませんでした。もちろんそのノリは半分冗談で、実際には適切なAIの活用法を紹介する流れを想定していたのですが、実用レベルとなると一筋縄ではいかなかったのです。
本稿では「文章生成AIはゲームメディア/ブログ向け原稿制作の味方となるか」をテーマにし、具体的な利用法を模索してみました。いくつかのサービスや技術的な要素が登場しますが、利用するまでの具体的な手順については省略します。導入方法は検索ですぐに見つかりますので、ご容赦ください。
この記事はこんな内容です
AIがあれば何でも書ける!!
……と思っていた時期がありましたChatGPTにレビュー執筆をお願いする
まずはゲームタイトルだけを提示与えた感想を基に作ってもらう
列挙した『Portal』の感想からどこまで作れるか段落ごとに文章を調整してもらう
おおまかなレビューを自分で書き、ひと段落ずつ読み込ませるえっ?スプレッドシートでGPT関数を!?できらあっ!
表計算で連続的に複数の段落を調整させるそうだ!喋った感想をまとめてもらおう!
AI文字起こし「Whisper」で得たデータを段落ごとに調整させる原稿を書く大変さを分析してみる
AIに任せる仕事を切り分けるため、問題をシンプルにしてみるまさに日進月歩!Microsoftの新たな刺客!!
「GPT-4」が実装されたBingで一気に処理させる人間はAIを強め、強いAIに人間が頼る
メディアが勝負すべき要素とは何か
ChatGPTにレビュー執筆をお願いする
まずは「ChatGPT」に有名なゲームのレビューを書かせてみました。すでに世の中で多くのレビューが書かれているタイトルならば、そこそこの内容の出力が得られます。しかし、発売直後で情報が少ないゲームだと、嘘や間違いが混ざったレビューが作成されてしまうこともありました。これではそのままレビューとして使うのは無理があります。また、当たり前ですがこの方法では筆者本人の意見は全く反映されていません。
与えた感想を基に作ってもらう
次に、自分の簡単な感想を列挙して、それをレビューとしてまとめてもらうことにしました。
この方法だと文章として成り立つものが出力されますが、レビューという長い文章にまで膨らませようとすると物足りないものとなりました。具体的な要素を詳しく説明させるには、自分で追加の情報を入力しなければならなかったのです。
ここではハードコアゲーマーならおなじみであろう一人称視点パズル『Portal』を例にとりましょう。2つの転移ゲートを生成する“ポータルガン”や物理法則が適用されること、パズル内容や人体実験を思わせるバックボーンなど、『Portal』の特徴的な要素とその印象を入力していきます。
しかし詳しく入力するほどChatGPTはそのまま転用してしまい、結局は自分で書いている(入力した)ものと変わらない文章になってしまいました。小さな要素から組み立てさせる方法も悪くはないと思いますが、これならば初めから原稿として書いてしまう方がいいでしょう。つまり、文章生成AIを活用したと言えるほどのものにはなりませんでした。
段落ごとに文章を調整してもらう
次に試したのは、ラフに文章を書き、ひと段落ずつ読み込ませ整えてもらうという方法です。例えば「『Portal』とはValveが発売したパズルゲームで、一人称視点で遊ぶ」といった文を、しっかりとした記事のように少し膨らませるよう指示し、これを繰り返して最終的に全て繋げレビューとする、という方法です。
ChatGPTはチャットのように使えるので、一回入力するとすぐに返事が来ます。しかも、前後の文脈も参照してくれるので、ゲームのタイトルなどを何度も入力しなくても次の出力に反映してくれます。ひと段落程度の内容ならば入力に無理がなく、時には間違いを直してくれることもありました。
Game*Spark のレビューでは、「ストーリー」「操作感」「グラフィックス」などを評価し、3段階での採点を下しています。そのような数千文字級の長文にも対応できるのではないかと期待しましたが、ChatGPTの1回のチャットスレッドでは、入力の量や前後関係の追跡に限界があるようでした。ひと段落ずつ入力を進めているうちに、途中で質問の意図がずれたり、整えるための文章を「命令」だと勘違いするようになってしまいました。
OpenAIのウェブサイトには、ChatGPTが採用している言語モデル「GPT-3」を試せるプレイグラウンドという機能があります。ここでは、入力と出力の量を細かく設定できます。しかし、一回のやりとりで使えるトークンの数は4000程度に限られています。トークンは文字数に換算すると、1000トークンで日本語700文字程度でしょうか。GPT-3からの出力も含めると、それぞれ3~4段落ぐらいまでが限度です。それ以上になると、出力が途切れたり、返答ができなくなったりします。これがChatGPTでも同等の制限であるとするならば、前後関係の認識に限界が出てくるのも理解できます。これが現時点での限界と言えるでしょう。
レビューのような長文では段落が全て独立しているわけではありません。前後の関係がわからないと困ります。従って、この方法ではレビューを組み立てるのが難しいということになります。自分が書いた段落を読みやすくしたり、間違いを直してもらったりするくらいならば有用なツールと言えるかもしれません。