非営利の米国AI研究企業のOpenAIが2019年2月14日に自然言語の文章を生成する「GPT-2」を発表しました。この技術が悪意をもって応用される可能性があることから、GPT-2はオープンソースとはせずに縮小版モデルと論文のみを公開する形になっています。
GPT-2とは?
このGPT-2は40ギガバイトのネット上のテキストの次の単語を予測するために訓練されたTransformerベースの言語モデルとなっているようで、800万のWebページのデータセットで訓練して15憶のパラメータを持っていると、ITmediaニュースでは紹介されていました。
GPT-2は文章の冒頭部分のテキストを与えると、このテキストの文体と内容に適応した現実的で首尾一貫とした文章を自動的に生成できるようになっています。
現在のところはGPT-2は英語の文章にしか対応していません。したがって、英語で文章を与えて、英語で自動生成された文章を自動翻訳で日本語化するなどすれば、どんな精度の文章が生成されるのか(GPT-2の能力なのか自動翻訳の能力なのかが判りにくくはなりますが)確認することはできます。
従来のAIが生成した文章は文脈に一貫性がないところがありました。しかし、エコノミストの記事によれば、GPT-2は人が書いたものと見間違うような流ちょうな文章が生成されると紹介されています。小説の冒頭部分を与えると、うまく辻褄が合うように後段の文章を考えていって、原作とは異なるストーリーを完成させるというので驚いてしまいます。
WEB上の文章の質の低下
以前、ウェブサイト上にはアフィリエイトのために自動生成された文章が氾濫して、質の低いページの中から必要な情報を見つけ出すが大変な時期がありました。しかし、検索エンジンが賢くなってくれたおかげで、質の低い情報を持つページは検索結果で表示されなくなり、現在は信頼性の高い情報が表示されるようになっています。
今度、このGPT-2のような人工知能が活用されるようになると、ネット上には自動生成された文章が氾濫するようになってしまいます。フェイクニュースや小説などが簡単に生成されることで、オリジナリティがあるコンテンツの量を増やしたサイトが増えるかもしれません。
自動生成された文章が芸術的にも読む価値のある文章になれば話しは変わってきますが、人が作ったコンテンツを求める人が過半数の場合は、検索エンジンが自動生成された文章と人が作った文章を見分けなければいけません。いわば、検索エンジンの人工知能とGPT-2のような自動生成アルゴリズムを持つ人工知能の競争になります。
大規模チェーンによる専門店化
すでに、WEB検索エンジンでは、大手のサイトなど信頼性が高いサイトが検索結果の上位を占めることが多くなってきました。逆に個人が運営する小規模なブログなどは検索結果でも下位になることが多くなっているように感じます。
今後、人工知能による自動生成された文章がネット上に氾濫する時代が来ると、さらにサイト単位で信頼性の高さが評価されるようになると予測されます。以前は商店街には個人経営の特色のあるお店がたくさん並んでいて、街ごとに特徴の違いが大きく出ていた時代がありました。しかし、現在はイオンモールやららぽーとのような大規模な専門店街が出現し商店街は衰退の一歩を遂げています。
また、大規模なショッピングモールの中に入居する大きなチェーン店のお店が占める割合が大きくなり、地域によっての特色はなくなり、どこのショッピングモールに行っても入居しているお店は似たり寄ったりといった状況になっています。(各ショッピングモールともフードコートなどで特徴を出せるよう努力していますが)
このショッピングモールに入居する専門店と同じようなことがWEBでも起こってくるのではないでしょうか。質の高い情報とは言っても、ライターの人が寄稿した当たり障りのない情報が主体となり、本音のところの情報がなかなか表に出てきにくいような形になるのがとても怖いです。そこは、消費者が直接、レビューや感想などの口コミを投稿できる機能を設けることで代替するのかとは思いますが、このような口コミ情報は一言コメントが多く、あまり体系的に整理された形では情報が伝わってきません。
口コミ情報の活用
たくさんの口コミ情報を入力にして人工知能が体系的に整理し、自動的に文章を掲載するサイトが増えていくのでしょう。既に現在でも要約された情報を箇条書き程度で掲載しているサイトもありますが、これが進化していく形と考えれば良いでしょうか。口コミ情報の中から信頼性の低い情報は排除し、閲覧者にとって質の高い情報が提供できるようになれば、そのサイト全体の検索サイトにおける評価も上がるのではないかと思います。
以前であれば個人による情報発信はブログで行われていましたが、今後は仲間内での情報共有はSNS、各商品、ビュースポット、食事などの評価は口コミ情報への投稿という形で収斂していくのかもしれません。
コメント