blog

ChatGPTの基本的な仕組みを分かりやすく解説!GPT-3.5とGPT-4の違いも紹介

2022年11月に公開されて以来、世界中で利用者が急増しているChatGPT。文書の作成、企画の考案、AIチャットボットへの応用など、さまざまな形で使用されています。ChatGPTの登場により、今まで人間が担当していた作業の一部をAIに任せられて、上手に使うとより低コストかつスムーズに仕事ができるようになりました。

本記事では、そんなChatGPTの仕組みや既存チャットボットとの違いを初心者にも分かりやすく解説します。ChatGPTを取り入れたサービスを開発したい、ChatGPTに関する基礎知識を身に付けたいという方はぜひ参考にしてみてください。

目次

ChatGPTとは?

ChatGPTは、2022年11月にアメリカに拠点を置くOpenAIという企業が公開した生成AIです。ゲーム内の会話や小説を作る目的で開発された「GPT」という言語モデルをベースとしており、利用者が入力した内容に対して人間同士の会話に近い形式で回答を生成するのが特徴です。インターネット上に公開されている膨大な情報を学習しており、回答内容の精度と柔軟性の高さを兼ね備えています。

GPTは2018年にGPT-1が登場し、その後2019年にGPT-2、2020年にGPT-3とアップデートを繰り返してきました。ChatGPTとして一般ユーザーに公開されたのは2022年登場のGPT-3.5からで、2023にはGPT-4も有料版として公開されています。

ChatGPTが対応できる作業は、プログラミングや文書の作成をはじめとした仕事に関すること、マルバツゲームのような娯楽、小説の執筆や作詞といった創作活動などさまざまです。誤った内容をChatGPTが回答しても、ユーザーが訂正する文章を送ることでより正確性の高い会話ができるようになります。

2024年1月18日時点では無料版ChatGPTと、有料版の「ChatGPT Plus」がリリースされています。今後はより複雑な対話に対応できるよう改良し、さらに人間同士のコミュニケーションに近づける計画もあるのだとか。ChatGPTは従来のチャットボットと比べると幅広い事柄に対応しており、個人・企業を問わず活用の場が広がることが期待されている生成AIです。

ChatGPTの仕組み理解

ChatGPTの仕組みには、アルゴリズム・データセット・評価モデル・学習方法の4つが大きく関わっています。それぞれの言葉の意味は以下の通りです。

  • アルゴリズム:答えが決まっている問題に対して、その回答を正しく導き出す手順や計算方法
  • データセット:ある目的で集積され、一定の形式に整理されたデータの集合体
  • 評価モデル:生成された回答の精度を人に代わって評価する評価指標
  • 学習方法:大量のデータを読み込み、適切な回答をするための具体的なプロセスをトレーニングする作業

用語の意味をざっくりと把握しただけでは、その用語がChatGPTの仕組みとどのような関係があるのか想像しにくいと感じた方もいるかもしれません。下の見出しでChatGPTの仕組みをより詳しく解説しているので、確認してみましょう。

アルゴリズムとは

アルゴリズムとは、課題の解決や目標達成のために使用する計算方法や処理方法のことです。もともとは、プログラミングに関する専門用語として用いられていました。膨大な量のデータを素早く処理するためにプログラムへ組み込まれたものを「アルゴリズム」と呼びます。

ChatGPTが使用しているアルゴリズムには、「InstructGPT」という名称が付いています。InstructGPTは、人間が望む回答をChatGPTが生成できるようにした大規模言語モデルのこと。インターネット上に公開されている情報を中心に学習し、より人間が好む回答を生成するよう微調整できるのが特徴です。

ただし、利用者に好まれる文章をプログラミング言語やアルゴリズムの関数などで完全に表現するのは簡単ではありません。そこでInstructGPTは、人間から直接与えられたフィードバックも参照したうえで文章の内容や表現方を学習し、さらに精度の高い回答を生成できるようにしています。

人間からのフィードバックも参照してアルゴリズムを学習させる方法は、「Reinforcement Learning from Human Feedback(人間のフィードバックによる強化学習)」とも呼ばれています。人間が事前に入力した正しいデータをもとに、ChatGPTが生成した文章を見比べることで、文章表現の良し悪しを学習しているのです。

ChatGPTが本物の人間が回答しているような文章を高精度で生成できるのは、InstructGPTで膨大な数のデータを学習しているからと考えられます。そして公開以来こまめにアップデートが実施されたり、開発者の設定次第でより正確性と柔軟性を備えた回答を生成したりできるのは、Reinforcement Learning from Human Feedbackによる反復学習が功を奏していると言えるでしょう。

データセットとは

ChatGPTはインターネット上に公開されているWebページに加え、書籍や論文などさまざまなコンテンツから情報を収集しています。収集したデータはそのままだと内容が整理されていないため、データセットとしてまとめたうえでChatGPTに反映します。

ChatGPTで使用しているデータセットは、知識や文法を学習するものや、質疑応答に対応するためのものなど複数の種類が存在しているのが特徴です。今回はそのなかでも特によく使用されている、Common Crawl CorpusとBooksCorpusについて解説します。

Common Crawl Corpus

記事執筆時点では、多くの人が利用しているGPT-3.5とGPT-4において、どのようなデータセットを利用しているかは公開されていません。ただし両者ともGPT-3をベースとしているため、GPT-3が使用した学習データをもとにGPT-3.5とGPT-4で使っているデータセットもある程度推察できるでしょう。

GPT-3が使用したデータセットは、Common Crawl Corpusです。Common Crawl Corpusとは、インターネット上で公開されているWebサイトを巡回し、集積したデータをまとめている巨大なデータセットのこと。2008年以降の情報を扱っており、開発者でなくても誰でも無料で使用できます。

GPT-3では学習するにあたって複数のデータセットを使用しており、約60%はCommon Crawl Corpusが占めていました。Common Crawl Corpusでは文章だけでなく会話に関する情報も集めており、コンピュータで素早く正確に処理できるよう言語データベースとして構造化されています。ChatGPTが本物の人間と会話しているような自然な文章を生成できるのも、Common Crawl Corpusを使ったことによる効果であると言えます。

ただしCommon Crawl Corpusは世界中のデータを学習しているため、日本語以外の言語の情報も含まれています。特に多くの割合を占める言語は英語で、その比率は約50%。日本語のデータは全体の約5%とされており、英語と比べると日本語に対するデータセットとしての性能は低くなると考えて良いでしょう。日本語での返答が不自然であった場合は、一度英語で返答を生成させ、その後日本語で生成させると改善が見られることがあります。

BooksCorpus

BooksCorpusは、インターネット上に掲載されている書籍の情報をまとめたデータセットです。ロマンス・歴史・SF・冒険・ファンタジーなど、全16ジャンルの未発表書籍の情報約1万1,000本を集積しています。

BooksCorpusに集積する書籍は、主にアメリカで自費出版電子書籍のプラットフォームとして使われている「Smashwords」から集められました。BooksCorpusが集めている書籍は小説が多くを占めており、小説の舞台となる世界観や登場人物の感情の変化を学習させているのが特徴です。

BooksCorpusはChatGPTの開発において、本物の人間と会話しているような文章の生成に役立てられてきました。小説で繰り広げられる状況や、その状況に直面した登場人物の感情を学習し、利用者の望む返答に近づけるようにしているのです。ChatGPTが小説の執筆や作詞といった創作活動のサポート役として役立てられているのも、BooksCorpusで学習した成果のひとつと考えられます。

BooksCorpusはマサチューセッツ工科大学とトロント大学の研究者が執筆した、「Aligning Books and Movies: Towards Story-like Visual Explanations by Watching Movies and Reading Books」という2015年の論文のなかで公開されました。初期のBooksCorpusはトロント大学のウェブページで公開されましたが、2024年1月18日時点では非公開となっており、代わりにBookCorpusOpenが作成されています。

BooksCorpusはChatGPTの原点とも言える、GPT-1を学習させるためのデータセットとして使われました。GPT-2では、アメリカの掲示板サイトRedditから集めた40GBものテキストデータを学習しています。アップデートを繰り返してもGPT-1でBooksCorpusを使用して学習したことは引き継いでおり、GPT-3.5やGPT-4にも反映されていると言えるでしょう。

評価モデルとは

評価モデルとは、生成された回答の精度を人に代わって評価する評価指標のこと。ChatGPTでは、「Reward Model(通称:RM、報酬モデル)」という評価モデルを使用しています。Reward Modelでは、ChatGPTが生成した文章を「スカラー」というスコアで評価します。スカラーを算出する際に用いる評価軸は、次の3項目です。

  • 正確性
  • 倫理観
  • 有益性

正確性では嘘の情報を用いていないか、利用者の誤解を招くような表現をしていないか等を確認します。ChatGPTは、インターネット上の情報を広く学習した生成AIです。ChatGPTが学習した情報のなかに、間違った情報が含まれている可能性は捨てきれません。そこでReward Modelを用いて、生成された文章が正確かを評価しているのです。

倫理観では、人や環境を傷つける表現を用いていないかを確認します。ChatGPTを含むAIは、インターネット上に掲載されている偏見やステレオタイプも学習しているケースがよくあります。生成された文章によって不適切な情報や、見た人が不快感を覚えたりするような情報を広めないよう、Reward Modelでチェックしているのです。

有益性とは、利用者にとって役立つか否かということ。ただ単に正確な情報を伝えるだけでなく、利用者の悩みや疑問を解決したり、作業を進めたりできるような文章が生成されているかも、Reward Modelの評価対象です。

Reward Modelは、専門的な知識を有している人なら自分が保有しているデータでトレーニングさせることも可能です。企業向けのチャットボットとして会社の情報やビジョンを反映させるのに役立つ一方、誤った情報を学習させてしまうと不適切な文章を生成してしまう可能性もあります。ChatGPTをカスタマイズする際は、覚えさせる情報を人の目で精査することが大切です。

学習方法とは

ChatGPTの学習方法には、今まで紹介してきたアルゴリズム、データセット、評価モデルが密接に関わっています。ChatGPTの学習プロセスは主に「事前学習」と「ファインチューニング」の2つの工程で構成されており、その両方でアルゴリズムとデータセットが関わり、学習結果や生成されたものを評価モデルが評価しています。これらのプロセスを何度も繰り返すことで、正確性の高さをより強化していくのです。ここではChatGPTに関する学習方法について、詳しく解説します。

事前学習

まずはAIに膨大な量のテキストデータを読み込ませ、言語モデルを形成するため事前学習を行います。言語モデルとは、利用者が入力した文章への返答やChatGPTが生成する文章に続きそうな言葉を予想し、適切な形で出力するためのモデルのことです。AIに自然な文法や言い回しを学ばせたり、文章の流れや意味を理解したりできるようにすることを目的に、事前学習を行います。

事前学習では開発者や利用者が何か手を加える必要はほとんどなく、テキストデータさえ用意すればAIが自動的に学習します。AIが行う事前学習の流れは以下の通りです。

  1. テキストデータのトークン化
  2. 言語モデルの構築
  3. 次のトークンを予想する訓練
  4. 反復学習
  5. パラメータの最適化

はじめに読み込んだテキストデータを、「トークン」という単語やサブワードといった細かい単位に分割します。トークン化したデータをもとに文脈の相互関係を学習して言語モデルを構築し、文章を生成する際に次のトークンを予想する訓練を行います。

1回訓練をするだけでは対応できる文章に偏りが出てしまうため、反復学習を経てより正確な返答ができるよう学習します。反復学習の内容は、与えられた文章から次の文章を予想し、文法や文脈のパターンを覚えることの繰り返しです。

パラメータとは、言語モデルをはじめとしたモデルの動きを制御する役割を担っている数値のこと。ChatGPTの事前学習においては、AIが予想したトークンと実際のトークンの差を測定し、より適切な動きができるよう練習します。

事前学習が完了すると、文章を生成する際に必要な汎用性の高いデータがAIに搭載された状態になります。ただしこの段階では、ChatGPTは人間が好む文章や正確性のある文章を生成することはできません。ChatGPTとして利用者が使える状態にするには、後のファインチューニングと学習も経る必要があります。

ファインチューニング

ファインチューニングとは、既に事前学習してあるモデルを追加のデータでさらに学習させることです。ChatGPTが文章の生成をはじめとした特定のタスクに対応できるようにすることを目的に実施します。ファインチューニングで追加するデータの情報源は、Webページ・書籍・論文などです。ファインチューニングが完了したモデルのことは、「SFTモデル」と呼ばれています。

ChatGPTにおけるファインチューニングの特徴は、準備に要する時間を短縮できること。従来のAIをファインチューニングするときは、「教師データ」を人間が用意する必要がありました。教師データとは、入力データと正解がセットになったデータのことです。例えば感情の分析では、「プレゼントをもらうと嬉しい」「財布を落とすと悲しい」のように、出来事と感情をセットにしたデータを教師データと言います。

教師データの数が豊富であるほどAIが学習できる事柄が増え、柔軟性や正確性の面でより高いパフォーマンスを発揮できるようになります。しかし教師データは開発者側が用意するのが一般的であるのに加え、データの量が膨大なため、開発過程のなかでも特に時間を要するものでした。

一方ChatGPTでは、事前学習の時点でトークン化したテキストデータをファインチューニングで使用しています。トークン化したテキストデータを用いることで、一部のトークンを隠し、隠された部分を予想する訓練を自動的にこなせるようになっています。人間が膨大な教師データを用意する必要はなく、テキストデータを与えるだけでファインチューニングができるのが、ChatGPTの画期的なところです。

学習

ファインチューニングが完了した状態になったら、ChatGPTが使用している評価モデル「Reward Model」を使用して、生成された文章が適切な内容であるかを確認します。Reward Modelが評価対象としている項目は、正確性・倫理観・有益性の3種類。各項目の評価をもとに、良い文章かを判断した「スカラー」というスコアで評価します。

ファインチューニングが完了したモデルは、「SFTモデル」と言います。このSFTモデルのスカラーが高くなるよう、学習を何回も繰り返します。

SFTモデルの学習に使われるのは、「PPO」という強化学習モデル。PPOは「Proximal Policy Optimization(近傍方策最適化)」の略称で、現在の状態や過去に集積したデータをもとに、最適な行動を導き出すためのアルゴリズムです。

PPOの特徴は、SFTモデルの大幅な変更を防ぎつつ、生成される文章や対応方法の最適化を目指せるところ。このPPOを使用した学習を繰り返すことで、ChatGPTは利用者が入力した文章へ柔軟に返答したり、感情の微細な変化に対応したりできるようになります。

ChatGPTと既存チャットボットの違い

ChatGPTが登場する前から、利用者の問いかけに対して返答するチャットボットは存在していました。自動的に返答を生成するAIは既に登場しているのに、なぜChatGPTは世界中から注目されているのでしょうか。ここではChatGPTと既存チャットボットの違いから、ChatGPTの特色を紐解いていきます。

まずは、ChatGPTと既存チャットボットの違いを確認してみましょう。以下の表に、両者の違いをまとめてみました。

ChatGPT既存チャットボット
仕組み質問に対してリアルタイムで回答を生成する事前に登録された内容を回答する
回答内容その都度変わる常に同じ
得意分野自然な文章の生成アイデアの考案クイズの作成・回答問い合わせ対応アンケート・調査予約受付
問題点常に正しい回答ができるとは限らない事前に登録されていない内容には対応できない

ChatGPTはインターネット上のWebページを中心にさまざまな情報を学習しているため、漠然とした質問にも柔軟に対応したり、創造性に富んだ返答をしたりできます。しかしChatGPTが学習しているデータには誤りが含まれている可能性があり、常に正しい回答ができるとは言い切れません。

一方、既存チャットボットは事前に登録された内容を回答するため、正確性はある程度保証されています。ただし想定外の質問には対応しきれない側面もあり、柔軟性には課題が残ります。

ChatGPTと既存チャットボットには、どちらも得手不得手があるため、クリエイティブな仕事をするときはChatGPT、お客様対応は既存チャットボットのように、基本的には用途に応じて使い分けるのが良いでしょう。

2023年3月にはChatGPTのAPIが公開され、既存チャットボットとChatGPTを連携させて使えるようにもなりました。活用方法の幅をさらに広げたり、運用効率をより向上させたりしたいときは、ChatGPTと既存チャットボットを組み合わせることも可能です。

ChatGPTの種類の違い

GPTは2018年に登場した初期モデルGPT-1からアップデートを繰り返しており、記事執筆時点では2022年登場のGPT-3.5と2023年登場のGPT-4がChatGPTとして一般ユーザーに公開されています。数字が大きいほど新しく、機能も改善されるため、GPT-4の方がGPT-3.5よりも性能が良くなっていると考えられます。それでは、具体的にGPT-3.5とGPT-4にはどのような違いがあるのでしょうか。下の見出しで、それぞれの特徴を解説します。

GPT-3.5の特徴

GPT-3.5は、2022年に登場しました。ひとつ前のGPT-3との主な違いとして挙げられるのは、以下の3点です。

  • パラメータ数
  • インターフェース
  • 強化学習

GPT-3のパラメータが1,750億なのに対し、GPT-3.5はパラメータが3,550億まで増加しています。パラメータが大幅に増加することで、より多くの質問に、豊富な表現を用いて回答できるようになりました。

ChatGPTとして一般ユーザーでも簡単に使えるようにしたのも、GPT-3.5の画期的な側面です。GPT-3も誰でも使えるようにはなってしましたが、ChatGPTのようなチャット形式ではなかったため、使用する人は限られていました。多くの人にとってなじみのあるチャット画面を用い、使いやすさを大幅に上昇させた点もGPT-3.5の特徴と言えるでしょう。

また、利用者によるフィードバックをもとに強化学習を行い、回答内容を改善させられるようになったのも、GPT-3.5の特徴です。ファインチューニングをしたあと人間がランク付けを行い、そのランクをもとに評価モデルで強化学習を実施します。これらのプロセスを繰り返すことで、GPT-3.5は人間が見ても違和感を覚えにくい文章を生成できるようになりました。

GPT-4の特徴

2023年に、GPT-3.5をアップデートしたものとしてGPT-4が登場しました。GPT-4は有料で利用でき、料金は月額20ドルです。GPT-3.5との違いとしては、以下の4つが挙げられます。

  • 長文に対応できる
  • 画像での入力ができる
  • 整合性の向上
  • 問題解決能力の強化

GPT-3.5が対応できる文字数は5,000文字でしたが、GPT-4では25,000文字の長文に対応できます。GPT-4の登場により、テキストを分割しなくても文章を要約したり翻訳したりできるようになりました。

GPT-4では利用者がChatGPTの画面に画像を入力し、「この画像について説明してください」のような指示を出すことで、自動的にその画像に対する解説を得ることも可能です。今後は論文や資料の作成に役立つことが期待されています。

また、GPT-4はGPT-3.5と比べると誤った回答を生成する回数が減少しました。GPT-3.5のパラメータが3,550億なのに対し、GPT-4はおよそ100兆まで増加しているため、より正確性の高い返答ができます。

パラメータの増加は、問題解決能力の強化にも繋がっています。GPT-4ではプログラミングのコードの生成や論文の執筆などを確実に実行できるようになりました。アメリカの司法試験の模擬試験では、上位10%に食い込む成績を叩き出しています。

まとめ:ChatGPTを使いこなすなら「ChatGPT道場」へ

ChatGPTは、InstructGPTのようなアルゴリズム、Common Crawl Corpus・BooksCorpusというデータセット、評価モデルを使用し、事前学習・ファインチューニング・学習を繰り返して高い精度の回答を生成できるようになっています。既存チャットボットと比べると、利用者に応じて回答を柔軟に切り替えたり、作詞や小説の執筆のようなクリエイティブな作業ができるのが特徴です。

2022年にGPT-3.5、2023年にはより精度が優れたGPT-4が登場し、導入する企業や個人は増加傾向にあります。ChatGPTを使用することは、今後のビジネスにも大きな影響を与えるでしょう。ChatGPTに興味がある方は、ぜひ「ChatGPT道場」を覗いてみてください。

ChatGPT道場のウェブサイト(リンク)

ChatGPT道場は、ChatGPTの使い方を学ぶためのオンライン講座です。

初心者から上級者まで、さまざまなレベルの講座が用意されており、ChatGPT道場を活用することで、ChatGPTを使いこなすための知識とスキルを身につけることができます。

ChatGPT道場の講座では、ChatGPTの基本的な使い方から、応用的な使い方まで、幅広く学ぶことができます。

また、「AI×マネタイズ」ジャンルでYouTube登録者数日本一の奥山が主催が務めているため、最新の情報を学ぶことができます。

ChatGPTを使いこなしたい方は、ぜひ「ChatGPT道場」の受講を検討してみてください。

「ChatGPT道場」のウェブサイトから、無料オンライン説明会を予約できます。

まずは、無料オンライン説明会を受けてみて、ChatGPT道場が自分に合っているかどうかを確かめてみてください。

「ChatGPT道場」のウェブサイト:https://n1-inc.co.jp/chatgpt-dojo#solusion

目次