初心者の方にAIの性能比較に使われるパラメータとトークンの説明をまとめた

Ai

はじめに

最近、AIのわかりやすい指標として各モデルの性能比較が話題になっています。誰でも一目で数値だけで見ればわかりやすく、比較しやすいので主に記事になったりして発表されています。その中でもパラメータ数やトークン数とよく聞く単語だけどよくわからない人に向けにそれらについてまとめてみました。良ければ見ていってください。

パラメータ数とトークン数

パラメータ数

主にパラメータ数の基になっている基準を以下に上げます

精度(Accuracy)

これはAIが出力する結果がどれだけ正確かを示す指標です。
例えば、100個の問題を解いたときに、そのうち何個正解できたかを示します。精度が高いほど、AIの性能は良いと言えます。

速度(Speed)

これはAIがタスクを完了するまでの時間を示します。
例えば、画像を分析するのにどれだけの時間がかかるか、または一つの質問に対してどれだけ早く答えを出せるかなどを示します。速度が速いほど、AIの性能は良いと言えます。

スケーラビリティ(Scalability)

これはAIが大規模なデータセットや複雑な問題に対してどの程度効率的に対応できるかを示します。
例えば、大量のデータを処理するのにどれだけの時間がかかるか、または複雑な問題をどれだけ早く解決できるかなどを示します。スケーラビリティが高いほど、AIの性能は良いと言えます

汎用性(Generality)

これはAIが様々なタスクや状況に対応できる能力を示します。
例えば、画像認識だけでなく、音声認識や自然言語処理など、様々なタスクをこなすことができるかを示します。汎用性が高いほど、AIの性能は良いと言えます。

ロバスト性(Robustness)

これはAIがエラーや不確実性に対してどの程度頑健であるかを示します。
例えば、未知のデータや異常なデータに対しても正確な結果を出力できるかを示します。ロバスト性が高いほど、AIの性能は良いと言えます。

トークン数

AIモデル、特に自然言語処理(NLP)モデルでは、「トークン」という単位でテキストを処理します。トークンは、言葉、フレーズ、または文字など、テキストの分割された部分を指します。例えば、文 “This Is AI” は、単語トークン “This”, “Is”, “AI” に分割されます。

トークンの数は、AIモデルが一度に処理できる情報の量を制限します。例えば、GPT-3は、一度に最大2048トークンを処理できます。これは、モデルが長いテキストを読み取るか、または生成する能力を制限します。

パラメータとトークンの概念

パラメータとトークンの概念を理解することによってIT業界でのそれらの単語は何をあらわして世の中に浸透しているのかを説明します。

パラメータの概念

関数や手続きが動作するために必要な情報を指します。これはAIだけでなく、一般的なプログラミングでも使用されます。例えば、関数が引数として受け取る値は「パラメータ」と呼ばれます。

トークンの概念

テキストやコードを意味のある単位に分割するために使用されます。これはAIの自然言語処理だけでなく、一般的なプログラミングでも使用されます。例えば、プログラムのソースコードはトークンに分割され、それぞれのトークンが個別に解析されます。

パラメータとトークンの語源

そもそものパラメータとトークンの言葉の語源を説明して単語から理解していくことでさらにイメージを膨らませて浸透させるのが効果的です。

パラメータの語源

「パラメータ」は、ギリシャ語の「para-」(「そばに、補助的な」)と「metron」(「測ること」)から成り立っています。元々は数学や物理学の分野で、他の変数とは独立して値が定まる定数のことを指していました。

トークンの語源

「トークン」の語源は、「しるし」「象徴」「証拠品」「代用貨幣」を意味する言葉で、その本質は「特定の価値を代替するもの」です。この「価値を代替するもの」としてのトークンは、まだ文字が使用されていなかったBC(紀元前)8,000年以上前から存在していたと言われています。その利用目的は、農産物など生産したアイテムを数え、記録するための一種の道具でした。

また、英語の「token」は、ゲルマン祖語の「taikna」(「しるし;証拠」)から派生した言葉で、「あるしるしを示していること」がこの単語のコアの語源であり、これは「indicate」(「指し示す」)と同じ語源を持つとされています。

パラメータとトークンの使用例

パラメータとトークンが使用されている主なシステムを3つ紹介します。

APIにおけるパラメータとトークン


APIでは、パラメータとトークンは認証やデータの取得に重要な役割を果たします。例えば、URLのパラメータとしてトークンを持たせることが多く、これはセッションキーやトークン文字列であることが多いです。もう一つのパラメータ(アプリケーションキーなど)と合わせて、認証が正しいことを検証するようになっています。

トークン文字列は一定期間で切れる仕組みになっており、有効期限が過ぎた後はリフレッシュして新しいトークン文字列を取得し直します。

トークンのセキュリティ

トークンをクエリパラメータリクエストヘッダーのどちらに書くのが安全かという問題については、リクエストヘッダーに書く方が安全とされています。リクエストヘッダーに書くと、https通信において暗号化されるためです。

トークンの管理

MetaMaskなどのウォレットでは、ERC-20スタンダードトークンをアカウントページに表示します。しかし、Ethereumあるいは他のネットワーク上のトークンの急増に伴い、MetaMaskは正式なリストを保持していませんが、ERC-20準拠トークンを追加することは可能です。

仮想通貨におけるトークンの説明:トークンとは?仮想通貨との違いと主な4つのトークン・購入方法を解説 | Coincheck(コインチェック)

そのほかのAI性能比較に使われる指標

再現率(Recall)

これは、AIが正しく識別したアイテムの数を、全ての実際の正のアイテムの数で割ったものです。これは、AIが全ての正のケースをどの程度捉えることができるかを示します。

適合率(Precision)

これは、AIが正しく識別したアイテムの数を、AIが正と判断したアイテムの数で割ったものです。これは、AIが正と判断したケースがどの程度正確であるかを示します。

F1スコア(F1 Score)

これは、再現率と適合率の調和平均で、両者のバランスを示します。これは、再現率と適合率がどちらも重要な場合に使用されます。

AUC-ROC (Area Under the Curve – Receiver Operating Characteristics)

これは、偽陽性率に対する真陽性率の曲線下面積を示します。これは、AIが正と負をどの程度正確に区別できるかを示します。

損失関数(Loss Function)

これは、AIの予測が実際の値からどの程度離れているかを示します。これは、AIの性能を最適化するための基準として使用されます。

おわりに

今回は、パラメータとトークンにフォーカスして基準になっているものから、そもそもの概念や語源を説明していきましたがある程度理解していただけたでしょうか?パラメータとトークンのそれぞれのスコアが高いとそれに伴って性能のスコアに替わって表されます。他にも性能比較に使用される指標はありますがやはり一番聞くのは、個人的にパラメータとトークンですね。

もっと詳しく知りたい方は、書籍や検索バーに基準を追加して検索して深ぼってみるといいと思います。

読んでいただきありがとうございました。

タイトルとURLをコピーしました