AI生成について調べていると、「この単語どういう意味?」「よく見かけるけど意味は知らない」と感じることもありますよね。
そこで今回はAI関連で知っておきたい用語を集めました

AI生成を理解するためにぜひチェックしてください。

アノテーション

アノテーションとは、データに情報やラベルを付与する作業です。
例えば、画像に物体の種類や位置をラベル付けすることや、テキストに意味やカテゴリを付けることなどが含まれます。

機械学習モデルのトレーニングや評価に不可欠なプロセスです。

イライザ(ELIZA)

イライザ(ELIZA)は、1960年代にジョセフ・ワイゼンバウムによって開発されたチャットボットです。
人間との対話を模倣し、簡単な質問応答を行うプログラムです。

チャットボットの元祖みたいな存在です。

過学習

過学習は、機械学習モデルが学習データに過度に適合し、新しいデータへの予測が誤る現象です。
トレーニングしたデータに対する性能は高いものの、未知のデータでは正しく推定できなくなってしまいます。

クエリ

クエリは、データベースや情報検索システムに送信する質問や要求です。
情報を検索したり取得したりするための指示であり、キーワードや条件を含みます。

自然言語処理(NLP)

自然言語処理(NLP)は、コンピュータが人間の言語を理解し、処理する技術です。
文章や音声を解析し、意味を理解した上で、要約や翻訳・質問応答などのタスクを行います。

シンギュラリティ

シンギュラリティは、技術の進化が急速に進み、人工知能が人間の知性を超える未来を指します。

生成AI(ジェネレーティブAI)

生成AI(ジェネレーティブAI)は、データから新しいコンテンツを生み出す技術です。
これまで機械には生成できないと考えられていたコンテンツ(例えば文章・画像・音楽など)を生成します。

制約条件

制約条件とはAI生成の際に設定される、特定の条件やルールのことを指します。
条件を細かく指示することによって、生成される結果が特定の基準を満たすように制御されます。

例えば、文章生成の場合、制約条件は以下のようなものが考えられます。

制約条件の例
  • 文字数制約(例:100文字から150文字までの文章を書いて)
  • キーワードの使用(例:〇〇というキーワードを文章に含めて書いて)
  • 感情やトーンの指定(例:親しみやすい文章で書いて)
  • 特定の情報の排除(例:〇〇という情報は含めないで書いて)

セマンティック検索

セマンティック検索は、単純なキーワード検索とは異なり、意味や関連性に基づいて情報を探す手法です。
文脈や意味を考慮して正確な情報を見つけるのに役立ちます。

大規模言語モデル(LLM)

大規模言語モデル(LLM)は、大量のデータで学習されたAIです。
文章の理解や生成能力が高く、文章のパターンや意味を学習し、文章生成や情報処理などさまざまなタスクに活用されます。

ディープラーニング

ディープラーニングは、コンピューターが大量のデータを解析して特徴を把握する技術です。
画像認識や自然言語処理など幅広い分野で活用されます。

ディープフェイク

ディープフェイクは、AI技術を用いて、嘘の映像や音声を作り出すことを指します。
顔や声を別の人物に変えたり、リアルな疑似コンテンツを生成したりします。

この技術は楽しみや創造性にも使われますが、虚偽情報やプライバシー侵害の懸念もあります。

トークン(Token)

トークン(Token)とは文章(テキスト)を構成する最小単位です。

単語や句読点、スペースなどが含まれ、モデルの処理単位となります。
トークン数は処理コストに影響を与えるため、生成の際には注意が必要です。

ハイプ・サイクル

ハイプ・サイクルは、新技術の受容度が時間と共に変動するパターンを示します。
新技術への期待が高まり、落ち着いて現実的な評価へ移行する過程が描かれます。

アメリカの調査会社ガートナー社が毎年発表しています。

パラメーター

パラメーターは、AIモデル内の調整可能な設定値です。
モデルの動作や性能を調整し、データに適合させる役割を持ちます。

例えば、学習率や重みなどが含まれます。

ハルシネーション

ハルシネーションとは、AIが誤った情報や内容を生成する現象です。
生成結果には意図しない情報や不正確な情報を含むことがあるため、利用する前には必ず確認しましょう。

ビッグデータ(Big Data)

ビッグデータ(Big Data)とは、通常人間がすべてを理解するのが難しいほど膨大なデータのことを指します。

一般的には「3つのV」の特性を持ちます。

ビッグデータの条件
  • Volume(量)
  • Variety(多様性)
  • Velocity(速度・頻度)

分析や価値の抽出に活用されます。

プロンプト

プロンプトは、AIに対して与える指示や質問です。
文章生成時に、内容やテーマを指定するために使用されます。

「呪文」とも呼ばれますよ。

プロンプトエンジニアリング

プロンプトエンジニアリングは、ChatGPTなどのAIモデルに対して最適な入力指示(プロンプト)を設計する方法です。
プロンプトが適切であれば、その分希望に沿った回答(出力)が生成される可能性が高まります。

ペルソナ

ペルソナは、AIに与える「キャラ設定」のようなもので、生成する文章の内容をコントロールします。

例えばターゲット層に合わせて文章や広告を生成する際に活用できます。

マルチモーダルAI

マルチモーダルAIは、複数の情報源(テキスト、画像、音声など)を組み合わせて処理することを指します。
情報を総合的に理解するため、より人間に近い判断ができるようになります。

文字起こし

文字起こしは、音声や映像の内容をテキストに変換する作業です。
これまでは人間の手によって行われてきましたが、音声認識機能が発達したことによって自動で文字起こしができるようになりました。

会話や講演などの音声情報を文字化し、検索や分析などに活用されます。

りんな

「りんな」は、架空(AI)の女子高生キャラクターの名前です。
AIなのに女子高生に近い話し方をするとして、話題になりました。

参考:りんな公式サイト

LINEでは、りんなと対話を楽しめますよ。

API

APIは「アプリケーション・プログラミング・インターフェース(Application Programming Interface)」の略です。
アプリケーションやサービスが別のアプリ・サービスと連携し、データの取得や操作を可能にします。

ChatGPT

ChatGPTは、OpenAIが開発したAIチャットボットです。
質問応答や会話を行う能力を持ち、人間との対話に近い印象を受けます。

GAN(敵対的生成ネットワーク)

GAN(敵対的生成ネットワーク)は、生成器と識別器という2つの部分からなるAIの技術です。
生成器が偽のデータを作り、識別器はそれを本物か偽物か判断します。

互いに対立する役割を持ちながら学習し、生成器はますます本物に近いデータを作るよう進化します。

GPT-4

GPT-4は、OpenAIが開発した自然言語処理のための強力なAIモデルです。
文章生成・質問応答・要約など幅広いタスクで高度な性能を発揮します。

特に人間のようなリアルな文章を生成するため、サイト運営者やライターに使われています。

まとめ

今回はAI生成に関する用語を紹介しました。
AI関連の専門用語はまだまだ浸透しておらず、「これって、どういう意味だっけ?」と分からなくなることも多いですよね。

いつでも見返せるよう、この記事をお気に入り登録しておくことをおすすめします。