2024年3月18日月曜日

3月18日 生成AI

Microsoft Copilotに「生成AI」をイラスにしてもらった
生成AIに対して、日本語で質問を投げた場合、
なぜか答えを返してくれない場合があります。
とくに、Google Gemini(以降:Geminiと呼ぶ)が如実に多いです。

その場合、英語で同じ質問を投げると回答が得られる場合があります。

そこらへんが不思議なんだけど。
と、思ってGeminiに聞いてみました。

搔い摘んでGeminiの回答をまとめるとこんな感じでした。
・結果、回答を生成するためのデータセットはリアルタイムではない。
・データセットを更新しない限り、回答を作成するために必要な情報は増えない。
・日本後の解析はまだまだ途上
・英語データセットの方が、情報が多い

回答が得られなかった場合は
・英語で質問をする
・日本語に言い回しを変える

以下、Geminiとの簡単なやり取り記録です。

・・・

【凡例】
・青太字・・・質問内容
・黒字 ・・・Geminiの回答内容

  • あなたは質問に対して、どのように回答を作成しているんですか?
    • 私は、Google AI によって開発された大規模言語モデル (LLM) であり、テキストとコードの膨大なデータセットでトレーニングされています。このデータセットには、書籍、記事、コード、およびその他の形式のテキストが含まれます。
    • 質問を受け取ると、まず質問の意味を理解しようとします。次に、世界に関する知識とトレーニング データを使用して、質問に最も関連性の高い回答を生成します。
    • 回答を生成するには、次の手順を実行します。
      • 質問を理解する
        私は、質問の種類 (事実、意見、または指示)、質問の対象、および質問の目的を特定しようとします。
      • 関連情報を検索する
        私は、トレーニング データから質問に関連する情報を検索します。
        これには、テキスト、コード、および画像が含まれます。
      • 回答を生成する
        私は、質問の種類、質問の対象、および質問の目的に応じて、質問に最も関連性の高い回答を生成します。
      • 回答を評価する
        私は、回答が正確、完全、および関連性があることを確認します。
  • あなたのトレーニングデータはリアルタイムで更新される情報でしょうか?
      • 私のトレーニングデータはリアルタイムで更新される情報ではありません。
        • 私のトレーニングデータは、書籍、記事、コード、およびその他の形式のテキストを含む、定期的に更新される静的なデータセットで構成されています。
          • 新しい情報が公開されると、その情報が私のトレーニングデータセットに追加されるまで、私はその情報にアクセスしたり、処理したりすることができません。
            • そのため、私の回答は常に最新の情報に基づいているとは限らない場合があります。
              • ただし、私は常に学習と改善を続けており、ユーザーに可能な限り正確で最新の情報を提供するよう努めています。
                • 最新の情報が必要な場合は、信頼できる情報源を確認することをお勧めします。
                  • 信頼できる情報源を見つけるには、次のヒントを参照してください。
                    • 情報源の信頼性を評価する
                      情報源が権威のある組織または個人によって運営されているかどうかを確認します。
                    • 情報源の偏見をチェックする
                      情報源が特定の視点に偏っていないかどうかを確認します。
                    • 複数の情報源を確認する
                      同じトピックについて複数の情報源を確認して、バランスの取れた視点を得ます。
                • 日本語で回答が得られない場合でも、英語で同じ質問をすると回答が得られる場合の違いは?
                  • 日本語で回答が得られない場合でも、英語で同じ質問をすると回答が得られる場合の違いはいくつか考えられます。
                    • 情報量の違い
                      インターネット上の情報は、英語の方が圧倒的に多いです。
                      そのため、日本語で検索しても情報が見つからない場合でも、英語で検索すれば情報が見つかる可能性があります。
                    • データセットの違い
                      私のトレーニングデータは、英語のデータセットの方が日本語のデータセットよりも充実しています。
                      そのため、英語の方が日本語よりも正確で詳細な回答を生成できる可能性があります。
                    • 処理能力の違い
                      私はまだ開発段階にあり、日本語の処理能力は英語の処理能力よりも劣ります。
                      そのため、日本語で質問された場合、英語で質問された場合よりも正確な回答を生成できない可能性があります。
                    • 日本語の質問に対する理解不足
                      日本語の質問に対する理解不足は、以下のような理由で起こります。
                      • 日本語は英語と比べて複雑な文法構造を持つため、質問の意味を正確に理解するのが難しい場合があります。
                      • 日本語には、英語にはない独特の表現や慣用句があるため、それらの意味を理解するのが難しい場合があります。
                      • 私のトレーニングデータには、日本語の質問に対する回答が十分に含まれていない可能性があります。
                    • 日本語の回答生成能力の不足
                      日本語の回答生成能力の不足は、以下のような理由で起こります。
                      • 私のトレーニングデータには、日本語の回答が十分に含まれていない可能性があります。
                      • 日本語は英語と比べて表現の幅が広いため、適切な表現を選択するのが難しい場合があります。
                      • 私の日本語生成能力はまだ開発段階にあり、改善の余地があります。
                      • これらの問題は、今後私の能力が向上していくことで解決していくことが期待されます。
                  • 日本語で回答が得られない場合
                    日本語で回答が得られない場合は、以下の方法で解決できる可能性があります。
                    • 質問を英語で聞いてみる。
                    • 質問を言い換えてみる。
                    • 他の情報源を探してみる。
                ・・・
                Microsoft Copilotに「生成AI」をイラストにしてもらった
                個のイラストもMicrosoft Copilotに「生成AI」をイラストにしてもらった時の1枚です。

                一部界隈ではキャッキャしそうなイラスト(笑)
                ターミネーターとか、人工知能が人類を虐げる系の映画が好きな人にとっては、
                このイラストは来るものがあるんじゃないでしょうか?
                個人的にはターミネーターが好きなので、
                こういったイメージは結構好きですよ!

                0 件のコメント:

                コメントを投稿