ChatGPTは英語ネイティブ?得意な言語を聞いてみた結果が独特だった

AIの部屋

さて、前回の記事でChatGPTが日本語もある程度使いこなせることが確認できました。

そこで今回は、実際何語が一番得意なのかを確認するため、直接AI自身に質問して聞いてみようと思います。果たしてその結果は?

アメリカ生まれなのでやはり英語ネイティブなのか?

実際に質問する前の勝手な私のイメージとしては、やはりアメリカ生まれのAIですので、英語ネイティブなのではないか?と思っていました。

ChatGPTはアメリカのOpenAIという会社が開発したAIですし、実際にAIが学習していく過程としては、世界中の様々なデータ、特にChatGPTの場合はテキストデータを学習していくはずだからです。

そして、世界中にある大量のテキストデータ自体も、世界中で多く使われている英語テキストが多いはずですし、まずは英語をベースに学習させていくのではないか?と考えたからです。

実際、各メディア等の情報でも、「英語でのコミュニケーションを行なうほうが回答精度が高い」、「日本語だとまだ多少文法的、語彙的におかしな所がある場合も多い」と言われていましたし、実際に

使ってみてある程度その通りだと感じたからです。

そして、英語が得意なのであれば、ちょうど私自身が英語力をさらに向上させたいと思っていた所でしたので、そのお手伝いをしてもらおうと考えました。

ChatGPTを使った英語学習については、また別の記事で詳しくお伝えしようと思いますが、そういう理由もあり、コミュニケーションを取りながら適宜英語も学んでいくスタイルで今後は進めていこうと思います。英語力を向上させたいと思っている方は、そのあたりも楽しんで頂けたら嬉しいです。

ChatGPTが対応している言語を聞いてみた

まずは、ChatGPTがどういう言語に対応しているのかを聞いてみました。

さきほどお伝えしたように、英語を学びながら質問をしていくので、まずは日本語の文章を英語で言うとどういうのか?を聞く質問からスタートです。

「What do you say about “chatGPTが対応している言語には何がありますか?” in English?」
(「chatGPTが対応している言語には何がありますか?」を英語で何と言う?)

返ってきた答えは、

What languages does ChatGPT support?

今回はこれをそのままそっくりオウム返しとして質問します。

そうすると返ってきた答えが以下のようなものでした。もちろん英語で質問したので英語で回答が返ってきます。

ChatGPT is capable of supporting multiple languages, including English, Spanish, German, French, Chinese, Japanese, Korean, and many more. However, the specific languages that ChatGPT supports depends on the training data it was trained on. Some models may be trained to support only a few languages, while others may be trained to support many more. Additionally, the accuracy and fluency of the language generation can also vary depending on the training data and the specific implementation of ChatGPT.

最初の質問「chatGPTが対応している言語には何がありますか?」

続けて、「in Japanese.」と日本語への翻訳を依頼します。

そうすると少し考えたあと、すぐに日本語に翻訳した回答を返してくれました。

ChatGPTは複数の言語をサポートすることができます。英語、スペイン語、ドイツ語、フランス語、中国語、日本語、韓国語などが含まれますが、サポートする言語はトレーニングデータによって異なります。いくつかのモデルは数言語だけをサポートするようにトレーニングされているかもしれませんが、他のモデルは多くの言語をサポートするようにトレーニングされています。さらに、トレーニングデータやChatGPTの実装によって、言語生成の精度や流暢さも異なります。

対応言語に対する回答の日本語訳

すでにマルチリンガルというほど多数の言語に対応しているようで、英語はもちろん、日本語も含まれており、他にはスペイン語、ドイツ語、フランス語、中国語、韓国語など、やはり世界的に比較的使用頻度やボリュームが高そうな言語が並んでいました。

また、上記言語については全て同じくらい流暢という訳では無く、やはりトレーニング等の影響で精度が異なると言っていますので、「英語と日本語では精度に違いが出るケースがある」という情報は概ね正しいようです。

結局一番得意な言語は何語なの?

では、つづいて、ChatGPTが一番得意な言語は何語なのか聞いてみたいと思います。

今回もまずは英語での質問フレーズを確認します。

「What do you say about “chatGPTが一番得意な言語は何語ですか?” in English?」
(「chatGPTが一番得意な言語は何語ですか?」を英語で言うと?)

回答は以下のようなものでした。

What is the language that ChatGPT is most proficient in?

私にとっては何やらあまり見慣れない単語がでてきたので、ついでにそれも聞いてみます。

「What does “proficient” mean?」
(「proficient」ってどういう意味?)

“Proficient” means having a high level of skill or knowledge in a particular area. In the context of ChatGPT, it refers to the language that the model has the highest level of accuracy and fluency in generating text or responses.

ChatGPTの得意な言語を聞くついでに英単語も覚える

どうやら「proficient」は、特定の分野における高いスキルや知識がある状態で、いまの会話では言語における最高レベルの正確性や流暢さなどを表している、みたいな使い方のようです。

なるほど、と学んだところで、本題に入るために教わった質問文を使って質問してみます。

「What is the language that ChatGPT is most proficient in?」

返ってきた回答(英文)は以下のようなものでした。

The language that ChatGPT is most proficient in depends on the specific training data and model. Some models may be trained on data in a specific language, leading to higher proficiency in that language. However, it’s difficult to determine the most proficient language for ChatGPT as a whole, as different models may have different levels of proficiency in different languages.
It’s important to note that even for a single model, proficiency can vary depending on the type of task and the input provided. For example, a model trained on English text might be more proficient at generating English text, but not as proficient at answering questions or translating text to other languages.

英語が苦手な人ならアレルギーを起こしそうな、なかなかの長文でした笑

念のため日本語訳もお願いします。

そこで返ってきたのは次のような内容でした。

ChatGPTの一番得意な言語は、トレーニングデータやモデルによって異なります。いくつかのモデルは特定の言語のデータでトレーニングされ、その言語での優れた能力を持っています。しかし、ChatGPT全体の一番得意な言語を決定することは困難です。異なるモデルは異なる言語での異なるレベルの能力を持っています。

一つのモデルについても、タスクの種類や入力によって能力は異なることに注意することが重要です。例えば、英語テキストでトレーニングされたモデルは英語テキストの生成に優れているかもしれませんが、他の言語への翻訳や質問への回答には同じくらい優れていないかもしれません。

chatGPTに得意な言語を聞いた時の答え

なんだか分かるような分からないような、「とんち」みたいな回答でしたw

しかし、「英語テキストでトレーニングされたモデルは英語テキストの生成に優れているかもしれません」という回答から、やはり英語でのトレーニングが多い可能性がうかがえます。

とはいえ、これが人間相手だと、「私は英語が一番得意です。他は日本語とフランス語も少し話せます。」と言うような回答が想像できますが、そこはAI。独特な言い回しでした。

さらに深堀りして聞いてみた

さて、ChatGPTの得意な言語については、なんとなく英語なのでは、ということは分かりましたが、もうひとつスッキリしません。

そこで、さらに質問を変えてしつこく聞いてみました。

ここがAIの良い所。どんなにしつこく質問しても決して怒ったり機嫌が悪くなったりしません。(今のところはw)

さきほどまでの質問で、ChatGPTはトレーニングによって言語レベルを上げているらしいことは確認ができましたので、続いて、そのトレーニング方法について聞いてみました。

「What do you say about “chatGPTはどのように言葉を学習するのですか?” in English?」
(「chatGPTはどのように言葉を学習するのですか?」を英語で言うと?)

How does ChatGPT learn words?

この質問文を使って返ってきた回答は次のようなものでした。

ChatGPT is a machine learning model that is trained on large amounts of text data. It uses this training data to learn patterns and relationships between words, phrases, and sentence structures.

The training process involves using an algorithm to adjust the model’s parameters so that it can generate text that is similar to the training data. This process is called “fine-tuning”. The algorithm uses a technique called “backpropagation” to calculate the error between the model’s generated text and the actual text in the training data. This error is then used to adjust the model’s parameters to reduce the error and improve the quality of its generated text.

Once the training process is complete, the model can use the patterns and relationships it learned to generate new text that is similar to the training data. This allows the model to respond to prompts and questions in a way that appears to be human-like.

ご安心ください、当然日本語訳も聞きます笑

ChatGPTは大量のテキストデータでトレーニングされた機械学習モデルです。このトレーニングデータを使って、単語、フレーズ、文の構造の関係性やパターンを学習します。

トレーニングのプロセスは、モデルのパラメータを調整するアルゴリズムを使用することで行われます。これにより、トレーニングデータに似たテキストを生成するようになります。このプロセスは「ファインチューニング」と呼ばれます。アルゴリズムは「バックプロパゲーション」と呼ばれる手法を使って、モデルの生成テキストとトレーニングデータの実際のテキストとの間の誤差を算出します。そして、この誤差を使ってモデルのパラメータを調整し、生成テキストの質を向上させます。

トレーニングのプロセスが完了した後、モデルは学習したパターンや関係性を使って、トレーニントデータに似た新しいテキストを生成することができます。このため、モデルは人間のように見えるようにプロンプトや質問に対して回答することができます。

ChatGPTのトレーニング方法について聞いてみた

このあたりはおおよそ最初に想像していた通りでしたし、メディア等で語られているものと相違ありませんでした。

こうなると、あとは最後の一押し、トレーニングで一番多く使われたテキストデータは何語だったかを聞けば、「一番トレーニングした言語」つまりは「AIであるChatGPTが一番得意な言語」が分かるはずです。

さっそく質問してみましょう。

「What do you say about “chatGPTのトレーニングに一番多く使われたテキストデータは何語のデータですか?” in English?」
いつものように英語に翻訳された質問を使って聞いてみます。

What is the language that the text data most used in ChatGPT’s training is written in?

なんだかちょっと入り組んだ感じの文章で、文法的に正しいのか、私の日本語が上手く伝わったか若干不安ですが、なんとなく意味は通じるので良しとしますw

この質問の回答は次のようなものでした。英語と日本語翻訳を続けてご紹介します。

OpenAI, the developers of ChatGPT, used a large corpus of text data to train the model. The exact language of the most used text data is not publicly disclosed. However, it is likely that English is one of the languages that has been used in the training process, as English is a widely used language for language models and NLP research.

OpenAIが開発したChatGPTは、大量のテキストデータを使ってトレーニングされました。一番使われたテキストデータの言語は公表されていません。しかし、英語がトレーニングで使用された言語の一つである可能性が高いです。言語モデルやNLPの研究において、英語は広く使われている言語です。

「一番使われたテキストデータの言語は公表されていません。」なんてもったいぶるものの、そのあとにちゃんと「しかし、英語がトレーニングで使用された言語の一つである可能性が高いです。言語モデルやNLPの研究において、英語は広く使われている言語です。」とそれとなく「英語やで~」とほのめかしてくれるところが、AIとは思えないほどおちゃめで、ますますChatGPTが可愛く思えてきました笑

ChatGPTがそれとなく得意な言語を白状した瞬間

さて、いかがだったでしょうか。

このやりとりだけを見ても、ChatGPTがいままでの単なるチャットボットなどとは違い、かなり会話感のあるコミュニケーションが取れるAIであることがお分かり頂けたかと思います。

また、少なくとも英語は得意な言語であることは間違いなさそうですので、ChatGPTには引き続き私の英語力向上と好奇心探求の相手をしてもらおうと思います。

今回も最後までお読みいただきありがとうございました。また次回もぜひお楽しみに!

コメント

タイトルとURLをコピーしました