Gemini2.0のリリース予定報道のついでに、これまでのGeminiを振り返る

default eye catch テック

GoogleのAIチャットボットであるGeminiの2.0が、今年12月にリリースされると報じられ、にわかに注目を集めています。

現時点ではまだ2.0に関する詳しい情報は出てきていませんが、昨年の初代リリースに次ぐ大規模なリリースであることが予想されます。

2.0リリースを間近に控えた今、Geminiの変遷をおさらいしてみたいと思います。

‎Gemini と話してアイデアを広げよう
Bard が Gemini になりました。Google AI で文章やリストの作成、計画の立案、新しい知識の習得など、さまざまなことができます。

初代リリース

Geminiは当初、Bardという名前で2023年2月に発表されました。

人によっては、いまだにこちらの名前の方に馴染みがある人もいるかもしれないです。

この頃はすでにChatGPTが発表され、世界が人工知能の可能性に気づき、また人々の間に浸透し始めていたため、Googleも相当危機感を持ってこのプロジェクトを推し進めたのだろうと思います。

またGoogleは検索エンジンとそれに伴う広告が大きな収入源となっているため、AIチャットボットが隆盛を極めてしまうと自分たちのビジネスが脅かされる、という葛藤もあったのかもしれません。

様々な思惑や世間の動きが錯綜する中リリースされたBardは
日本でも「ChatGPTではないAIチャットボット」として話題になった感があります。

そんなBardは、検索サービスに多大な知見とリソースをもつGoogleがリリースしただけに
検索/リサーチ関連のタスクに強いという特徴があります。

また、メール作成などのタスクではChatGPTよりも適切なアウトプットを出してくれる、という声も多かったようです。

リリース当初、タスクによってはChatGPTよりも高パフォーマンスだという評価もあったBardですが、そのリリースは幸先の悪そうな印象でした。

まず発表時のデモで、回答にミスが発見されるという事件がありました。

また、ChatGPTに対抗してリリースを急ぎすぎたために、Googleの社員から「リリースが性急すぎた」と不満が噴出している、という報道もされました。

ChatGPTという圧倒的強者がすでにいた中でのリリースは、やっぱり難易度の高いものだったようです。

Geminiへの改名

今年(2024年)の2月、BardはGeminiに改名されました。

やはり上でもあげたように、初期リリース時期の色々ないざこざがあったこともあり
そのイメージを完全に払拭したいという意図があったのかもしれません。

Gemini 1.5 Pro

Gemini 1.5 Proは、Gemini Advanced(有料サービス)で使うことのできるLLMモデルです。

BardからGeminiへのリブランディングと、時を同じくして発表されました。

1.5 Proではコンテキストウィンドウが大幅に拡大されています。


コンテキストウィンドウというのは、自然言語処理モデルが特定のフレーズを理解するために前後の文脈から情報を集める範囲のことです。
つまりコンテキストウィンドウが長いほど、AIが前後の文脈をより理解できたり、長文を理解できたりするようになります。

1.5 Proのコンテキストウィンドウは200万トークンであり、LLMモデルの中でも圧倒的に長いです
(例えばChatGPT-4oは、128000トークンです)。

その他にもGoogleの他サービスとの連携がより充実したり、カスタマイズ機能が拡充されたりといった1.5 Proならではの長所があります。

Geminiの特徴と今後

最新情報リサーチに強い

やはりCheGPTに対するGeminiの圧倒的な利点としては、特に最新情報のリサーチに強いという点が挙げられると思います。

マルチモーダル

また、マルチモーダルであるという点も、大きな特徴の一つです。

これは、文章、画像、オーディオといった種類の異なるデータを、同時に扱うことができるという点です。(openAIも同様に、GPT-4oなどでマルチモーダルな使い方ができます)

画像を添付すると同時に、「この絵に書かれている情景を文章で説明してください」などといった入力をしたり、ということができるということですね。

コードの生成能力

プログラミングの能力が高く、様々なプログラミング言語での出力コードのクオリティがとても高いことも有名です。

プログラマーの作業をアシストするAIとしてはGitHub Copilot(https://github.com/features/copilot)や、Amazon Q Developer(https://aws.amazon.com/jp/q/developer/)などが有名ですが、
これらと一緒にGeminiを使うことでプログラミング作業が大幅に効率化できます。

課題もある

ただ一方で、ChatGPTに比べて回答に間違いが多くみられるなどの声が多かったり、また画像生成で一波乱起きたり(参照: https://forbesjapan.com/articles/detail/73397)と、課題も多いイメージがあります。


2.0でどんなアップグレードがされるのか、楽しみです。

コメント

タイトルとURLをコピーしました