GoogleがAIチャットボット Google Bard を発表したとき、Bing ChatやChatGPTのようなものと比べて、それほど有利なものではありませんでした。実際、Googleの広告でBardが誤った回答をしたことで、同社の株価が一時8%下落するなど、発売当初はちょっとした災難に見舞われた。
5月11日、I/O開発者会議で、Googleは Google Bard を再び紹介し、より好評を得たいと考えています(Bing ChatがOpenAIのGPT-4を内緒で使っているのと同様の動きで、BardもすでにしばらくPaLM 2を使っているのです)。人々が創造的で想像力豊かな方法でBardと関わっているのを見て驚いています。
これは、Bardにとっても頭を使う良い機会だろう。Googleはウェイティングリストを廃止し、180以上の国と地域で誰でもBardを利用できるようにするだけでなく(英語)、日本語と韓国語のサポートを開始しています。近い将来には40の言語をサポートすると約束しています。さらに、Googleが画像と連動できるマルチモーダルクエリなど、Bardの新機能も多数発表していることから、プロンプトに画像を使ったり、Bardに説明してもらったりすることができます。
しかし、この勢いはまだ始まりにすぎません。この記事では
- グーグルバードとは?
- グーグルバードとコラボレーションするための新しい方法を紹介
- グーグルバードとChatGPTを比較
- グーグルバードの代替品
について解説します。 読み終えるとグーグルバードを徹底的に活用できます。
Google Bard とは?
Google Bard とは?
Google BardはChatGPTと同様、あらゆる種類のテキストを生成することができる会話型AIチャットボットです。コンテンツポリシーに反しない限り、どんな質問をしてもBardは答えを出してくれます。Googleは、既存の音声アシスタントであるGoogle AssistantからGoogle Bardに重点を置き換える改革をする方向です。
それは、LaMDA(Language Model for Dialogue Applications)として知られる、Google独自のLLM(Large Language Model)をベースにしているからです。ChatGPTを支えるOpenAIのGPT-3.5と同様、GoogleのエンジニアはLaMDAを数千億のパラメータで訓練し、AIに自然言語を「学習」させています。その結果、どんな質問にも驚くほど自然で会話に近い言葉で答えることができるチャットボットが誕生しました。
LaMDAはもともと2021年のGoogle I/Oで発表されたものの、プロトタイプにとどまり、一般に公開されることはありませんでした。しかし、2022年末にChatGPTが登場すると、Googleは対抗するためLaMDAを搭載したチャットボットの開発を始めます。2023年2月に初めて発表されたのが「Google Bard」です。
日本で Google Bard は利用できますか?
2023年5月11日にGoogle Bard は正式に日本で使えるようになりました。Google Bardは発表後、ウェイティングリストの行列に基づき、限られたユーザーにのみ開放されたままでした。しかし、Google I/O 2023で、同社はBardが世界180の国と地域を含むすべての人に開放されたことを発表しました。
Googleによると、Bardは現在、日本語と韓国語でも利用可能で、近日中に最大40の言語に対応する予定とのことです。
Bardはまだ “試験運用中 “という位置づけですが、誰でも使えるようになったのです。
Google Bard の使い方
Google Bard を利用するには、bard.google.com にアクセスします。Google の他の製品と同様に、Googleアカウントでログインする必要があります。また、利用規約に同意する必要がありますが、すぐに Google Bard を使い始めることができます。ChatGPTと同様、Bardもほとんどが空のテキストフィールドで、”ここにメッセージを入力してください “と表示されます。プロンプトや質問を入力すると、Bardが答えを提示してくれます。
助かることに、Googleは、Bardを開くたびに異なる、いくつかのランダムなアイデアを与えてくれます。最初に与えられた例は、
・「自分の町を紹介する30秒の短編動画の構造を考えて?」
・「日本料理とイタリアンの共通点は」
・「初めてソロキャンプに何を持っていけばいい」
・「初めてソロキャンプに何を持っていけばいい」
をクリックするとBardは以下の通り回答しました。
「テント
寝袋
マット
テーブル
チェア
調理器具
食器
食料
水
ランタン
懐中電灯
着替え
タオル
トイレ用品
虫よけ
応急処置セット
ゴミ袋
その他(地図、コンパス、GPS、天気予報アプリなど)」
Google Bard の特徴
- Googleとの統合: Bardのテクノロジーは、Google のエコシステムと継ぎ目がないに統合するように設計されており、Google 検索やGoogle Scholarなどの様々な Google 製品から豊富な情報へのアクセスをユーザーに提供します。これらのリソースを利用することで、Bardはリアルタイムで最新の情報をユーザーに提供することができます。さらに、この統合により、ユーザーの検索履歴や嗜好を活用し、ユーザーのニーズや興味をより深く理解することで、パーソナライズされた体験が可能です。
- ソースの引用: Google は引用をより正確に行うようにします。Bardがコードのブロックを持ち込んだり、他のコンテンツを引用した場合、注釈をクリックするだけで、Bardはレスポンスのその部分に下線を引き、ソースにリンクします。
- センチメント(感情)分析: Bardは、テキストに表現された感情を評価することができる注目すべき機能を備えています。この機能により、世論を測定し、ブランドの評判を把握することができ、お客様に合わせた感情的な反応を生み出すことが可能になります。
- リアルタイムの言語翻訳: Google Bardは、高度なNLP機能を備えており、瞬時に言語翻訳を行うことが可能です。これにより、言語の壁を取り除き、より良いグローバルなコラボレーションを促進するため、多言語でコミュニケーションをとる個人にとって不可欠なツールとなっています。
- 音声による対話: Google Bard が提供するのは、テキストベースのコミュニケーションだけではありません。音声ベースのインタラクションも備えているため、さまざまなタスクに対応する効率的なバーチャルアシスタントとなります。ユーザーは、音声を使ってコマンドを与え、情報にアクセスし、ウェブを検索し、予定を設定するなど、多くのことを行うことができます。この機能は、ハンズフリーで Google Bard を操作できるため、忙しい人やアクセシビリティの必要性がある人に特に有効です。
- コーディング: Bard は、コード生成、デバッグ、コードの説明など、プログラミングやソフトウェア開発の作業を支援することができます。Google は、C++、Go、Java、Javascript、Python、Typescriptを含む20以上のプログラミング言語でこれらの機能を提供開始します。また、Pythonのコードを Google Colab に簡単にエクスポートすることができます。コピー&ペーストは必要ありません。また、Bardは Google Sheets 用の関数の記述もサポートします。コードの生成だけでなく、Bardはコードスニペットの説明もお手伝いします。これは、初めてプログラミングを学習する場合や、コードのブロックが何を出力するのかを理解するための追加サポートが必要な場合に特に役立ちます。
- Bardとのインタラクションをより視覚的にします。
- Google Bardのユーザーは、検索結果に画像を表示するようBardに直接依頼できるようになりました。京都で必見の観光スポットを教えてください」と質問すると、テキストだけでなく、豊富なビジュアルとともに親切な回答が返ってくるので、何を探しているのかがよりよくわかるでしょう。
画像クレジット: Google
- さらに、自分のプロンプトにテキストだけでなく画像を入れることもできるようになり、想像力と創造力を高めることができるようになります。これを実現するために、私たちはGoogle LensのパワーをBardに導入しました。例えば、あなたの愛犬の写真を使って、楽しい時間を過ごしてみたいとします。その写真をアップロードして、Bardに「この2匹について面白いキャプションを書いてください」とお願いします。BardはGoogle Lensを使って、写真を分析し、犬の品種を検出し、いくつかのクリエイティブなキャプションを作成します – すべて数秒以内に。
画像クレジット: Google
今後、Docs、Drive、Gmail、Mapsなど、すでにお使いのGoogleのアプリケーションやサービスの機能をBardの体験に統合することで、あなたの想像力と好奇心を刺激する新しい方法をご紹介していきます。もちろん、これらのツールや拡張機能をどのように使うかは、常にプライバシー設定でコントロールすることができます。
また、Bardは、外部パートナーの拡張機能を使って、ウェブ上のあらゆるサービスを利用することができ、これまで不可能だったことを可能にします。数カ月後には、アドビのクリエイティブな生成AIモデルのファミリーであるAdobe FireflyをBardに統合し、自分のクリエイティブなアイデアを簡単かつ迅速に高品質の画像に変換できるAdobe Expressでさらに編集したりデザインに加えたりできます。
例えば、ユニコーンが大好きな7歳の子供の誕生日パーティーを計画していて、招待状と一緒に送るための楽しい画像が欲しいとしましょう。ユニコーンとケーキの画像を作ってください」とBardに依頼すれば、Adobeの品質と倫理的責任に関する高い基準を守りながら、数秒で画像を生成可能です。
画像クレジット: Google
Googleは、Bardがあなたの創造性、生産性、好奇心の拠点となることを望んでいます。そのため、BardとGoogleの便利なアプリや、Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academyなど多くのパートナーとの接続に取り組んでいます。
Googleのツールやウェブ上の素晴らしいサービスと連携することで、最も有能な大規模言語モデルとの流動的なコラボレーションができるでしょう。人間の想像力とBardの生成的なAI能力を組み合わせると、可能性は無限大に広がります。あなたが自由に使ってあらゆる創造性を支援できるでしょう。
Google Bard はどのように機能するのでしょうか。
Google Bardは、Google I/O 2023で発表された、Google独自の最先端の大規模言語モデル(LLM)PaLM 2を搭載しています。
2022年4月に発表されたPaLMをさらに進化させたPaLM 2により、Bardはより効率的に、より高いレベルでパフォーマンスを発揮し、これまでの問題を解決することができます。
Bardの初期バージョンでは、LaMDAの軽量モデル版を使用しましたが、これは必要なコンピューティングパワーが少なく、より多くのユーザーにスケールアップできるためです。
LaMDAは、Googleが発明し2017年にオープンソース化したニューラルネットワークアーキテクチャ「Transformer」上に構築されています。興味深いことに、ChatGPTが機能する言語モデルであるGPT-3も、GoogleによればTransformer上で構築されています。
ChatGPTやBing Chatなど、今最も人気のあるAIチャットボットのいくつかはGPTシリーズのLLMを使用しているため、自社製のLLMであるLaMDAとPaLM 2を使用するというのは、Googleの大胆な決断です。
BardはLaMDAの “軽量版 “を搭載しています。
LaMDAは大規模な言語モデルで、公開対話とウェブデータからなるデータセットで学習されます。
関連する研究論文(こちらからPDFでダウンロードできます)に記載されているトレーニングに関連する2つの重要な要素があります。 LaMDA: LaMDA: Language Models for Dialog Applications。
A. 安全性: クラウドワーカーがアノテーションしたデータでチューニングすることで、モデルの安全性を確保している。
B. 根拠があること(groundednes): LaMDAは、外部の知識ソース(検索である情報検索)によって、事実上の根拠を得ることができる。
LaMDAの研究論文にはこうあります。
「…事実の根拠は、情報検索システム、言語翻訳機、電卓などの外部の知識ソースを参照することを可能にします。」
Google は、根拠があることのメトリックを用いて事実性を定量化し、Google のアプローチは、モデルが単にもっともらしく聞こえる応答ではなく、既知のソースに基づいた応答を生成することができることを発見しました。
GoogleはLaMDAの出力を評価するために3つのメトリクスを使用しました。
- 鋭敏さ(Sensibleness): 回答が理にかなっているかどうかの測定値である。
- 特異性(Specificity): 回答が一般的・漠然としたものであるか、文脈に即したものであるかを測定する。
- 興味深さ(Interestingness): LaMDAの回答が洞察に富んでいるか、好奇心を刺激するかどうかを測定する指標である。
3つの指標はすべてクラウドソーシングの評価者によって判定され、そのデータは機械にフィードバックされ、改良が続けられました。
LaMDAの研究論文は、クラウドソーシングによるレビューと、検索エンジンでファクトチェックを行うシステムの機能が有用な技術であったと結論付けています。
Googleの研究者はこう書いています
「我々は、クラウドアノテーションデータが、大きな利益をもたらす有効なツールであることを発見しました。また、(情報検索システムなどの)外部APIを呼び出すことで、生成されたレスポンスが、既知のソースに対して参照・確認できる主張をどの程度含んでいるかという定義であるgroundednessを大幅に改善する道筋が見えてきました。」
なぜ Google は今、Google Bard を発表することにしたのでしょうか?
ChatGPTはリリース当初からヒットしています。ローンチ後1週間も経たないうちに、ChatGPTは100万人以上のユーザーを獲得しました。スイスの銀行UBSの分析によると、ChatGPTは史上最も急成長しているアプリです。この成功のため、グーグルを含む他の技術企業は、熱いうちにこの分野に参入しようとしている。
GoogleがBardを発表した同じ週のうちに、MicrosoftはAIを改良した新しいBingを発表しました。このBingは、検索専用にカスタマイズされた次世代OpenAI大規模言語モデルで動作しています。
Google BardとChatGPTを比較
BardとChatGPTの共通点
- 自然言語処理です: BardとChatGPTは、高度な自然言語処理(NLP)アルゴリズムを利用して、ユーザーの入力に基づき人間のようなテキストを生成します。
- ユーザーインターフェイス: 各プラットフォームは、ユーザーフレンドリーなインターフェースを提供しており、ユーザーは最小限の労力で素早く質問したり、プロンプトを入力して、文章を生成したりすることができます。
- 汎用性 ソーシャルメディアの更新、商品説明、歌や詩のような創作物など、さまざまなタイプのコンテンツを生成することが可能です。
- 頻繁なアップデート: 両プラットフォームの開発者は、それぞれのAIモデルを継続的に更新し、パフォーマンスを向上させ、時間の経過とともにユーザーにより良い結果を提供します。
BardとChatGPTの違い
ChatGPT | Bard | |
クリエイター | OpenAI | グーグル |
言語モデル | OpenAI の Generative Pre-training Transformer 3 (GPT-3) Generative Pre-training Transformer 4 (GPT-4) の特別に調整されたバージョン (バージョンに応じて) | Google の対話アプリケーション用言語モデル (LaMDA) |
データソース | ChatGPT は、Common Crawl、Wikipedia、書籍、記事、ドキュメント、オープン インターネットから収集したコンテンツを含む大量のテキスト データセットでトレーニングされました。しかし、そのソースは 2021 年に終了し、最新の世界の出来事や研究は制限されています。 | Bard は、Common Crawl、Wikipedia、ドキュメント、ウェブ上の会話や対話を含むデータセットである Infiniset でトレーニングを受けました。Bard はおそらくリアルタイムで Web を検索し、質問に対する最新の回答や最新の研究を見つけるでしょう。 |
価格設定 | ChatGPT はすべてのユーザーに無料です。ChatGPT Plus の料金は月額 20 ドルで、ピーク時のアクセス、応答時間の短縮、新機能への優先アクセス、GPT-4 の使用が含まれます。 | Bard はアクセス権のあるユーザーに無料で提供されます |
このセクションでは、3 つの異なるタスクに関して ChatGPT と Google BARD によって提供された応答を比較し、精度、適性、情報合成、コーディングの点でどちらのAI ツールがより優れたパフォーマンスを発揮するかを判断します。
ChatGPT と Google BARD の精度と適性
質問: 日本のGDPの推移(2019~2023年)
ChatGPT 4 と Google BARD の両方から提供された回答を綿密に分析すると、グーグルBardは見やすく表を作って名目GDPと成長率を提供します。2023年の見込みも提供できます。一方、GPT-4は2019と2021のデータだけ提供できます。
しかし、世界経済ネタ帳と内閣府のデータによって、GPTとBardの精度と適性が低いです。両方は間違いデータを提供します。それは、AIのデメリットです。それで、AIを使うとき引用ソースをもう一度チェックしなければなりません。
したがって、ChatGPT 対 Google BARD 適性テストの勝者はありません。
🏆勝者: ありません
ChatGPT と Google BARD の情報統合
質問:コードを作成しない人に API を説明します。
各 AI ツールに、非プログラマーに API を説明するよう促すと、どちらも確かな答えを返しました。
ChatGPT 4 では、ソフトウェア通信における API の役割を説明するためにレストランのウェイターの例えを採用しましたが、Google BARD では、OpenWeatherMap API を利用して気象データを取得する天気予報アプリケーションの例を通じてその概念を説明しました。
どちらの説明も明確で理解しやすいですが、ChatGPTの回答では、ソフトウェア開発で API がどのように利用されるかについてより詳細な説明が提供されています。
🏆勝者: ChatGPT
ChatGPT と Google BARD コーディングの比較
質問:チェス ゲーム アプリの HTML および CSS コードを生成します。
彼らにコーディングを促すと、ChatGPT 4 の答えは、チェス ゲーム アプリのレイアウトを作成するためのより完全なソリューションを提供します。
ChatGPT 4 によって生成された HTML および CSS コードは、開始位置に配置された駒を備えたチェス盤を正確に表しています。さらに、このコードには各チェスの駒の CSS クラスが含まれており、駒を表す画像の使用を示しています。この応答は、チェス ゲーム アプリを開発するための強力な基盤となります。
対照的に、Google BARD の返信は、駒のない基本的な 8×8 チェス盤のHTMLとCSSを提示しているだけです。チェス盤のレイアウトは確立されていますが、完全に機能するチェス ゲーム アプリを作成するために必要な重要な詳細を提供するには至っていません。
🏆勝者: ChatGPT
Bard はより優れたUX(ユーザーエクスペリエンス)を提供します
Bard は、ユーザーフレンドリーなインターフェイスという点で何光年も先を行っています。ChatGPT の分厚いテキストよりもはるかに読みやすい 書式設定されたテキストで見栄えが良くなるだけでなく、質問した後に質問を編集したり、用意された複数の回答を表示したりすることもできます。
また、すべての応答には「Google it」という CTA が付いているので、ソースを確認できます。
🏆勝者: Bard
Bard は Google 検索の合理化されたバージョンになりますが、ChatGPT は Bing に属します
どんなに複雑なトピックであっても、情報を理解しやすい形式に統合できる Bard の能力は、最終的に人々の情報検索方法を向上させる可能性があることを意味します。
GoogleはすでにBardがGoogle検索に統合されることを示唆している。つまり、AI が複雑なトピックを簡素化し、情報を理解しやすい形式で返すため、異なる視点についての洞察を得ることができます。(これは、正解が 1 つもないトピックに特に当てはまります。)
画像クレジット: Google
一方、Microsoft はすでに OpenAI の調整された GPT-4 モデルの一部を
Bingに統合し、検索バーで ChatGPT のようなエクスペリエンスをユーザーに提供しています。ただし、それはまだかなり制限されており、ユーザーは完全なエクスペリエンスを得るには順番待ちリストに参加する必要があります。
🏆勝者: ありません
では、将来の Bard ユーザーは何を知っておく必要があるでしょうか?
- Bardはインターネット上のデータから取得しているため、より最新の知識ベースを持っています。これは、2021 年までのデータでトレーニングされた ChatGPT とは大きく異なります。
- Bard は Google の検索エンジンに統合され、人々が複雑なトピックにわたる情報にアクセスする方法が簡素化されます。
- Bard は教育、ビジネス、その他の分野にわたる研究と理解を向上させるように設計されているのに対し、ChatGPT はテキスト機能に重点を置いています。
- Bard はより正確な情報を提供することが期待されていますが、ChatGPT はより詳細な応答を生成するために慎重なプロンプトを必要とします。
Bard と ChatGPT: どちらが優れていますか?
この 2 つを判断するときは、ChatGPT と Google Bard の両方が微妙な違いを念頭に置いて設計されていることを覚えておくことが重要です。ChatGPT はテキストの生成と要約に優れており、Google Bard は質問に関連する情報を提示することに優れています。ただし、どちらのツールもまだ初期段階にあり、どちらが他方より優れたパフォーマンスを発揮するかは時間が経てばわかります。
Google Bardの代替品
ChatGPTはゼロから生まれたわけではありません。AIチャットボットは、汎用性の低い形ではありますが、以前から存在していました。複数のスタートアップ企業が同様のチャットボット技術に取り組んでいましたが、ChatGPTが注目されるようなことはありませんでした。Bardがリリース時に直面する競合他社には、以下のようなものがあります。
マイクロソフトのBing
マイクロソフトとOpenAIとのパートナーシップは、GoogleがBardで提供するものと全く同じものを提供するつもりです:自然言語のクエリを認識し、自然言語の応答を与えるAIを搭載した検索です。ユーザーが検索クエリを実行すると、Bingの標準的な検索結果とGPT-4が生成した回答が表示され、その回答に関してAIと対話することも可能です。
チャットソニック
ChatSonicは、「スーパーパワーを持つChatGPTの代替品」として販売されている、Google検索を利用したAIチャットボットで、AIによるテキスト生成機能「WriteSonic」を備え、ユーザーがリアルタイムで話題について議論してテキストや画像を作成できる。テスト版のみ無料でご利用いただけます。全機能を利用する場合は、月額利用料が必要です。
Jasper Chat(ジャスパーチャット)
Jasper Chatは、ブランドに関連するコンテンツを作成し、顧客と会話をしたい企業に向けて、特に生成されたテキストに焦点を当てたAIチャットボットのコピーライティングツールです。コンテンツ制作者は、プロンプトにSEOキーワードや口調を指定することができます。
YouChat(ユーチャット)
YouChatは、ドイツに拠点を置く検索エンジンYou.comのAIチャットボットです。YouChatは質問に対する回答を提供するだけでなく、回答の引用を提供するため、ユーザーはソースを確認し、You.comの回答を事実確認することができます。
NeevaAI
YouChatと同じく、NeevaAIはドイツの検索エンジン会社Neevaの一部です。引用されたソースへのリンクを提供し、オリジナルのソースからの引用を使用して回答を生成します。また、複数のソースを要約して1つの回答を提供することもできます。
まとめ
全体として、どちらの AI モデルにもそれぞれ長所がありますが、ChatGPT 4 は、言語関連の幅広いタスクにとって、より多用途で洗練された選択肢であるようです。ただし、どちらのモデルもまだ開発中であり、その機能は時間の経過とともに変化し続けることに注意してください。
彼らの成長により、ChatGPT 対 Google BARD のライバル関係はさらに興味深いものになることは間違いありません。私たちは最新情報をすべて提供するためにここに来ます。このブログを見守り続けてください。
2 つの AI チャットボット間のこの対決についてどう思いますか? どちらか一方の方が好きですか? 以下のコメント欄でお知らせください。