検索

キーワード


目次

【2023年12月】対話型AIとは?おすすめの対話型AI利用サービス6選!

  • 公開日:2023-08-03 08:34:14
  • 最終更新日:2023-12-02 18:19:38
【2023年12月】対話型AIとは?おすすめの対話型AI利用サービス6選!

Workteria(ワークテリア)では難易度の高いものから低いものまで、スキルや経験に合わせた案件を多数揃えています。会員登録は無料ですので、ぜひ会員登録してご希望の案件を探してみてください!

フリーランス/正社員のエンジニアとして活躍するには、ご自身のスキルや経験に合わせた仕事を選ぶことが大切です。ご希望の案件がみつからない場合はお気軽にお問い合わせください!ユーザ満足度の高いキャリアコンサルタントが在籍していますので、希望条件や悩み事などなんでもご相談ください。ご希望にピッタリの案件をご紹介させていただきます。

対話型AIとは?

最近、ChatGPTをはじめとする対話型AIの能力が急激に進化し、話題になっています。でも、対話型AIとは一体何でしょうか?本記事では、対話型AIについての解説から始め、さまざまな対話型AIサービスの特性を紹介します。

ジェネレーティブAI(生成AI)全体の概要や、その他のジェネレーティブAIについて知りたい方は、以下の記事を参照して下さい。

【2023年8月】ジェネレーティブAI(生成AI)入門: これだけは知っておきたい基本概念


対話型AIとは、人間の言語を理解し、適切な返答を生成する能力を持つAIのことです。実は、私たちの生活の中にはすでに対話型AIが存在します。例えば、Amazonの「Alexa」やAppleの「Siri」などは、ユーザーとの対話を通じて様々なタスクを行います。しかし、これらのAIは音楽の再生や天気予報の提供といった限定的なタスクをこなすものがほとんどでした。

では、従来の対話型AIと最近話題のChatGPTBardは何が違うのでしょうか?それは、新しいAIが「大規模言語モデル(LLM, Large Language Model)」と呼ばれる大量のテキストデータを用いて訓練されている点です。これにより、翻訳や要約、コードの生成、詩の創作などといった多岐にわたる複雑なタスクを、所定の文(プロンプト)を入力するだけで行うことが可能になりました。

この革新的な進歩により、対話型AIは以前には想像もつかなかったような役割を果たすようになり、その利用範囲が広がりつつあります。次のセクションでは、現在利用可能な大規模言語モデルを用いた対話型AIサービスの中から5つを選び、その特性と利用法について紹介します。


ChatGPT

ChatGPT (openai.com)

ChatGPTは、OpenAIが2022年11月に公開した対話型AIサービスです。これは、AIが文脈を理解し、人間のような会話を生み出す能力を持っています。このことは世界に衝撃を与え、公開からわずか2ヶ月で登録者数が1億人を突破しました。

BingAINotionAIなど2023年8月現在、多くの対話型AIサービスが存在します。これらのサービスは、日本語対応を含む多くの機能を提供しています。そして、これらのほとんどは、ChatGPTと同じような大規模モデル(GPT)を利用しています。ただし、それぞれのサービスは、特定のニーズや用途に合わせて微調整(ファインチューニング)されています。そのため、それぞれが異なる特長や強みを持っています。

ChatGPTの導入方法や出来ること、出来ないことについては以下の記事で詳しく解説しています。

ChatGPTの使い方は?ChatGPTで出来ること、出来ないことは?ChatGPTの基本について解説!


無料版と有料版について

ChatGPTは、無料版と有料版の2つのバージョンがあります。無料版では、GPT-3.5というモデルを無制限に利用することができます。一方、有料版では更に進化したGPT-4というモデルを利用することができます。ただし、GPT-4の利用には3時間につき50回という制限があることを念頭に置いてください。
また、有料版では強力なプラグインも利用可能で、例えばAdvanced Data Analysisは大規模言語モデルが苦手とする計算問題を、GPTが自動でプログラムを書いて演算するというアプローチを行って解くことが出来ます。

舌の表に、無料版と有料版の違いについて簡単にまとめました。

機能 無料版 有料版(ChatGPT-Plus)
料金 無料 月額20ドル(約2800円)
利用回数 無制限 無制限(ただしGPT-4の利用は制限あり)
応答速度 普通 約2倍の速さ
GPT-4, GPT-4V 利用不可 利用可
プラグイン(拡張機能) 利用不可 利用可
利用の優先度(混雑時) 遅くなる可能性あり 優先的に利用可能
新機能の更新頻度 約3ヶ月ごと 約1ヶ月ごと


GPT-4V

2023年9月末からは音声入力・出力画像認識・出力機能が追加されたGPT-4Vが利用可能になりました。

これにより、ChatGPTと音声による会話を行ったり、画像認識を行わせることが出来ます。

以下の例では、ホームページのスクリーンショットを撮影し、同じような構造のサイトを作成できるようにしています。

ChatGPTに画像認識を行わせ、画像と同様のHTMLファイルを作成する。

数回のChatGPTとのやり取りを経て、5分程度で以下のようなhtmlファイルを作成できました。

さらにChatGPTとの対話を行い、追加のCSSやjavascriptを実装すれば、より目標とするWebページに近づけられるでしょう。

気に入ったデザインのWebページなどを参考にする際に、役に立つでしょう。

画像認識を用いてHMTLページを作成

その他のGPT-4Vの活用法については、別途記事を作成予定です。


Bard

Bard (google.com)

Googleが公開中の対話型AI、それがBardです。2023年8月現在、まだ試験運用段階ではありますが、その機能はすでに注目に値します。ChatGPTのGPT-3.5よりも推論能力は劣るものの、いくつかのBard独自の特長があります。


複数の出力案を提示する

一つのプロンプトに対して、Bardは3つの出力案を提供します。これはアイデアを求める際に有効で、多角的な視点から発想を広げることが可能です。ただし、細かい情報を必要とする研究や調査の際には、不正確な案が混じることで混乱を招く可能性もあります。

Bardは出力時に複数の案を示す


Googleの各種サービスとの連携が可能

Bardのもう一つの魅力は、Google DocumentやGmailとのシームレスな連携能力です。今後、Google SpreadsheetやGoogle Colabなど他のサービスとの連携も増えることでしょう。

Bardからの他サービスへの連携


最新情報の参照能力

そして最も重要な特長は、リアルタイムで最新の情報を取得する能力です。これはChatGPTが2021年までの知識しか持っていないのとは大きな違いです。

例えば、2023年8月現在のG7首脳について、ChatGPT(GPT-4)に聞いてみると、知識が2021年までのため、当時の首相の名前を出力します。

ChatGPTにG7の首脳を答えさせた結果


一方、Bardに現在のG7の名前を聞いてみます。イタリアの2023年8月当時の首相はジョルジャ・メローニ首相なので不正確な部分はありますが、岸田首相やスナク首相など2023年8月現在でG7の首脳を務めている人物の名前が出力されます。

BardにG7の首脳の名前を聞いた結果


今秋にも「Gemini」がローンチ予定、GPT-4と同等以上の性能を持つ可能性

Googleは、GPT-4の競争相手となる大規模言語モデル「Gemini」を今秋にも公開することを発表しました。

画像や地図など、視覚的要素も提供することができる、マルチモーダル型のAIになるとのことです。
詳細な公開時期などはまだ不明ですが、おそらく今年中にはローンチされることが予想されます。


BingAI

Bing

BingAIはMicrosoftの検索エンジン「Bing」に組み込まれた対話型AIで、OpenAIが開発したGPT-4をベースに作られています。これにより、長らくGoogleが独占していた検索エンジン市場に新風をもたらしています。

利用するためにはMicrosoftアカウントが必要で、基本的にはMicrosoftのWebブラウザ「Edge」やスマートフォンアプリ「Bing」でしか使うことはできません。しかし、「Bing Chat for All Browsers」プラグインを導入すれば、Chromeなどの他のブラウザでも使うことが可能です。


最新情報の参照能力

BingAIの一つの強みは、ChatGPTが持っていない最新情報へのアクセス能力です。例えば、2023年8月現在のG7首脳の名前を尋ねると、それに対する正確な答えを得られます。この過程でBingAIはリアルタイムに検索を行うため、多少出力までに時間はかかりますが、回答の根拠となったページを示してくれます。

BingAIに現在のG7首脳の名前を聞いてみる


画像生成が可能

BingAIはまた、画像生成AI「DALL-E」と連携して画像を生成することも可能です。例えば、「夏の花火の画像」を生成してみると、実際の写真にも劣らないような画像を生成します。

「Stable Diffusion」などと比べると画像生成の拡張機能や人物の描写がやや劣るかもしれませんが、簡単な画像ならある程度の質を保って生成することができます。

BingAIに花火の写真を生成させた結果


Notion AI

Notion (ノーション)AI | 作業のスピードや品質を向上させ、思考の幅を広げます。

Notion AIは、ビジネスツール「Notion」にAI技術が組み込まれたサービスです。日常の作業をより効率的に進めるために、タスク管理、スケジュール管理。ドキュメントの作成などを支援します。

Notion AIでは、ビジネス用途にファインチューニングしたGPTを使って様々なビジネスのニーズに対応し、ユーザーの行いたいタスクの実現を支援します。そのため、AIに指示を出す内容(プロンプト)については特に細かい設定をする必要はありません。サービスの利用は最初の20回までは無料で、それ以降は月額10ドル(約1400円)で利用することができます。
たとえば、以下のように簡単にToDoリストの作成を行うことが出来ます。

NotionAIでToDoリストを作成する


LLaMA

Explore Llamav2 With TGI - a Hugging Face Space by ysharma

LLaMAは、Meta(元Facebook)が作成したオープンソースの言語モデルで、商用利用でも無償で使用できます。このAIの英語でのベンチマークがGPT-3.5を超えたことで注目を浴びました。しかし、LLaMAの日本語能力はまだ完全には開発されていないため、日本語での問いかけには英語での返答を返します。

しかし、LLaMAの主な強みはオープンソースという性格からくるもので、誰でも開発に参加することができます。これにより、日本語に特化してファインチューニングされたモデルの公開が期待できます。費用の面で対話型AIの導入を断念していた企業や団体も無料で対話型AIを利用できる可能性があるため、これからの進化に期待したいです。


日本語でGPT-3.5相当の性能を持つモデルが公開

Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました|ELYZA, Inc. (note.com)

あまり日本語での性能が良くなかったLLaMaでしたが、2023年8月末にELYZA.incが「ELYZA-japanese-Llama-2-7b」というモデルを公開しました。

利用規約に従う限りは、研究および商用での利用も可能です。更なる性能を持つモデルも開発中とのことで、今後の動きにも注目したいです。


Claude2

対話型生成AIにおいて、ChatGPTの競合相手として最近注目されてきているのがClaude2です。

Claude2はAnthropic社によって開発された最新のAIチャットボットモデルで、2023年10月には日本でも利用可能になりました。日本語に関する能力も、ChatGPTと遜色はありません。

GPT-3.5よりは賢く、GPT-4にはやや劣る程度ですが、無料で利用可能です。

また、「本一冊読み込まエることも出来る」と喧伝されるほど、非常に長いテキストを読み込むことが出来ます。

詳しくは以下の記事を参照して下さい。

ChatGPTに対抗馬現る?「Claude2」について解説!【生成AI】 (forward-soft.co.jp)


その他

日本発の大規模言語モデルの可能性は?

日本でも大規模言語モデルの開発が進んでいます。NECやサイバーエージェントなどの国内企業、そして全国の研究機関が日本語特化型のLLM開発に力を注いでいます。特にNECでは、既に開発されたモデルが社内で利用されています。

しかし、2023年8月現在のところ、GPT-3.5と同等あるいはそれ以上の性能を持つ、一般ユーザー向けの対話型AIサービスはまだ存在していません。しかし、技術は日々進化しており、日本発の対話型AIサービスが一般に広まる日もそう遠くないかもしれません。今後の発展が楽しみです。


各種対話型AIサービスの比較表

以下に各種対話型AIサービスの特徴を表にまとめました。

AIサービス ベンダー 言語モデル 使用料 最新情報の参照能力 強み その他の特徴
ChatGPT OpenAI GPT-3.5 (無料版), GPT-4 (有料版) 無料版あり、有料版は月額20ドル なし
有料版ではプラグインを使うことで参照可能
有料版では画像認識が出来るGPT-V4や、その他強力なプラグインを利用可能 応答速度が有料版では2倍
新機能の更新頻度が有料版で約1ヶ月ごと
Bard Google GPT-3.5より劣る 無料 (試験運用段階) あり 複数の出力案提示、Googleサービスとの連携 -
BingAI Microsoft GPT-3.5 無料 あり 回答でWebページの記述をそのまま引用することが多い
画像生成が可能
Microsoftアカウントが必要、特定のブラウザやアプリが必要
Notion AI Notion ビジネス用途にファインチューニングしたGPT-3 最初の20回まで無料、それ以降は月額10ドル なし ビジネスに特化プロンプトを入力することなく利用可能
LLaMA Meta LLaMA v2(英語ではGPT-3.5より優れる)
無料 (オープンソース) なし 開発に誰でも参加可能 日本語対応は開発途上
Claude2AnthropicGPT3.5以上、GPT-4以下の性能無料版あり、有料版は月額20ドルなし非常に長いテキストの読み込みが可能利用に電話番号が必要なため、複数アカウントでの運用が難しい


まとめ

本記事では、対話型AIについて詳しく解説し、その利用例や特性についても触れました。対話型AIは、人間の言語を理解し、適切な返答を生成する能力を持つAIの一種で、日々の生活やビジネスの効率化に大いに役立っています。

2022年11月にChatGPTが公開されて以降、様々な対話型AIサービスが作られ、それぞれが異なる特性や強みを持っています。これらのAIは、大量のテキストデータを用いて訓練されており、翻訳や要約、コードの生成、詩の創作などといった多岐にわたる複雑なタスクを、所定の文(プロンプト)を入力するだけで行うことが可能です。

対話型AIの進化は止まることなく、その利用範囲はますます広がりつつあります。しかし、その一方で、対話型AIを活用する際には、その特性を理解し、適切に利用することが重要です。この記事が各種対話型AIを選ぶ際の参考になれば幸いです。


【著者】

ゆうさい

フォワードソフト株式会社のエンジニア。Java、Python、JavaScript、C#などの言語の他、クラウドやネットワーク技術を勉強しています。PythonやVBAを使った自動化で楽をする方法を考えるのが好きです。 最近はジェネレーティブAIの業務利用に関する検証を行っています。 資格を通じて知識を吸収することを心がけており、セキュリティスペシャリスト、データベーススペシャリスト、応用情報技術者、Oracle Certified Java Programmer Gold SE 11、Pythin3 エンジニア認定試験、HTML5プロフェッショナル認定試験レベル2、AWSプラクティショナーなどの情報資格を保有しています。

編集した記事一覧

正社員/フリーランスの方でこのようなお悩みありませんか?

  • 自分に合う案件を定期的に紹介してもらいたい
  • 週2、リモートワークなど自由な働き方をしてみたい
  • 面倒な案件探し・契約周りは任せて仕事に集中したい

そのような方はぜひ、Workteriaサイトをご利用ください!

  • 定期的にご本人に合う高額案件を紹介

  • リモートワークなど自由な働き方ができる案件多数

  • 専属エージェントが契約や請求をトータルサポート