Grokとはどんな生成AIか
Xのプレミアムユーザーが使える生成AI
イーロン・マスクのxAI社が開発した、大規模言語モデル(LLM)をベースとした対話型の生成AIです。生成AIは学習したデータと「プロンプト」と呼ばれる指示をもとに、画像・動画・音声・テキストなど様々なコンテンツを生成できるAIの総称で、その中で自然言語処理に特化したのがLLM(ChatGPTも該当する)というモデルです。GrokもChatGPTなどの生成AIと同じように言語処理ができる他、独自の特徴としては、X(旧Twitter)の情報へリアルタイムにアクセスできる点や、ユーモラスな対話や回答が可能な点が挙げられます。
Chat-GPTとの違い
リアルタイム性が高い
ChatGPTはリアルタイムな情報収集が弱点で、1年ほど前の情報を元に回答を出すことが一般的です。一方、GroKはXを通して最新の情報を取り込めるため、完全にリアルタイムではありませんが、比較的新しい情報を得られます。
ユーモラスな回答が可能
Grokは通常の文体で回答する「標準モード」と、おもしろい口調で回答してくれたり、冗談を言ってくれたりする「ユーモアモード」の2つがあります。ChatGPTなどでもプロンプト次第でユーモアな解答をしてくれますが、Xではワンタップでユーモアモードに切り替えることができ、簡単にユーモア溢れるAIとチャットできるのが特徴的です。
マルチタスク処理が可能
GPTは一つの質問を処理している間、回答までは基本的に待ち時間となりますが、Grokは同時に処理できます。画面分割機能を使うことで、異なるタスクの同時進行が可能です。
※2024年9月現在のGrok2では、マルチタスクモードは公式でサポートされなくなっています。今後のアップデートで再び実装される可能性はあります。
回答範囲が広い
一般のLLMでは回答しにくいセンシティブな話題(犯罪・アダルト・倫理観に関する内容)についても、回答が可能です。あくまで冗談半分というスタンスで回答してくれたり、真剣に回答してくれたりすることもあります。
オープンソース化されている
ChatGPTはオープンソース化されていないため、開発チーム以外が自由にソースを取得して、改変・再配布ができません。一方Grokは2024年3月にオープンソース化されていて、性能も高いと言われています。
オープンソース化されているLLMには、MetaのLlama2、Mistral、ColossalChatなどいくつかありますが、LLMの性能を表すパラメーター数はGrokが多いというデータもあります。とくに日本語の処理性能は他と比べてかなり高いようです。
ChatGPTのほうがパラメーター数は多い状況ですが、オープンソースの中ではGrokはかなり高性能なのが伺えます。
「Grok-2」「Grok-2 mini」について
2024年3月には「Grok-1.5」「Grok-1.5V」を、2024年8月には「Grok-2」「Grok-2 mini」が発表されました。
- 「Grok-1.5」:数学処理やコーディング能力が強化され、「Grok-1.5V」は写真やインフォグラフィックなどの視覚情報の処理ができるようになった。
- 「Grok-2」:「Grok-1.5」の能力が向上。テキスト・視覚情報の理解、Xのリアルタイムな情報も取得やテキストからの画像生成も可能。
- 「Grok-2 mini」:処理速度を重視した軽量版。回答スピードを重視する場面でより活用できる。
Grokの利用金額は?
Xのプレミアムプランに加入することが必要で、月額980円でGrokが利用可能です。
Xのプラン(2024年9月現在)
Webサイト版
- ベーシック:368円/月額(3,916円/年額)
- プレミアム:980円/月額(10,280円/年額)
- プレミアム+:1,960円/月額(20,560円/年額)
ちなみにiOS、Android版ともにスマートフォンのアプリ経由だと金額が月額300円ほど上がるので、Webサイトから申し込むのがお得です。
iOS、Android版
- プレミアムプラン1,380円(年額14,300円)
実際にGrokを使ってみよう
2024年9月現在、Grok2のベータ版が提供されたタイミングでの使い方を紹介します。
使い方のステップ
Xのプレミアムアカウントに登録する
まず、Xのプレミアムアカウントに登録しましょう。Xのアカウントを開き、右上の「プレミアムにサブスクライブ」からプランを選択します。この時、前述の通りスマートフォンのアプリからだと月額料金が高くなってしまうので、PCのブラウザ版から登録するのがお得です。
なお、プレミアムアカウントに登録するには電話番号認証が必要です。別のアカウントでプレミアムに登録しても、すでにその電話番号が紐づいてる元のアカウントがプレミアムになる仕様のようです。(筆者は記事用にアカウントを別で作成しましたが、電話番号登録がすでにされている元のアカウントに紐づいてしまい、関係ない個人用のアカウントでプレミアム登録されてしまいました。)
Grokを開く
プレミアムに登録後にトップページを開くと、左側のバーに「Grok」のメニューが表示され、クリックするとチャットを入力する画面になります。
Grok-2 miniとGrok-2のどちらかを選ぶ
上部のプルダウンメニューを押すと、回答速度を重視した「Grok-2 mini」と、回答精度を重視した「Grok-2」を選択できます。
ユーモアモードのオン/オフを選ぶ
さらに下にはユーモアモードのオンオフを選べるボタンがあるので、かんたんに通常モードと使い分けられます。
フィールドに質問や指示を入れてみよう
実際に会話をしてみましょう。この記事を読んでいる方の多くはChatGPTを触ったことがあると思いますが、基本的な使い方は同じです。
回答と共にXのポストの情報が提供される
試しに現在の為替レートについて質問してみると、リアルタイムな情報を提供してくれました。また、関連するXのポストもいくつか提示してくれます。これはChatGPTにはない回答体験で、使える場面は多そうです。
Grokの実用的な使い方
試しに、いくつかリアルタイム性の高さが重要な質問をしてみました。
明日以降の渋谷駅の天気
このリアルタイム性は他のLLMとの違いですね。
2024年9月と2014年9月の東京の家賃相場の変化
過去10年比較の質問も、2024年のデータが取得できるので回答可能です。
来週の金曜日に福岡出張で泊まるホテルの候補
予算を指定すると、より具体的に答えてくれます。
現在の状況を踏まえた回答は、他のLLMよりも「リアルに友人・知人に相談している」感覚が強く、ChatGPTとはまた違う使い方ができます。
簿記2級を獲得するためのマイルストーン
リアルタイム性がない質問は他のLLMと似たような回答ですが、Grok-2 miniはとにかく回答が早いです。ChatGPTでは回答を待つために一旦別の画面に移って作業をすることがたびたびありますが、Grok-2 miniはそのまま画面を見ているとすぐに回答が出てきます。
日本語から英文への翻訳
翻訳も問題なく行えます。
予約フォームのコーディング
筆者はエンジニアではないので詳しい精度は不明ですが、フロント側とバックエンド側の両方のコーディング、また気をつける点について回答が来ました。一定の回答精度はありそうです。
こちらはGrok-2を使用し、Grok-2 miniに比べると回答速度はやや落ちたものの、問題ないスピードです。
ユーモラスな使い方
Xのタイムラインから学習しているGrokは冗談や大喜利も得意です。ユーモアモードをオンにして、気が早いですが年末の忘年会の一発ギャグを考えてもらいます。
忘年会のギャグを考えてもらう
忘年会に参加するターゲット層を入力して、いくつかの角度で候補を出してもらいました。
「注意: これらは地球人のユーモアに基づくものであり、銀河系の他の場所では必ずしも理解されないかもしれません。」という回答文からすでにおもしろいです。
日本人の笑いのツボをしっかり理解しています。この使い方はXのGrokならではですね。
帰宅が遅いことに激怒する妻への言い訳
こちらはややアメリカンな一般的なLLMと同じような回答が。もう少し工夫すると良い回答が得られるかもしれません。
余談ですが、前述のGrokなら回答可能なセンシティブ・アダルト・犯罪・倫理観についても質問してみたところ、記事には掲載できないような内容ですが、一定の役に立つ回答を得られました。
Grok-2で画像生成を試してみる
「オフィスビルでパソコンを入力する日本人男性の画像を生成してください。彼はスーツを着てメガネをかけています。実写の画像でお願いします。」とプロンプトをいれると、指示通りのクオリティの高い画像が生成されました。
また、アニメや漫画のキャラクター、芸能人やスポーツ選手などの画像生成も可能です。ここでは画像を掲載しませんが、「ドラゴンボールの孫悟空がかめはめ波を打っている画像を生成してください。漫画のタッチでお願いします。」というプロンプトで、かなり本物に近い画像が生成されました。高クオリティである一方、著作権や肖像権の扱いには注意が必要です。
画面分割によるマルチタスク
これまでのGrokでは同時処理が可能でしたが、2024年9月現在はマルチタスクモードはサポートされていないようです。これについてGrokに質問してみると、
Grokの回答:
「現在のシステムではGrok自体を2画面で同時に使用するマルチタスクモードはサポートされていません。Grokのインターフェースはシングルセッションに最適化されており、1つの会話スレッドを管理するように設計されています。」
とのことです。
他のLLMと同じように別のタブを開けば複数のチャットは可能です。
まとめ:GrokはChat-GPTと違う実用性がある
Xの提供するLLMのGrok-2は、他のLLMにはないリアルタイム性のある情報、Xのポストから学習した生の声を反映した回答、独自のユーモラスさがあります。また、Grok-2 miniの回答スピードの速さは他のLLMにはない体験で、今後もChatGPTと平行して使っていく人も多くなるでしょう。
—
本メディアでは、今後もGrokをはじめとした、生成AIの活用方法について紹介していきます。メディアを運営するatmaLabでは、企業のAI / IT 導入アドバイザリーやAI / IT システム開発を受け付けています。