今年2023年はAIの進化の真っ只中にいる。
昨年後半から画像系AIで色々なアプリが登場して、11月末にChatGPTが登場してその性能の高さに驚かされた。
年始からは、ChatGPTで有料版が出たり、MicrosoftやGoogleがAI型検索エンジンを発表したり、各種AIのアプリが発表されてきた。
そして、ChatGPTがついにこれまでのAIモデルであるGPT-3.5から進化した、GPT-4を発表した。
今回はリリースから少し時間が経っているものの、だからこそリリースから時間が経って実際に使った上での、少し冷静な目線も入れて、GPT-4について解説しようと思う。
それでは、よろしくお願いします!
GPT-4とは?
GPT-4
GPT-4とは、OpenAIが開発しているチャット型AIであるChatGPTに搭載されているAIモデル、GPT-XXの最新版だ。
これまではGPT-3.5が最新だったが、この度GPT-4がリリースされて、ChatGPTに搭載されたのだ。
ただし、GPT-4を搭載したChatGPTを使えるのは有料版ChatGPTのChatGPT Plusの利用者のみで、無料版にはまだ搭載されていない。
それでもGPT-4を搭載したChatGPTを使いたい人は多いようで、現在利用が3時間で25メッセージに制限されている(下の画像の赤枠部分)。
GPT-4を使いたい人は、ChatGPT Plusの月額20ドルのサブスクに入る必要がある。
入り方については、以下のChatGPT Plusの解説記事の中の「ChatGPT Plusの始め方」で画像付きで詳しく解説しているので、興味がある人はこちらも読んでみてほしい。
GPT-4でできること
GPT-3.5からGPT-4にバージョンアップされて、ChatGPTが変わったことの大きな特徴として、これまでよりチャットの性能が大幅に改善したことがある。
どのようににチャットの性能が大幅に改善したか、その特徴をGPT-4でできることとして、5つ紹介する。
1、マルチモーダル
これまでのGPT-3.5まではテキストベースでインプットもアウトプットもテキストだった。
GPT-4ではテキスト→画像、画像→テキストのように、テキストから違う媒体でのインプット/アウトプットが可能になった。
OpenAIがGPT-4のデモで実際に見せていたのは、ナプキンに書いたウェブサイトのメモの写真を撮り、それをChatGPTに読ませて、実際のウェブサイトのコードを書いてもらうというもの。
他にも、例えばキッチンの写真を撮って、それが何の写真かを説明してくれるようにもなったりする。
このように、GPT-4ではマルチモーダルが基本になっている。
ただし、まだ実装はされておらず、今はOpenAIの検証用ツールであるPlaygroundで使用できるのみだ。
これは開発者でないとなかなか使いにくく、一般利用は実装されるまで待つことになりそうだ。
2、プログラミングがしやすくなった
エンジニアにとっても非エンジニアにとっても、プログラミングがGPT-3.5に比べて格段にしやすくなった。
おかげで非エンジニアがGPT-4のChatGPTを使ってiPhoneアプリを開発・リリースしたことが、Twitterでバズっていた。
アプリは毎日5本の映画を紹介するアプリ。
こちらがApp Storeにある実際のアプリ
https://apps.apple.com/us/app/5-movies/id6446427676?platform=iphone
3、試験回答能力が向上した
GPT-3.5で見せていた医師や弁護士、MBAの各種試験への回答能力が向上した。
例えばだが、法科大学院の模擬試験において、GPT-3.5では下位10%の成績だったのが、GPT-4では上位10%になっている。
他にも、LSAT(アメリカの法科大学院入試)、GRE(主にアメリカやカナダの大学院版センター試験)、SATs(アメリカの大学版センター試験)などで良い成績を出している。
これがGPT-4(緑色)とGPT-3.5(青色)の各試験の成績比較。
GPT-4(緑色)がGPT-3.5(青色)よりも優れた成績を出していることがわかる。
4、回答の精度が大幅に改善した
OpenAIによると、GPT-4ではより詳細で精度の高い回答をすることが可能になった。
具体的には、回答できる語数が英語でGPT-3.5までは約4,000語だったのが、GPT-4では25,000語になった。
他にもワーキングメモリー(作業記憶、または作動記憶)が向上して、英語ベースでGPT-3までは8,000語だったのが、GPT-4では64,000語になった。
これによって、GPT-4ではChatGPTは、よりチャットの文脈に沿った内容の回答ができるようになった。
5、さまざまな業務の円滑化
Twitter、note、各種ニュースで、GPT-4を搭載したChatGPTを使うことで、さまざまな業務が円滑化されるアイディアや事例が紹介されている。
カスタマーザービス、訴状作成、資産運用のアドバイス、勉強における生徒の先生役、コピーライティング、ビジネスの市場調査など、用途は多岐にわたる。
このように、GPT-4ではこれまでできていたことの性能が一段高くなり、より用途の範囲が広がった。
GPT-4でまだできないこと
GPT-4は便利になったものの、まだまだできないこともあり、それ故に不便に感じることも多い。
個人的にはまだまだ不便だと思う。
ここでは、GPT-4がまだできないことを3つ紹介する。
1、データは2021年9月まで
GPT-3.5から引き続き、GPT-4も2021年9月までのデータを参照しており、それ以降のデータは扱っていないし、ユーザーとのやり取りの経験からも学習していないので、回答の情報が最新になっていない。
この点はGoogle検索にまだ及んでいない部分なので、改善の余地がある。
2、推論性能
単純な推論エラーを起こしたり、ユーザーからの間違った指摘やメッセージ内容を受け入れやすく、さらに内容について確認をしないことから、まだまだ推論の性能にも改善の余地がある。
これは、GPT-4搭載のChatGPTを使いながら、感じる部分でもある。
内容がチグハグだったりして、回答内容が文脈と合っていなかったり、あきらかな間違いだったりするのだ。
この点は割と大きく、Twitterなどで騒がれているほど、ChatGPTはまだまだ万能ではなく、今後も時間をかけて改善していく必要があるように感じる。
3、マルチモーダルはまだ実装されていない
GPT-4でできることで紹介したマルチモーダルだが、2023年4月現在では、まだChatGPTには実装されていない。
現在のChatGPTはまだテキストのみであり、GPT-4になったことによる違いが、なかなか感じにくかったりもする。
もちろんこれはChatGPTの内容次第だし、プログラミングや各種試験に関連するような専門知識では、使いやすさを実感することが多い。
GPT-4を使ってみた
GPT-4は実際どうなのか?
それを確かめるために、今回もこれまでにChatGPT、New Bing、ChatGPT Plus(GPT-3.5)で聞いてきた質問をGPT-4に聞いてみた。
聞いてみたのは、大きく7つ。
結論としては、何だか回答内容が全体的にChatGPT Plus(GPT-3.5)で試した時よりしょっぱくなり、しょぼくなったと感じてしまった。
ただ日本の年金制度と課題の説明のように、専門的内容はChatGPT Plus(GPT-3.5)よりも内容的に素晴らしく、GPT-4でより専門的な回答ができるようになったことは確かだと思う。
以下にChatGPT、New Bing、ChatGPT Plus(GPT-3.5)の記事も貼っておくので、よかったら各回答を読み比べてみてほしい。
ChatGPTの記事
New Bingの記事
ChatGPT Plus(GPT-3.5)の記事
このことから言えるのは、質問内容によってGPT-4とGPT-3.5は使い分けるのが良さそうであること。
・ ChatGPT PlusにChatGPT Plusについて聞いてみた
すごい抽象的なことをさも内容があるかのような構成で回答されました・・・
・ 関西弁を話させてみた
これも関西弁は話しているけど、当たり障りのない回答です・・・
ChatGPT Plus(GPT-3.5)の回答のようなコテコテ感は0。
・ 日本の年金制度と課題を説明して
詳しく、かつ要点を突いた回答。ChatGPT Plus(GPT-3.5)の回答よりも素晴らしい!
続き
ミレニアル世代とZ世代が取るべき対策は5点。
これもChatGPT Plus(GPT-3.5)の回答よりも素晴らしい!
・ 戦国時代を舞台にした小説のアイディアを教えて
小説のアイディア出しをするのではなく、「天下布武 – 異能の軍師」について、まとまりない感じでダラダラと解説された。
ChatGPT Plus(GPT-3.5)の回答では、面白そうな小説アイディアがいくつか出てきただけに、小説付きとしては、非常に残念・・・
ちなみに風間翔太という軍師はフィクションです。
続き1
続き2
・ ブラジルの国歌を日本語訳して
7つの質問の中で、今回の回答で一番残念だったのがこれ。
ブラジル国歌は著作権の都合で全て翻訳できないのは、適当過ぎる。
調べたところ、ブラジル含めて多くの国歌はロイヤリティーフリーだそうです。
続き1
続き2
続き3
今回もう一度ChatGPT Plus(GPT-3.5)で質問したところ、ちゃんと翻訳が返ってきた!
続き1
・ a^2+b^2+c^2+2ab+2bc+2caを因数分解して
この問題は、ChatGPT Plus(GPT-3.5)同様間違えていた。
個人の感想レベルだけど、GPT-4含めてChat GPTは案外数学ができない・・・
続き1
・ 将棋できる?
対局ができないの一点張りで、なんともつまらない会話になってしまった。
ChatGPT Plus(GPT-3.5)の回答みたいに、コードエディター上に盤面を再現することを期待していただけに、これも非常に残念。
まとめ:興味があればGPT-4をどんどん使おう
GPT-4は、GPT-3.5になかった機能が加わって、これまでできなかったことができるようになったわけではない。
これまでGPT-3.5までに開発してきた機能が、より大きく改善されて性能が大幅に向上したのだ。
例えるなら、iPhoneの新型でカメラの性能が大きく向上したのと似ている。
カメラの性能が大きく向上した新型のiPhoneを買うかを考えるときに、価格やデザイン、今自分が持っているスマホなどと比較して、新型のiPhoneを買うかを決めるのではないだろうか。
同じようにGPT-4も使うためには、月額20ドルの有料版ChatGPT Plusのサブスクに入らないといけない。月額20ドルはiPhoneよりは大分安いが、それでも有料は有料だし、これまでのGPT-3.5で十分使いやすく感じている人には、課金をしてGPT-4を使うメリットが見えにくいはずだ。
そこで、GPT-4は興味があればどんどん使ってみると良いと思うし、特に興味がなければ使わなくても良いと思う。
今GPT-4がすごいと騒がれていても、すでにOpenAIは次のGPT-5を開発しているし、次のGPT-5はさらにすごくなるはずで、リリースも今年か来年かで、そう遠くないはずである。
ゴメス日記では、今後もGPT-4をはじめとしてAIについて書いていく予定なので、もしGPT-4をぜひ使うべき使い方を見つけたら、共有していきたい。
最後まで読んでくれてありがとう!
ではまた!