今回はChatGPT(チャットGPT)が目と耳を持ち画像や音声認識に対応して会話中の画像認識や発話機能でユーザーと会話することも可能なことの詳細記事になります。
目次
ChatGPTが音声認識に対応して会話中の画像認識や発話機能でユーザーと会話可能に
【速報⚡️】ChatGPTが画像・音声認識に対応!マルチモーダルへ
— 木内翔大@SHIFT AI代表「日本をAI先進国に」 (@shota7180) September 25, 2023
会話中の画像認識や発話機能でユーザーとの会話も可能
・音声機能はiOS/Androidで利用可能
・複数枚の画像読み取りにも対応
・2週間かけてPlusユーザーとEnterpriseユーザーに順次展開pic.twitter.com/RlmQCtMfVZ
OpenAIは「グリルが起動しない原因を解決したり、冷蔵庫の中身を調べて食事の計画を立てたり、仕事関連のデータの複雑なグラフを分析したりできる」
— 木内翔大@SHIFT AI代表「日本をAI先進国に」 (@shota7180) September 25, 2023
という活用事例も共有している
スマホアプリ版ChatGPTの新機能の画像付きで会話できる機能めっちゃ便利そう!
— KAJI | 梶谷健人 (@kajikent) September 25, 2023
今回の発表時の動画のように画像込みのやり取りで何往復もAIに相談して問題解決できるの、現状の検索体験が全く実現できていないことで、かなりインパクト感じる。pic.twitter.com/ke6Yc0pKDe
【⚡️速報:ChatGPTが遂に目と耳を持つ】
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) September 25, 2023
アップした写真を解析する能力を持った
例えば、自転車の写真をアップして
「サドルを下げる方法を教えて」
と入力すると方法を解説
更にスマートスピーカーのように会話できる能力も
応用が無限大
AIが聴覚と視覚を手に入れて人間に近づいた
↓解説 pic.twitter.com/QPkrJeTKBj
>> ChatGPT(チャットGPT)に作ってもらえるゲームやモデルのまとめ
ホームページ制作はAIではなくプロにお任せ
ChatGPTのようなAI技術は急速に進歩しています。
しかし、ホームページ制作においてAIをプロレベルで実用化できるまでは時間がかかそうです。
AIを使用した制作物は著作権の問題もクリアになっておらず訴訟のリスクもあります。
現時点でのホームページ制作は信頼ができるプロの制作会社に依頼しましょう!
PRGPT-4についてまとめ
- ・現状ChatGPT Plusで利用可能(月額料金は20米ドル)
- ・画像入力対応
- ・司法試験を受けたら上位10%のレベル
- ・ジョークを理解できる
- ・嘘をつく可能性低下
- ・日本語でも高精度な対応
- ・25,000語を1つのプロンプト内で処理可能
- ・マルチモーダルAI(画像+テキストからテキスト生成可能)
ChatGPT(チャットGPT)はOpenAIが2022年11月に公開したチャットボットです。OpenAIのGPT-3ファミリーの言語モデルを基に構築されており、リアルな会話文を生成することが可能です。
会話だけでなくマークアップ言語のHTMLやPythonのようなプログラミング言語の生成も可能です。また、表計算ソフトの関数も得意としています。
ChatGPTが音声認識に対応して会話中の画像認識や発話機能でユーザーと会話可能になることへの反応
画像認識AIによって代替されそうな仕事は、X線画像診断、工場製品の品質チェック、監視セキュリティ、データ分析…人間の視覚によって判断する仕事は全部ですね。
これ相当革命的。今までテキストだけの学びの次元だったのが視覚や聴覚レベルで学ぶので次元レイヤーが重なって知識レベルが指数関数的に伸びる。これからの6ヶ月は過去6ヶ月の成長スピードの数十倍進化すると思う。API解放はよ。。
ついにChatGPT画像認識に対応!これ活用すれば、1つ画像を読み込ませて、その画像の要素を抽出、そして画像生成AIのプロンプトに反映させるなど、他の生成AIにも活用できますね。
コードみたいに出口のない禅問答になりそう。
ついに来た…。ここからシンギュラリティ起こりそう。
引用元:X(Twitter)
法律をもっと身近にする話題のメディアサイト「法律ビッグバン」
アニメ・漫画の登場人物やゲームキャラクターの現在の年齢まとめ
TwitterやYouTube、TikTok、SNSで話題の猫(ネコ、ねこ)情報まとめ
TikTokで人気急上昇のTikToker(ティックトッカー)情報まとめ
スポンサーリンク