今回はサイバーエージェントが国内最大級の日本語LLMを公開したことの詳細記事になります。
サイバーエージェントが国内最大級の日本語LLMを公開
【必読】
— 木内翔大|AI時代に乗り遅れない為の必見情報を毎日配信📣 (@shota7180) May 17, 2023
サイバーエージェントが国内最大級の日本語LLMを公開⚡️
✅要点
・日本語版Wikipediaとコモンクロールを学習
・要するに日本語データのみを学習したLLMだと国内最大級
・商用利用可能
国内のAI開発めちゃ加速しますね
他のモデルとの比較
国産LLMのの何が凄いのか
をスレッドで解説👀👇 pic.twitter.com/ziLKX4UOWu
1. そもそもLLMとは
— 木内翔大|AI時代に乗り遅れない為の必見情報を毎日配信📣 (@shota7180) May 17, 2023
大量のテキストデータを使ってトレーニングされた自然言語処理のモデル
大量のデータを学習することで、そこから情報を抽出したり、文章を要約したり、新たにテキストを作れようになったモデルと理解しておきましょう
2.性能比較
— 木内翔大|AI時代に乗り遅れない為の必見情報を毎日配信📣 (@shota7180) May 17, 2023
すでに自社内では130億パラメータまで開発完了で、
今回は、約半分の68億パラメータまでを公開
GPT-2:15億パラメータ
GPT-3:1750億パラメータ
GPT-3.5:3500億(非公開)
GPT-4:100兆(非公開)
単純にパラメータから考えると、GPT-2とGPT-3の間くらいの性能かなと思えます
3.国産LLMのの何が凄いのか
— 木内翔大|AI時代に乗り遅れない為の必見情報を毎日配信📣 (@shota7180) May 17, 2023
✅日本語のデータに特化し、サーバーも国内にある
→海外にサーバーがあると導入できない会社もLLMを利用できるように(意外と、日系大手は海外のサーバーサービスを利用できないケースも多々)
→学習データを絞っているので、資金が少ない組織でもカスタマイズ出来る
このニュースを発端に、国内のAI開発、AI活用がさらに促進されるといいすね!
— 木内翔大|AI時代に乗り遅れない為の必見情報を毎日配信📣 (@shota7180) May 17, 2023
今週中とかには面白い事例が出てくるんじゃないかな〜と思います
引き続き注目すね!
>> ChatGPT(チャットGPT)に作ってもらえるゲームやモデルのまとめ
ホームページ制作はAIではなくプロにお任せ
ChatGPTのようなAI技術は急速に進歩しています。
しかし、ホームページ制作においてAIをプロレベルで実用化できるまでは時間がかかそうです。
AIを使用した制作物は著作権の問題もクリアになっておらず訴訟のリスクもあります。
現時点でのホームページ制作は信頼ができるプロの制作会社に依頼しましょう!
PRサイバーエージェントが国内最大級の日本語LLMを公開したことの反応
パラメータがWikipedia… https://t.co/gVG220kdy4
— masato.【Lv.23.1】(ENTP) (@management_mst) May 17, 2023
法律をもっと身近にする話題のメディアサイト「法律ビッグバン」
アニメ・漫画の登場人物やゲームキャラクターの現在の年齢まとめ
TwitterやYouTube、TikTok、SNSで話題の猫(ネコ、ねこ)情報まとめ
TikTokで人気急上昇のTikToker(ティックトッカー)情報まとめ
スポンサーリンク