Large Language Modelの略称で、「大規模言語モデル」と訳される。大量のデータを学習した高度な言語モデルで、さまざまな自然言語処理タスクの処理に優れている
膨大なデータを学習し、さまざまな形式のテキスト情報を生成する技術
LLM(Large Language Model・大規模言語モデル)は、生成AIの一種であり大量のテキストデータを使用してトレーニングされ、自然言語処理のタスクに対する高度な言語理解能力を持つAIモデルのことです。また、脳の神経回路の仕組みを模倣して考案されたニューラルネットワークを用いているため、非常に多くのパラメータを持つことも特徴です。
自然言語処理とはコンピュータが日本語や英語などの言語を理解し処理するための分野で、LLMは膨大な量のテキストデータを学習することで自動翻訳や文章の作成、情報検索、ユーザーからの質問への応答など言語関連のタスクに対して優れたパフォーマンスを発揮します。Google の「BERT」やOpenAIの「GPT」などはLLMの代表例です。
ソフトバンクは、日本語に特化した国産の大規模言語モデルの研究開発と生成AIサービスの開発、販売、提供を目的とする「SB Intuitions」を設立。サービス提供開始に向けた取り組みを進めています。
LLMの関連情報
(掲載日:2023年11月20日)
文:ソフトバンクニュース編集部
からの記事と詳細 ( 【LLM】~1分で分かるキーワード #161 - ITをもっと身近に ... - softbank.jp )
https://ift.tt/K5ho9sY
No comments:
Post a Comment