ニュース

Databricks、ChatGPT風の大規模言語モデル「Dolly 2.0」。オープンソースで商用利用可能

 Databricksは12日(米国時間)、オープンソースの命令追従型大規模言語モデル「Dolly 2.0」を提供開始した。商用利用も可能で、さまざまな企業や組織で活用できるとしている。

 Dolly 2.0は、EleutherAIのpythiaモデルファミリーをベースとした120億のパラメータを持つ大規模言語モデル。トレーニングコードやデータセット、モデルの重みなど、Dolly 2.0全体をオープンソース化しており、商用利用を可能とした。

 トレーニングに用いられたデータセット「databricks-dolly-15k」には、数千人の同社社員によって生成された1万5,000件のレコードが含まれ、大規模言語モデル向けとしては初のオープンソースで人間生成の命令データセットだとしている。クリエイティブコモンズのライセンス下で公開しており、商用を含むあらゆる用途で使用、修正、拡張できる。