Jukeboxは、さまざまなジャンルやアーティストのスタイルで原始的な歌を含む音楽を生のオーディオとして生成するニューラルネットです。
この技術は、生成されたサンプルを探索するツールとともに、モデルの重みとコードを公開しています。
ChatGPTで有名なOpenAI社が提供するサービスです。
Jukeboxの特徴とメリット
新しい音楽サンプルの生成
ジャンル、アーティスト、歌詞を入力として提供すると、Jukeboxはゼロから新しい音楽サンプルを出力します。
音楽生成の歴史
自動音楽生成は半世紀以上前にさかのぼります。
これには、ピアノロールの形式で音楽をシンボリックに生成するという主要なアプローチが含まれます。
生のオーディオとしての音楽モデリング
シンボリックなジェネレーターには制限があり、音楽に不可欠なより微妙な音色、ダイナミクス、表現性をキャプチャすることができません。
異なるアプローチは、生のオーディオとして音楽を直接モデル化することです。
音楽の境界を押し進める
音楽に取り組むことを選んだのは、生成モデルの境界をさらに押し進めたいからです。
生のオーディオでのモデルは、高い多様性と非常に長い範囲の構造を処理する必要があります。
Jukeboxのおすすめユーザー
- 音楽クリエイター
- アーティスト
- 音楽愛好者
- AI技術に興味がある人
Jukeboxのおすすめの使い方
- Jukeboxのウェブサイトにアクセスします。
- 生成したいジャンルやアーティストのスタイルを選択します。
- 歌詞を入力して、音楽を生成します。
- 生成された音楽を聴き、気に入ったものを保存します。
Jukeboxの主な機能
- 音楽の自動生成: ジャンル、アーティスト、歌詞を基にした音楽の生成。
- 生のオーディオのモデリング: 音楽を生のオーディオとして直接モデル化。
- 音楽の圧縮とデコード: Jukeboxのオートエンコーダーモデルは、VQ-VAEという量子化ベースのアプローチを使用して音楽を離散空間に圧縮します。
- トランスフォーマーを使用したコードの生成: VQ-VAEによってエンコードされた音楽コードの分布を学習し、この圧縮された離散空間で音楽を生成することを目的として、事前モデルを訓練します。