【1日目】作曲補助ツールを作ろう

2023年7月1日〜2023年7月7日

もう7月に入ってしまった。。

前回、一応Pythonで音楽系人工知能の簡易的なものが完成したわけで、それの続きをやってもよかったんだけど、その続きになる目指すものが実は既にあったことに気づいてしまった。車輪の再発明とまでは言わないけど、ちょっとリサーチ不足だった。

プログラミングの世界だと結構こういうことありそう。

だから、一応完成したことだし、一回人工知能という制限を取っ払って作曲の補助ツールを作ることを目指そうと思い、改めて日記を始める。具体案は無い。

作曲する上で困ることは幾らでもあるんだけど、ちょっとプログラミングで解決するのが難しそうではあるし、思いつくことはだいたいやり尽くされてる。
とりあえず、今思い出せる困ったことを適当に挙げる。その後、自分の日記を見返して更に挙げる。そのあと、ググる。そのあと、ChatGPTに聞く。この順番で行く。

作曲をしていて困ったこと
考えた物
とりあえず

作曲をしていて困ったこと

以下は今思い出せる困ったこと。

まず、何から始めていいかわからない。
人によって”音楽”は違うので、自分の好きな音楽がはっきりしないと欲しい情報がわからない。そうでないと自分に本当は必要でない情報を必要だと勘違いしてしまう。
努力が実らない。
プログラミングは論理的な物なので、初心者でもまあ努力すればある程度しっかりしたものはできる。音楽は論理的な部分もあるだろうけど、初心者じゃまず満足するものはできない。音楽理論的な話もあるし、ミックス、マスタリングの話もあるし、これ等をパスしてても普通の曲になってしまう問題もある。とにかく、壁が多くて完成が遠い。”視覚”と違って”音”だから何が違うのか、何が悪いのかが分かりにくいというのもある。
というか、音楽がまず完成しない。
私の場合は何となくでしか音楽を聞いてなかったので、最初はイントロ・Aメロ・Bメロ・サビという構成があんまわかんなかったし、この構成で音楽を作るのがわかったとしても、じゃあイントロってどうやって作るねんとなる。
もし、イントロ、Aメロが出来たとしても、それをどうやってつなげるのかという話になる。マジでムズイ。なんかこうやって振り返るとやっぱ私は作曲向いてない気がする。
理想がでかすぎる。
わざわざ作曲に挑戦する人は大体はかなり音楽が好きな人だろう。音楽が好きな人はやっぱり音楽を沢山聴いてるから、潜在的なところで耳はある程度肥えてると思う。私みたいに今まで何でここがいいのかを言語化せずに聞いてきた人でも、やっぱりこの音楽は好き・嫌いがあるので、良いのベクトルは異なれど、潜在的に肥えてるはず。だから、理想が高くなっちゃってそのギャップ差が激しいんだと思う。
人から意見を貰うのが怖い。
普通に考えて人から意見を貰った方が新しい視点を得れるから成長すると思う。でも、勿論不特定多数に暴言を言われるんじゃないかって怖い。だから、人にアドバイスを求められない人はたくさんいるのでは。
描いてて思ったけど、音楽を言語化する機会が無いし、するのが難しい。
音楽の良さって論理的に説明するのが難しい。例えば私はこの音楽の最初の掴みが今まで聞いてきた音楽の中で最高だと思ってる。他にもこの音楽で言えば、2年くらい前から、全ての音楽の中で最も好きな音楽と言っても過言ではない。しかし、どちらも「何がどう良いのか」はなかなか言語化できない。でも、音楽を作るっていうのは、何か感動したものをある程度拝借して、自分なりの物にする作業でもあると思うので、言語化は出来てるといいよね。
音楽を聞きながら音楽を作れない
音楽が好きだから音楽作ってんのに、音楽作ってる時は音楽が聞けないジレンマ。ふざけてるみたいに思われるけど、結構マジで困る。音楽聞きながら音楽を作りたい。

とりあえずパッと思いつく困ったことはこんなもん。

次は過去の自分の日記を見る。こういう時の為に日記がある。
当たり前なんだけど、過去の日記みるのめちゃ恥ずかしい。一生恥ずかしいを量産している気がする。

以下、過去の日記から抜粋（上と重複あり）

MVとかサムネイル作るの難しい
作曲とは別の技術だからね
歌詞作るの難しい
普通に難しいし、改めて聞くとめっちゃはずい。
知識を手に入れるのが難しい。
情報が体系的に纏まってるところがあんまりないのと、重ねてになるけど、自分の必要な情報を手に入れるのが難しい。
私の場合は1年半、2年？くらいEDMっぽい音楽作りたいのに、普通の音楽理論を学んでた。別にいいとは思うんだけど、ちょっと遠回りではあるよね。
構成が難しい
既出。
正解が無いのが難しい。
極論、音楽に定められた目的を達成すればその音楽は正解と言える。そうなると私の場合は、自分で感動する音楽を作るのが正解だけど、これがむずい。プログラミングはある程度正解があるから、学びが視えるし、成長曲線がマジでX=Yって感じ。音楽はずっとY=1な気分。滅茶苦茶やってるわけじゃないけど、成長してる気がしない。
著作権が難しい。
極論、全て著作権クリアな音源使えばいいんだけど、ねぇ。私の耳を肥やしてきた音楽の環境が違法音楽ばっかだったから、そういうのが好きになっちゃうんだよね。だから、もし違法じゃないならRemixとかMashupとか、サンプリングバンバン使いたいというのが本音。
シンセサイザーが難しい。←わかる。未だにわからん。
ミックス・マスタリングが難しい。←わかる。未だにわからん。
初音ミクや重音テトの調声が難しい。
UTAU重音テトはベタ打ちでも意外と味が出ると思ってる。初音ミクはやっぱりベタ打ちだときつい。色んな調声テクニックがあるんだけど、それが体系的にまとめられてないし、恐らく開発者側も想定してないテクニックとかもあるので、公式が纏めるのも限界があるという状況。自動調声機能を追加できるはずなのに、しないクリプトンには何か考えがあるはずなので、私はそれを尊重する。
機材ムズイ。
オーディオインターフェイスやら、モニターヘッドホンやら、DAWやら。今はある程度わかるけど、やっぱ初見だと意味わからんよなぁ。
正直、Sonyの定番モニターヘッドホンは買って失敗だったと思ってるし、DAWもEDMやるならFLとかの方がよかったかなと思ったりしてる。
エフェクト系がムズイ。
音楽って感覚的なところがあると思うんだけど、エフェクトとかプラグインになるといきなり論理的になる。プログラミングで作ってるからというのはあるんだけど。コンプレッサーとか使おうとすると結構理論的な仕組みを理解してないときついと思うんだけど、皆理解してんのかな。みんな理解してるんだとしたら、DTMは結構理系っぽいなぁと思うんだけど、どうなんだろう。
お金がかかる。
今、私が0からボカロ音楽制作ををある程度しっかり始めようとしたら、
・ノートPC 12万
・DAW 4万
・初音ミク 2万
の合計18万は最低でもかかる気がする。難しいのベクトルが違う気はするけど、まあ難しいよね。しかも、オーディオインターフェイスとか、ヘッドホンとか、音源とか、色々こだわり始めるとマジで青天井。オーディオ沼は深淵。私はオーディオインターフェイスとヘッドホンは最初は要らないんじゃないか派なので、予算に入れてないけど、それでも18万。PC持ってても6万。プロと同じ製品を使うと考えたら安いけど、高いよなぁ。

音楽は作りたいが、作りたい音楽は無い現象。
目的と手段がおかしいのかも。私みたいに「感動する音楽を作りたいから、音楽を作る」というのは変なのかもしれない。
「こんな音楽を作りたい（こんな気持ちを伝えたい）→音楽を作る」が正常感はある。でも、わざわざ音楽を使って伝えたいことはないし、音楽で感情を伝えたり、何かを訴えるということが普通だと知ったのが結構最近。伝えたいことが無くても、音楽は作っちゃだめか？　快楽主義はだめか？　でも、伝えたいことがある方が音楽の歌詞だけじゃなく全ての要素のベクトルが同じ方向に向いて一貫性が出るから、感動するんだろうなとは思う。でもなぁ。

とりあえずこんくらい。

次はググってみる。

以下、上と重複あり

音の見える化が難しく、耳で判断する必要があるから、難しい。
めっちゃわかる。既出ではあるけど、まじでそう。カレーの隠し味にリンゴとかはちみつを入れるのは定番だと思うけど、あれってカレーを食べるだけじゃ一生気づかないと思う。作るときにレシピを見て初めて判る。そんな感じで作曲にも隠し味がいっぱいある。そんで、一生気づかない。視えればわかるんだけどね。
複雑な曲を作ろうとするから難しい。
それはそう。悔しいけど最初はだいたいダサい曲になる。
モチベ問題
上にもあるけど、良い曲が出来ないとモチベ保てないよね。
モチベは
「努力の仮定→期待される成果→期待される結果→実現する努力」
で決まると言われている。
正に、作曲したての頃は努力の仮定→期待される成果が弱すぎる。あまりにも弱すぎる。超がんばっても良くて普通の曲。しかも、出来たと思ったら音圧が足りないとか言われる。無理だろこれ。これを考えると、質よりは数をこなした方がいいなと思う。
というか、やっぱり成長曲線がJみたいな形してると思う。今んとこ私は一だけど。
環境面
DAW開いてピアノ1音追加するにも時間かかって面倒だよねという話。確かに。
1時間以上の空き時間がないとDAWって開こうと思えない。スマホとかノートPCでも作れるっちゃ作れるんだけど、アクティベーションとか、音源の管理を工夫しないと複数台で作るのは難しい。あと、普通にやりにくい、外でmidiキーボード弄れないし。
ジャンルを分けられない問題
これは正に私のことだけど、音楽のジャンルによって必要な物って全然違うのに、同じだと考えてしまう。必要な物っていうのは音源もそうだけど、知識とか、構成とかそういうところも。これも既出ではある。
専門用語が難しい
確かに、意外とDTMは専門用語が多い。集めたら薄い英単語帳ぐらいにはなりそう。

とりあえずこんなもん。

ChatGPTにも聞いてみよう。

とりあえず、いっぱい挙げてもらった。
以下原文ママ。

技術的な学習曲線：DTMソフトウェアは非常に複雑であり、そのすべての機能を理解し、それを音楽に応用することは容易ではありません。これには、音響学、音楽理論、MIDIの操作、デジタルオーディオの理解、そして特定のソフトウェアの使用方法に関する広範な知識が必要です。
サウンドデザイン：DTMを使用すると、無限のサウンドオプションが手元にありますが、これは一方で、あなたが完全に独自のサウンドをデザインする必要があるということも意味します。理想的な音を作り出すためには、シンセサイザーやエフェクトプラグインの操作に精通している必要があります。
演奏のリアル感：MIDIを使用して演奏をプログラミングする場合、その結果が人間が演奏したものと同じように感じさせるのは難しいことがあります。特に、ドラムやストリングス、ブラスセクションなどのリアルな演奏を再現するのは難しいです。
ミキシングとマスタリング：楽曲が作成されたら、ミキシングとマスタリングの過程が待っています。これらのスキルは独自の専門技術を必要とし、練習と経験を必要とします。適切なバランス、EQ、ダイナミクス処理、スペーシャルエフェクトの使用など、これらすべてが学ぶべき事項です。
創造性の枯渇：DTMを使用すると、テクノロジーに依存するあまり、創造的な思考が枯渇する可能性があります。また、無限の選択肢があるために、選択肢の麻痺（何を選ぶべきか決められない状態）に陥ることもあります。
音楽理論：音楽を作曲するためには、キー、スケール、和音進行、リズムなど、基本的な音楽理論の理解が必要です。これに精通していない場合、作曲が難しくなる可能性があります。
ハードウェア要件：DTMは高品質のオーディオを処理するために高性能なコンピュータを必要とします。また、高品質なオーディオインターフェース、モニタースピーカー、MIDIコントローラーなど、追加のハードウェアも必要となる場合があります。
ワークフローの問題：DTMソフトウェアは機能が多岐にわたるため、効率的なワークフローを見つけるのが難しいことがあります。ソフトウェアに慣れるまで、シンプルなタスクでも時間がかかる場合があります。
ソフトウェアの互換性：さまざまなソフトウェアやプラグイン間の互換性の問題が生じることがあります。これらの問題を解決するためには、技術的なトラブルシューティングが必要になることもあります。
著作権問題：サンプルやループを使用する場合、それらの著作権に関する問題を理解する必要があります。これを無視すると、法的な問題につながる可能性があります。
プラグインの選択：市場には無数のプラグインがあり、どれを選ぶべきかを決定するのは圧倒的に感じることがあります。また、それぞれのプラグインには独自のインターフェースと機能があり、これらを理解するには時間と経験が必要です。
タイムラインの管理：曲の各部分を適切に配置し、合わせるスキルも必要です。特に、複数のトラックとパートを同時に管理する場合、これは困難に感じることがあります。
更新とアップグレード：DTMソフトウェアやプラグインは頻繁に更新されます。新しい機能を学び、古いバージョンから新しいバージョンへの移行は、新たな学習曲線を必要とすることがあります。
コスト：高品質のDTMソフトウェアやプラグインは高価です。これには、ソフトウェア自体の費用だけでなく、必要なハードウェアやオーディオインターフェースの費用も含まれます。
健康問題：長時間の座り作業、画面と向き合う時間、聴覚への過度のストレスなど、DTM作業は身体的、精神的健康に影響を及ぼす可能性があります。

うーん。なるほどなぁ。なんかChatGPTって”音響学”っていう単語使いがちだよね。
創造性の枯渇は、ある程度自由に音楽を作れるようになった人が言ってるよね。私は創造性の枯渇以前の問題。

よし、とりあえずこの中からプログラミングで補助できそうなのを探す。

なんか、定型文作ってそこに描いていく。

考えた物

DTMer版Qiita

内容

Qiitaというエンジニア個人が知識や思ったことを記事にして共有するサイトがある。
それのDTMer版。

なぜ必要か、何を解消するのか

まず、第一にいけそうだと思うのが、DTMer版Qiitaを作るというもの。Qiitaっていうのは、エンジニア個人が知識を記事にして共有するサイト。

私が知らないだけかもしれないけど、個人がDTMの情報を記事にして共有するサイトって無いよね。作曲のTipsとか、思ったこと、気づいたこと、やってみたことを記事として挙げて共有するサイトってあってもいいと思う。そのサイトと記事の量・質があれば、ある程度挙げた困難は和らぐはず。

考えられる課題

記事を投稿してくれる数が必要→エンジニアって結構いるけど、DTMerってそんないるのか？

技術・管理むずそう→サイトを作るだけじゃなく、それを管理しなきゃいけない。個人でやれるのか疑問。

プログラムと音楽は違う→プログラムは芸術じゃないけど、音楽は芸術だよね。芸術の知識を共有するっていうのは、上手く言語化できないけど違うかもしれない。

正解・構成・テーマ等を作ってくれるツール

内容

1000円サイゼリアみたいに、作る音楽の正解や構成を自動で作って課題として出してくれるツール。自動といっても乱数回すだけ。

なぜ必要か、何を解消するのか

音楽は自由だが、あえて制限することで敷居を下げる。
正解をこちらで提示することで、目標を定めやすくする。
テーマを考える時間を無くし、作曲に集中できる。

作りたい音楽が無い人の助けになる。

考えられる課題

あんまり需要が無い
ChatGPTでよくないか？

テンプレを保存するツール

内容

音楽に関するいろんなのテンプレを保存する。
DTMにはmidi,シンセ,プラグイン,DAWのプロジェクトと言ったいろんなテンプレがある。プリセットともいう。これを体系的に保存するツール

なぜ必要か、何を解消するのか

個々にプリセットを保存する機能などはあるが、一元的に視覚化、保存できる機能は無い。

一元的なリソースから手軽にドラック&ドロップでテンプレを組み合わせていけたら作曲スピード上がりそう。
作曲ハードルが下がるので、環境面の解決になる。

課題

既にありそう。

互換性を考えるのが面倒そう。

今作っているAIによる音源管理ソフトを完成させる

内容

音源の管理って面倒だからAIに管理させよう！　
しかも、新しい視点で音源を視れるようになるね！

なぜ必要か、何を解消するか

音源って増えてくると管理が大変。その管理をAIがやってくれると楽になるよね。
あと、音源の見方を変えられるよね。

課題

既にある。
個人での機械学習になると学習リソースに関する問題が大きい。

とりあえず

とりあえず、こんなところかなぁ。

恐らく一番人の為になるのはDTMer版Qiitaなんだけど、個人で出来る気がしない。Web系の知識がないのと、サーバーに関する知識がないのが辛い。それを考えると、一回練習として「正解・構成・テーマ等を作ってくれるツール」をWebアプリで作るのがいいのかなと思う。

とりあえず、ちょっとWeb系に手を出してみようと思う。PythonでもDjangoやFlaskというWeb系のフレームワークがあるらしいので、それをいじってみる。

今日は（書き出しから終わりまで１週間かかっちゃった）こんなもんで。

おやすみなさい。