これはもう音楽版Vibe Coding

いや「Vibe」は音楽用語なんだけど音楽に帰ってきたw

ボクは純然たる音楽家じゃないんでホントのところ分からないですけど、音楽やってる人はこういう話をAIとしながら作曲してみたくない?w

Geminiのメロディに合わせた歌詞生成で色々こねくり回して到達した書式、補足情報まで付くようになった

ローマ字を採用することによって日本語の母音と子音を分離し、別々の音階や小節をまたいで発声させられるようになった

この書式へ到達したことにより歌いやすくなったのはもちろん、例えばボカロなどへの入力が容易になった

終わってるだろw

どうしてヨシ!って言ったんですかー!

ここまで出せるようになったんだけど、音符と歌詞のリズムが合わねぇ・・・

どうやって指示を出したら良いんだ・・・

1音符に複数文字入ること可能性があるのは理解するが、歌詞ブロックの数と音符の数が合ってないんだよ・・・

取り急ぎ、テキストベースAIでの作曲サポート検討の進捗

ふと今朝に新たな発想が降りてきてこうなった

音符の長さはCが16分音符、C--が8分音符、C----が4分音符、C--------が2分音符、C----------------が全分音符

メロディラインを考慮した参考歌詞まで載るようになりました

えぇ・・・MIDI出力ぅ!!マジで!?
  ↓
そういうことかーい!

DockerとGeminiCLIでコンパイル&ビルドはほぼ全自動よ

失敗しても勝手に修正してくれる

いやもうホント、こういう時代かぁって感じ

これでディスプレイサイズへ合わせて表示・非表示を設定できるんだけど、もしかして各ディスプレイに合わせて各々の設定をしなきゃダメなんだろうか?

「dpiが横いくつ以上ならどうのこうの」とプログラマブルな設定はできない???

もしWYSIWYGで出来ないならばDart(Fluutter記述言語)で書いたほうがマジで早いんだが

ノーコードツール使ってるデザイナーさんはマジでこんな面倒くさいことを1つ1つやってるのか???

mstdn.guru/@keizou/11519761310

大きなディスプレイになると画面の利用効率が落ちるから、大きなディスプレイではグリッド状に並べるみたいなアプローチを目指したいけど、どうやるのかまったくわからん

いや本当にマジでUI設計でつまづいていて開発が全く進まないw

何度も心折れかけて「WYSIWYGなツール使わねぇほうが絶対に早い!」とFluutterを手打ちしそうになってるw

もっと洒落たようにデザイン詰めていくけどソーシャルブックマークサービスのUIイメージはこんな感じ

公開でコメントするとMastodonへも投稿される仕様なんやで

取り敢えず仮のデータ与えてFlutterのデバッグがちゃんと動くかテストする

ここからオシャレで使いやすいUIを考えていきたいが、本当にUIデザインというのは技術者にとって辛い要素しか無い・・・w

学校タブレットでChromeOSを使っているそこのキミ!

ChromeOSはiPadOSよりも何も出来ないと思ってないか?

逆だよ逆!iPadOSはココまで出来ないんだぞっ!

とりあえず、AIは心が折れかける事があることはわかったw

おおう?スゴイぞ

仕様書を極力明快にしようと努めたのもあるけど迷いがないな

とりあえず「どんなもんよ?」と思ってJulesへフワッとしたことお願いしてみたけど、どうなるんだろうか・・・?

偉いので環境構築だけして遊ばずにちゃんと開発してますw

休暇中にAiコーディングやってたと言いましたが、そのとき完全にボク個人の趣味でやってるんで会社の若い子たちに迷惑かけ無いし「VSCodeとか使わなくても良いや」と思って色んなターミナルも一緒に試してたんですが「Wave Terminal」が結構良い感じでした

tmuxとかタイル型ウィンドウマネージャっぽいのでキーボードのみで操作しやすく、NeoVimとかtmuxで分割するとGeminiの表示領域が小さくなっちゃうことありますが、Waveだと別ターミナル上にGemini開いてフローティングさせ表示領域デカくできて視認性良いです

あと、眩しいのでボクは設定してないけどmacOSっぽく出来るテーマがデフォルトで付いてる

waveterm.dev/

どうこれ?

Gemini CLIと仕様を考えつつ、フローを視覚化する開発モデル

古いものから表示

Keᷟiͣzᷤoͭuͦ@6ͩ4ͦ0ᷠ0 によるおすすめ:

グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。