フォロー

考えてたんですが、マイクから拾った音声notesをそのまま(自由に)描画するのをやめて、楽譜notesを100ms〜200msくらいで切り分けて、その間で正しい音程が一度でも入れば、その楽譜notesをcorrectな音声notesにするみたいな仕組みにしたくなってきた。つまり楽譜notesをベースに音声を処理する。

採点は甘くなるが、今のpitch detectionも誤検知が多いし、うまくやれば「より精度が良くなった」ように感じられる可能性もある。

今考えているアルゴリズムは次の通り:
1. 現在時刻tを求める。
2. tに対応する楽譜noteを見つける(今のlb)
3. 音声のpitchた正しければ、lbの区間を正しいとする。

これをやるためには、楽譜noteが適当な(100ms〜200msくらいの)間隔で細切れになってる必要がある。

ログインして会話に参加
わくわく鮟鱇ランド

わくわく鮟鱇ランドは、住民が皆わくわくしているマストドンです。登録は艮鮟鱇の身内に制限されています。