エンジョイSwiftUIプログラミングその４０(img2Mxml：その１arXiv論文公開)

2021.06.30

AWS上のWebアプリやGitHub上のGoogle Colab用Jupyter Notebookの「楽譜写真からMusicXMLを作成して音楽を奏でるアプリimg2Mxml」のアルゴリズムをarXivに論文発表しました。

MMdA法(Measure-based Multimodal Deep Learning-driven Assembly」は、ピアノ楽譜の「小節」をまず、ディープラーニングのモデルで抽出し、その小節を並べ替えてサイズ変更して、次に音楽記号要素（パーツ）を認識する複数のディープラーニングモデルで各小節について推論を実行し、その結果をある決まりに従って組み立てるというのが骨子です。

各小節を認識して単位として処理することで、ディープラーニングモデルのtrainingが非常に効率的にできるようになり、また、各小節ごとに五線譜を水平化し、その間隔を正確に位置決めできるという顕著な効果を奏することがわかりました。

また、複数の音楽記号要素モデルとその中で認識する少数の特徴タイプを、五線譜の位置と共に同定することで非常に多数の音楽記号が組み合わせの効果で表現できることがわかりました。また、これまで難しかった和音もある程度複雑なものも認識し、またvoice(声）もある程度自動で割り当てることにも成功しました。

簡単にその処理を示したフローチャートを示します。

詳しくは論文を参照くださいませ。

この「エンジョイSwiftUIプログラミング」ではSwiftのコードではないですが、将来的にはSwiftにPythonで書いたディープラーニングのモデルを組み込もうとおもっているので、img2MxmlアプリのPythonコードをGoogleColabで実行する部分の解説をしばらくしてみようかなと思います。

まずは、GitHubの公開ソースコードを見てみてください。

赤枠の「img2xml.ipynb」がGoogleColab用のJupyterNotebookですので、クリックください。

赤枠の「Open in Colab」のバナーをクリックするとGoogleColabのJupyterNotebookが開きます。

次回からはしばらくこのNotebookのコードを順に解説してみようかな？と思っています。

プログラミング

エンジョイSwiftUIプログラミングその３９(AI開発環境：VSCode, GoogleColab, AWSCloud9,SageMaker,ECR,EC2）

まいにちドイツ語のテーマ曲いくつかその１

エンジョイSwiftUIプログラミングその４０(img2Mxml：その１arXiv論文公開)

関連記事一覧

特許翻訳と専門性（社会人博士課程入学）

エンジョイSwiftUIプログラミングその１３(多言語化その４：言語を切り替えてWeb表示）

エンジョイSwiftUIプログラミングその３８(資格その２：AWS認定機械学習合格後vs.G検定）

エンジョイSwiftUIプログラミングその３０(SwiftUI Get Started２：Hello WorldをGitHubへ）

エンジョイSwiftUIプログラミングその３３(Big SurでのCocoapodsエラー対処方法）

エンジョイSwiftUIプログラミングその３６(iOS14でiCloudファイルをコピーする方法）

エンジョイSwiftUIプログラミングその２５(bFaaaPその２：ArduinoM5Stack）

エンジョイSwiftUIプログラミングその１２(多言語化その３：アプリ内言語環境切り替え)

電子ピアノ補助ペダルシステムbFaaaP Switch販売開始！

エンジョイSwiftUIプログラミングその２９(スマホde特許管理ver2(SwiftUI)発売）

コメント

カテゴリー

検索

エンジョイSwiftUIプログラミングその４０(img2Mxml：その１arXiv論文公開)

関連記事一覧

特許翻訳と専門性（社会人博士課程入学）

エンジョイSwiftUIプログラミングその１３(多言語化その４：言語を切り替えてWeb表示）

エンジョイSwiftUIプログラミングその３８(資格その２：AWS認定機械学習 合格後vs.G検定）

エンジョイSwiftUIプログラミングその３０(SwiftUI Get Started２：Hello WorldをGitHubへ）

エンジョイSwiftUIプログラミングその３３(Big SurでのCocoapodsエラー対処方法）

エンジョイSwiftUIプログラミングその３６(iOS14でiCloudファイルをコピーする方法）

エンジョイSwiftUIプログラミングその２５(bFaaaPその２：ArduinoM5Stack）

エンジョイSwiftUIプログラミングその１２(多言語化その３：アプリ内言語環境切り替え)

電子ピアノ補助ペダルシステムbFaaaP Switch販売開始！

エンジョイSwiftUIプログラミングその２９(スマホde特許管理ver2(SwiftUI)発売）

コメント

カテゴリー

検索

エンジョイSwiftUIプログラミングその３８(資格その２：AWS認定機械学習合格後vs.G検定）