画像と音声分析(6論文)

Recorded asynchronies, structural dialogues: Brahms's Adagio Affettuoso, Op. 99ii, in the hands of Casals and Horszowski

Llorens, A. (2017). Music Performance Research, 8.

この論文では、CasalsとHorszowskiの1935年のBrahmsのAdagio Affettuoso,99iiの演奏における明白な非同期の背後に意図された音楽的動機を見つけることを試みます。 Viscovery SOMineでの16分音符のタイミングに関するクラスタリング・バーは、非常に明確で反復的な非同期パターンが存在することを示しました。これは、純粋な確率やローカルな表現デバイスの結果ではない可能性が高いですが、ミュージシャン間の進行中の構造的対話 の決定的要素だと考えられます。.

Go to original article

The form of performance: analyzing pattern distribution in select recordings of Chopin's Mazurka Op. 24 No. 2

Spiro, N., Gold, N., & Rink, J. (2010). Musicae Scientiae, 14(2), 23-55.

この研究では、定期的なタイミングと動的なパターンを見つけるために、ショパンのMazurka Op.14 No.2はが分析されました。1人のミュージシャンと異なるミュージシャンの異なる演奏間の差異や類似点をよりよく理解するために、この曲の4小節をクラスタするためにViscovery SOMineが使用されます。

Go to original article

Recognition of Western style musical genres using machine learning techniques

Mostafa, M. M., & Billor, N. (2009). Expert Systems with Applications, 36(8), 11378-11389.

周波数特性および振幅特性に関して異なる音楽ジャンルを分類するために、複数の異なる機械学習技術が使用されます。 分類モデルに加えて、ジャンルの違いを視覚的に調べるためにViscovery SOMineが使用されます。

Go to original article

Application methods for self-organizing map in process imaging for dynamic behavior of aerated agitation vessel

Matsumoto, H., Masumoto, R., & Kuroda, C. (2007). In Proceedings of the 10th International Conference on Engineering Applications of Neural Networks (pp. 210-220).

通気された撹拌容器の動的挙動のためのイメージングを処理するようにViscovery SOMineが適応され、様々な適用方法が検討されまます。 この応用では、CCDビデオカメラによる直接撮像とPIV技術が採用されています。 生成されたマップおよびクラスタは、バブルの空間的分散の程度および設計パラメータの決定に関する有用な情報をプロセス・エンジニアに与えることができます。

Download original article

Using self-organizing maps for object classification in Epo image analysis

Heiss-Czedik, D., & Bajla, I. (2005). Measurement Review, 5, 11-16.

ドーピングに使用されるホルモンであるエリスロポエチン(rEpo)の組換え型は、Epo化学発光によって検出することができます。 Epoテストのためのソフトウェアを開発するために、世界アンチ・ドーピング機関が資金を提供する研究プロジェクトが設立されました。 この目的のために、訓練集合からの506の記録が、主に可視化能力のために選択されたViscovery SOMineを使用して自己組織化マップによって順序づけされます。 さらに、Viscovery SOMineのクラス分類が、他の分類方法と比較して、この問題に対してかなり良好に機能しました。

Download original article

Neural networks for text-to-speech phoneme recognition

Embrechts, M. J., & Arciniegas, F. (2000). In Systems, Man, and Cybernetics, 2000 IEEE. International Conference on Systems, Man, and Cybernetics (Vol. 5, pp. 3582-3587). IEEE.

2種類の異なる人工ニューラルネットワーク(ANN)アプローチが、テキスト音声変換アプリケーションの音素認識に使用されています。段階化バックプロパゲーション・ニューラルネットワークと自己組織化マップです。 現在のいくつかの商業的アプローチは、テキストから音素への変換のための網羅的な辞書手法に依存しています。 テキスト - 音声変換のための音素マッピングにニューラルネットワークを適用することにより、高速分散認識エンジンが作成できます。 このエンジンは、データベース内の欠落単語のマッピングをサポートするだけでなく、同じ単語の異なる発音に関連する矛盾を軽減することもできます。 この研究で提示されたANNは、アメリカ英語で最も一般的な2,000語に基づいて訓練されました。 これらのニューラルネットワークの堅牢性をテストするために、英語の最も一般的な5,000語、7,000語、10,000語の単語の性能メトリクスも計算されています。

Go to original article