Open arxiv-quration-bot[bot] opened 4 months ago
本稿では、機械学習データセットにおけるクラスの不均衡という一般的な問題を解決するために、量子コンピューティング技術を用いた新しいソリューションであるQuantum-SMOTE法を提案する。Quantum-SMOTEは、Synthetic Minority Oversampling Technique (SMOTE)にインスパイアされ、スワップテストや量子回転などの量子プロセスを用いて合成データ点を生成する。このプロセスは従来のSMOTEアルゴリズムのK-Nearest Neighbors (KNN)とユークリッド距離の使用とは異なり、近傍関係に依存することなく少数クラスのデータポイントから合成インスタンスを生成することを可能にする。このアルゴリズムは、回転角度、少数パーセンテージ、分割係数などのハイパーパラメータを導入することで、合成データ生成プロセスの制御性を高め、特定のデータセット要件に合わせたカスタマイズを可能にしている。このアプローチは、TelecomChurnの公開データセットでテストされ、2つの著名な分類アルゴリズムであるランダムフォレストとロジスティック回帰と共に評価され、合成データの割合を変化させた場合の影響を決定する。
http://arxiv.org/abs/2402.17398v2 (ar5iv, pdf)
Nishikanta Mohanty, Bikash K. Behera, Christopher Ferrie, Pravat Dash
2024/02/27
Summary (DeepL訳)
本稿では、機械学習データセットにおけるクラスの不均衡という一般的な問題を解決するために、量子コンピューティング技術を用いた新しいソリューションであるQuantum-SMOTE法を提案する。Quantum-SMOTEは、Synthetic Minority Oversampling Technique (SMOTE)にインスパイアされ、スワップテストや量子回転などの量子プロセスを用いて合成データ点を生成する。このプロセスは従来のSMOTEアルゴリズムのK-Nearest Neighbors (KNN)とユークリッド距離の使用とは異なり、近傍関係に依存することなく少数クラスのデータポイントから合成インスタンスを生成することを可能にする。このアルゴリズムは、回転角度、少数パーセンテージ、分割係数などのハイパーパラメータを導入することで、合成データ生成プロセスの制御性を高め、特定のデータセット要件に合わせたカスタマイズを可能にしている。このアプローチは、TelecomChurnの公開データセットでテストされ、2つの著名な分類アルゴリズムであるランダムフォレストとロジスティック回帰と共に評価され、合成データの割合を変化させた場合の影響を決定する。
Links
http://arxiv.org/abs/2402.17398v2 (ar5iv, pdf)
Authors
Nishikanta Mohanty, Bikash K. Behera, Christopher Ferrie, Pravat Dash
Published
2024/02/27