最近、dbscanというクラスタリング手法が使われてるのを発表で見かけた
気になったので調べてみたメモ
参考記事
dbscanについてメモ
dbscanのパラメーターは
- eps
- min_samples
これらのハイパーパラメーターをチューニングするときは、かなりの試行錯誤が必要です。様々なパラメーターの組み合わせを試すといったグリッドサーチなどの手法が一般的です。
ただし、DBSCANは不均一な密度のデータにはうまく対応できないので、それを考慮に入れる必要があります。言い換えれば、すべてのクラスタが同じ程度の密度を持っていない場合、εとmin_samplesの一つの値が全体で最適とは限らないということです。
余談
上の記事は「「ChatGPTとPythonで学ぶ」シリーズ Advent Calendar 2023」というカテゴリに入ってた
他の記事は以下から見れる模様
自分の研究テーマに使える手法があるかも・・・?
一度目は通してみるか・・・
ランキング参加中です
↓クリックしていただけると嬉しいです〜