Statistics and Machine Learning Toolbox™ には、データを記述、解析およびモデル化する関数やアプリが備わっています。記述統計および探索的データ解析のためのプロットを使用したり、データを確率分布で近似したり、モンテカルロ シミュレーションのために乱数を生成できるほか、仮説検定を行うことも可能です。回帰および分類アルゴリズムにより、データから推定を行い、予測モデルを作成できます。
また、多次元データの解析については、Statistics and Machine Learning Toolbox では特徴選択、ステップワイズ回帰、主成分分析 (PCA)、正則化およびその他の次元削減方法が提供されており、モデルに影響を与える変数または特徴の特定が可能です。
このツールボックスは、SVM (サポート ベクター マシン)、ブースティングされた決定木とバギングされた決定木、k 最近傍、 k 平均、k –medoid 法、階層クラスタリング、混合ガウスモデルおよび隠れマルコフ モデルを含む教師ありおよび教師なしの機械学習アルゴリズムを提供します。多くの統計および機械学習アルゴリズムは、メモリに収まりきらない大きなデータ セットの計算に使用できます。