データ型は、統計の重要な概念であり、統計的測定値をデータに正しく適用し、したがってそれに関する特定の仮定を正し このブログ記事では、機械学習プロジェクトの中で最も過小評価されている部分の一つである適切な探索的データ分析(EDA)を行うために、知っておく,
Table of Contents:
- Introduction to Data Types
- Categorical Data (Nominal, Ordinal)
- Numerical Data (Discrete, Continuous, Interval, Ratio)
- Why Data Types are important?,
- 統計的手法
- 概要
測定スケールとも呼ばれるさまざまなデータタイプをよく理解することは、特定のデータタイプに対してのみ特定の統計的測定を使用できるため、探索的データ分析(EDA)を行うための重要な前提条件です。
また、適切な可視化方法を選択するには、どのデータ型を扱っているかを知る必要があります。 データ型は、さまざまな型の変数を分類する方法と考えてください。 変数の主なタイプについて説明し、それぞれの例を見ていきます。, 我々は時々測定スケールとしてそれらを参照します。
カテゴリデータ
カテゴリデータは特性を表します。 したがって、人の性別、言語などのようなものを表すことができます。 カテゴリデータは、数値を取ることもできます(例:女性の場合は1、男性の場合は0)。 これらの数字には数学的な意味がありません。
ノミナルデータ
ノミナル値は離散単位を表し、定量的な値を持たない変数にラベルを付けるために使用されます。 それらを”ラベル”と考えてください。 順序のないノミナルデータに注意してください。, したがって、値の順序を変更しても意味は変わりません。 P>