データサイエンス・前処理

特徴量エンジニアリング、正規化、データ拡張など、データ処理の基礎を解説

01データサイエンスData Science 02データ前処理Data Preprocessing 03データクレンジングData Cleansing 04ETLExtract, Transform, Load 05ELTExtract, Load, Transform 06データパイプラインData Pipeline 07探索的データ分析(EDA)Exploratory Data Analysis 08記述統計Descriptive Statistics 09推測統計Inferential Statistics 10仮説検定Hypothesis Testing 11p値p-value 12信頼区間Confidence Interval 13相関分析Correlation Analysis 14回帰分析(統計)Regression Analysis 15分散分析(ANOVA)Analysis of Variance 16カイ二乗検定Chi-squared Test 17ベイズ統計Bayesian Statistics 18確率分布Probability Distribution 19正規分布Normal Distribution 20ポアソン分布Poisson Distribution 21サンプリングSampling 22層化サンプリングStratified Sampling 23ブートストラップ法Bootstrap Method 24A/BテストA/B Testing 25因果推論Causal Inference 26傾向スコアPropensity Score 27時系列分析Time Series Analysis 28ARIMAAutoregressive Integrated Moving Average 29季節調整Seasonal Adjustment 30異常検知(統計)Anomaly Detection 31データウェアハウスData Warehouse 32データレイクData Lake 33データマートData Mart 34ビッグデータBig Data 35MapReduceMapReduce 36Apache SparkApache Spark 37Apache HadoopApache Hadoop 38SQLStructured Query Language 39NoSQLNoSQL (Not Only SQL) 40PandasPandas 41NumPyNumPy 42データ可視化Data Visualization 43MatplotlibMatplotlib 44散布図Scatter Plot 45ヒートマップHeatmap 46箱ひげ図Box Plot 47ヒストグラムHistogram 48ROC分析ROC Analysis 49生存分析Survival Analysis 50コホート分析Cohort Analysis 51ファネル分析Funnel Analysis