SQL

Structured Query Language

SQLとは

SQL(Structured Query Language:構造化問合せ言語)とは、リレーショナルデータベース(RDB)でデータの定義、操作、制御を行うための標準的な言語です。1970年代にIBMで開発され、国際標準化されたデータベース言語として、データサイエンスの基盤技術となっています。

SQLの基本操作

SQLの基本操作はCRUDと呼ばれ、SELECT(データの検索・取得)、INSERT(データの挿入)、UPDATE(データの更新)、DELETE(データの削除)で構成されます。データ分析では特にSELECT文が重要で、WHERE句による条件指定、JOIN句による結合、GROUP BY句による集約、ORDER BY句によるソートなどを組み合わせます。

SQLの種類

SQLは、データ定義言語(DDL:CREATE、ALTER、DROP)、データ操作言語(DML:SELECT、INSERT、UPDATE、DELETE)、データ制御言語(DCL:GRANT、REVOKE)に分類されます。さらに、ウィンドウ関数、CTE(共通テーブル式)、サブクエリなどの高度な機能も提供しています。

データサイエンスにおけるSQL

SQLはデータサイエンティストにとって最も基本的なスキルの一つです。BigQuery、Snowflake、RedshiftなどのクラウドDWHでもSQLが標準的なクエリ言語として使用されており、PandasやSparkなどのデータ処理ツールもSQL的なインターフェースを提供しています。