Open zerebom opened 4 years ago
PostgreSQL オープンソース。歴史が古い。標準SQLへの準拠率が高い。 軽量のデータ分析をローカルでするのに向いている。
Apache Hive HDFSと呼ばれる分散ファイルシステム上のデータをSQLライクなインターフェイスで処理するシステム。Hadoopエコシステムの一部 ユーザー定義の関数など使用でき、自由度が高いが、レイテンシは高い。
Amazon Redshift Hiveと同様に分散RDN 列指向。商用利用前提で、有料。
BigQuery 列指向。読み込んだデータ量で課金されるので予想外の出費になることもある。 基本的には高速で安価。
SparkSQL 無料で使用できる、分散処理フレームワーク 高機能だが難しい。
サービス・システムを運用する目的で構築されたデータベースに存在数rデータ 殆どが更新型のデータ
特徴として
追記型データ
分析もコーディングもできる人材になれるように、両方の側面からSQLの書き方を指南してくれる本。
https://book.mynavi.jp/supportsite/detail/9784839961268.html