私が取り組んできたデータベースに関する勉強方法について紹介します。
基本編では、リアルワールドデータの解析を行うにあたり、誰もが把握しておいた方が良い内容について述べます。
データベースについて知っておいた方が良いのは、下記の2項目です。
- データベースの基本【データベースとは何か?】
- SQL
データベースを専門とする人を除いては、上記の2項目について把握するだけで十分です。
データベースの基本を学ぶ
下記の本は、私がデータベースやSLQのことをほとんど知らない状態で手に取りましたが、非常に有用でした。
一見するとデータ分析の読み物のように見えますが、実際にはSQLについて書かれています。
かなり技術的な世間話も含まれており、ソフトなタッチで書かれているため、読みやすいと思います。
特に、医学、疫学、公衆衛生系のバックグラウンドでSQLに苦手意識がある方におすすめします。
SQLを学ぶ理由
統計解析ソフトやプログラミング言語があればSQLは必要ないと考える人も多いのではないでしょうか。
ほとんどの方にとって、統計ソフトや他のプログラミング言語(Python等)の方がデータ整形は圧倒的にやりやすいと思います。
しかし、特にメインメモリに乗り切らないほど大きなデータを扱う場合には、SQLがほぼ必須になります。
SQLはデータ抽出に用いている人が多いですが、データ整形にも有用です。
SQL初心者の方には、あまりおすすめの書籍を知りません。
多くの書籍でかなり単調に説明されていることが多いため、挫折してしまう可能性が高いです。
その中でも、下記のサイトがおすすめです。
https://www.sql-reference.com/SQL文法に関して余計なことは省いて非常にシンプルに説明されています。
このサイトで少しずつSQLに馴染んでいくことが良いでしょう。
「逆引き」という名称ですが、順番にそのまま読んでいってください。
慣れてくれば、中級者を対象にした書籍は良いものも多いですので、それらに取り組むと良いです。
データベースとSQLを学ぶ理由についてまとめると、「ビッグデータを扱うため」です。
リアルワールドデータを扱う研究者の方で、小規模なデータしか扱わない場合には必要ないと思います。
一方で、ビッグデータを扱う研究者やエンジニアの方は、是非学んでおいてください。
コメント