いちリサーチャーの日記

勉強の記録や自分の生活の観察、考えたことなど

データ分析のためのSQLを継続しやすい方法で勉強する

12月末をいったんの区切りとしてSQLの勉強に励んでいます。

試行錯誤の結果、勉強方法についてはある程度これで行こうというものができて回っているので、自分の整理と、誰かの役に立ったり似たようなことをしている方と繋がれたりすればいいなという目的で記載します。

(もし現職の方にご指摘等頂けるならとてもうれしいです)


1.progateを利用した学習

980円(税別)/月と安価だし、コードを入力しながら勉強できてわかりやすい。

全5レッスンを2周して、SQLがどんなものかや初歩的なコードを知ることができた。自分は仕事の合間にやったけれど、集中すれば1,2日で終わると思う。

レッスンの目次は以下の通り。

  • SQL学習I  SQLの基礎的な使い方  修了時間 2h 
  • SQL学習Ⅱ 集計関数・グループ化の使い方  修了時間 1h 
  • SQL学習Ⅲ  複数テーブルを利用したデータ取得。サブクエリ、JOIN 修了時間 2h 
  • SQL道場Ⅰ SQL学習コースⅠ~Ⅲの知識を用いた実践的な演習問題  修了時間 2h
  • SQL学習Ⅳ データの追加・削除・更新  修了時間 1h 


2.「10年戦えるデータ分析入門: SQLを武器にデータ活用時代を生き抜く」の通読

データ分析に特化したSQLの入門書。progateでやりはしたが、コードの塊としてパラパラしていたものが自分の中で整理できてよかった。

 

3.「10年戦えるデータ分析入門: SQLを武器にデータ活用時代を生き抜く」のコードを実際に動かす

これは頓挫している。手許にあるPCが古いものでスペックが足りずPCの購入から検討する必要があったり、PCを購入したはいいが自宅でないとできなかったりしたため、なかなかうまく行かなかった。ブラウザで動くサービスでというのも検討したが、付録のデータが使えなかったり、丁度いいテストデータの調達に苦労したりと良くなかったため、一旦別の方法を考えることにした。年末のまとまった時間が取れたときに改めて取り組みたい。


4.ブラウザで動くサービスを探す

仕事の隙間時間や移動中などいつでもどこでも使えるものが良いと思い、ブラウザで動くサービスを探した。いろいろなWEBページなどを見てSQLZOOやkaggleなど検討したが、最終的にこのノートを参考にDataCampを利用することにした。どれくらいの学習をどれくらいの期間かけてすると、どの程度のレベルに至れるのかということがわかりやすく、参考になった。*1


5.DataCampを利用した学習

現在進行中。ひとまず基礎コースと思しき、「Intro to SQL for Data Science」、「Joining Data in SQL」は一巡し、アプリのエクササイズで復習したりしながら、他のコースを進めている。

目次は書こうかと思ったけど、それなりに多いのでサイトを見てください。

www.datacamp.com
価格はすべてのコースが使えるプランで月約3,600円とProgateと比較すると安くない金額。ただ、Python、Rも含めてコースは充実しているし、「本で学んだことの全てがここにあった」と感想を書いていた人もいて、下手に変な講座にお金を払うよりは良いのではと思い、受講することにした。


DataCampの気に入っている点

  • いつでもどこでもできる

どんなに良い教材でも、やらなければ効果はゼロなので、やることのハードルが低いのはありがたい

  • 実例に近そうなコースがある

Data-Driven Decision Making in SQLとか
Improving Query Performance in SQL Serverとか

  • スマホアプリでエクササイズができる

空き時間にデスクトップで通常コース、通勤時間にスマホでエクササイズという使い分けをしている。エクササイズはコードの穴埋めやコードの意味の4択が中心で、復習をするのによい

  • 英語

これは良いところも悪いところもあるけれど。現在英語の勉強を中断しているので、英語に触れる機会になったり、今後調べ物をした際に英語のサイトが選択肢に入るという点では良いと思う。他に失笑されそうなメリットとしては、SQLの本を読んだ時に、日本語だというだけで難易度が下がったような気がするので、本を読むハードルが下がる。

 

空き時間はDataCampでコードを書いて日本語の本で近いところを再読したりして、まとまった時間が取れるときに3に改めて取り組んだりするのが良さそう。今のところ基礎コース以降の内容も本で読んでいたものとそれなりに同期している。包括されなくなって来たなと感じたら、「ビッグデータ分析・活用のためのSQLレシピ」あたりも副読本として検討するかもしれない。

自分でデータセットを用意しなくてよくて、コースが整って、問題と答えが用意されているというのはかなりありがたい。フリーハンドで自分で問い建てや設計ができるようになるかという不安はあるのだけれど、その心配はある程度のことが身についた後にしようと思う。

ということで引き続きがんばります。

takatsuka.hatenablog.com

*1:地頭やバックグラウンドに雲泥の差が...という意見もあると思うけれど、そういう考えは自分の可能性を狭めるようで、あまりたのしくないから私は一旦忘れてみようと思う