Python学習チャンネル by PyQ

Pythonのオンライン学習プラットフォームPyQのオフィシャルブログです

【冬休みでできるPython学習】PyQでのデータ分析学習計画を紹介します

こんにちは。 PyQマーケティングチームです。

もうすぐ冬休みや年末年始の休暇時期になりますね。
このお休みを利用してPython学習をしてみませんか?

今回は「pandasを使ったデータ処理の基本を学びたい人」と「pandasを使ったより実践的なプログラミングの腕試しがしたい人」を対象としたデータ分析関連の学習計画を2つご紹介します。

※冬休み = 1週間と設定しています。各パート毎の想定時間も書いたので、適宜自分の取り組める期間に応じて組み直してもよいでしょう。

PyQとは

PyQは、Python独学プラットフォームです。
ブラウザだけで始められ、基礎文法から実務的な内容まで、1500問以上の問題で自学できます。

pyq.jp

pandasデータ処理・可視化集中プラン

プランの概要

pandasを使ったデータ処理を学べる「データ分析」コースがおすすめです。
今回はJupyter Notebookの使い方を学んだ後データ処理初級ランクを7日間で学べるようピックアップしたプランを紹介します。

このプランの対象は、データ処理でよく使われるpandasに入門したい方、pandasの基本を改めて体系だって学び直したい方です。

pyq.jp

※プログラミング自体が初めての方は、先に「Pythonプログラミングをはじめようコース」から始めることをおすすめします。

学習に必要な時間

全体の学習目安時間

  • 19時間〜

7日で学習した場合の1日あたりの学習目安時間

  • 2〜3時間

7日で学習した場合のスケジュール例

1日目:約3時間

Jupyter Notebookの基本的な操作方法を学び、pandasに入門する。
- Jupyter Notebookの使い方 (40分)
- pandas体験 (110分)

2日目:約2.5時間

pandasの主要なデータ構造であるDataFrameの構成要素と次元のデータ構造であるSeriesやIndexについて学ぶ。
- pandasのデータ構造(DataFrame) (105分)
- Seriesとインデックスと欠損値【前半】 (50分)

3日目:約3時間

CSVファイルの入出力を中心に、pandasの基本的な入出力機能の使い方と、DataFrameの列に対する簡単な演算方法を学ぶ。
- Seriesとインデックスと欠損値【後半】 (50分)
- データ入出力 (65分)
- DataFrameの列の演算と追加 (75分)

4日目:約3時間

業務でよく使う統計量の確認やデータの集約方法、ソートの方法と指定した条件でデータを絞り込む方法を学ぶ。
- データの確認・集約 (95分)
- データの絞り込み (95分)

5日目:約2.5時間

さまざまな前処理を行ってデータを分析しやすい形式に加工する方法とデータをグループ化する方法について学ぶ。
- データ加工 (90分)
- データのグループ化【前半】 (65分)

6日目:約2時間

データの可視化方法を学ぶ。
- データのグループ化【後半】 (75分)
- pandasのデータ可視化 (40分)

7日目:約3時間

ここまで学んだpandasの各機能がどのような場面で役に立つかイメージを掴む。
- 総合演習(Pythonデータ処理初級) (180分)

pandasデータ処理演習プラン

プランの概要

pandasを使ったより実践的なプログラミングの腕試しをしたい人は「pandasデータ処理ドリル」ランクにチャレンジしてみてください。pandasを使ったプログラミングの演習問題です。

pandasの機能について自分で調べながら解いてみましょう。pandasには豊富な機能が用意されていますが、実務で使いこなすためには 自分の頭で考え、手を動かして試行錯誤すること が重要です。

学習に必要な時間

全体の目安時間

  • 5時間〜

7日で学習した場合の1日あたりの学習目安時間

  • 0.5〜1時間

7日で学習した場合のスケジュール例

1日目:約0.5時間

ファイルからデータの読み込みや保存をしたり、統計量の計算やデータのソートなど、データの概要を把握する方法に関する問題です。
- データを入出力しよう (15分)
- データの概要を確認しよう(15分)

2日目:約1時間

色々な条件や形式でデータを絞り込んで参照・取得する問題や、 2つの表を縦や横に連結したり、列行を分割させるなどデータを変形させる問題です。
- データを部分的に参照しよう (25分)
- データを変形しよう (35分)

3日目:約0.5時間

欠損値の置換・補完や重複の排除など、データの加工や演算に関する問題です。
- データを加工・演算しよう(35分)

4日目:約0.5時間

データをグルーピングして、いろいろな集計をする問題です。
- データをグループ化しよう (25分)

5日目:約0.5時間

正規表現を使った文字列の検索・置換やダミー変数化など、pandasの文字列処理に関する演習問題です。
- 文字列を操作しよう (35分)

6日目:約1時間

タイムゾーンの扱いやサンプリングなど、pandasの日付時刻型データの扱いに関する演習問題です。
- 日付時刻型のデータを操作しよう (70分)

7日目:約1時間

セルの背景色や書式をセルの値に応じて変更するなど、pandasのDataFrameの表示スタイルに関する演習問題です。
- テーブル表示を見やすくしよう (70分)

まとめ

「pandasを使ったデータ処理の基本を学びたい人」と「pandasを使ったより実践的なプログラミングの腕試しがしたい人」を対象としたデータ分析関連の学習計画を2つご紹介しました。
年末年始の休みを利用して、この冬はデータ処理にチャレンジしてみてはいかがでしょうか?

Copyright ©2017- BeProud Inc. All rights reserved.