Python学習チャンネル by PyQ

Pythonのオンライン学習プラットフォームPyQのオフィシャルブログです

新ランク「pandasデータ処理ドリル」 リリースのお知らせ

こんにちは。 PyQサポートです。
PyQの新規コンテンツとして、新たに ランク「pandasデータ処理ドリル」 をリリースしました!
本記事では、本ランクの内容について紹介いたします。

新ランク「pandasデータ処理ドリル」

今回リリースしたのは以下のランクです。

Pythonを取り巻くデータサイエンスの実務の中で、 pandas は欠かすことのできないライブラリーです。
pandasには豊富な機能が用意されていますが、実務で使いこなすためには 自分の頭で考え、手を動かして試行錯誤すること が重要です。

そのため、新ランク「pandasデータ処理ドリル」では、 pandasを使ったプログラミングの腕試し ができるように、 9つのトピックについて全部で51個の演習問題 を用意しました。

No パート 説明
1 データを入出力しよう ファイルからデータを読み込んだり保存したりする問題です。
2 データの概要を確認しよう 統計量の計算やデータのソートなど、データの概要を把握する方法に関する問題です。
3 データを部分的に参照しよう いろいろな条件でデータを絞り込んで参照したり、いろいろな形式で取得したりする問題です。
4 データを変形しよう 2つの表を縦や横に連結したり、ロング形式とワイド形式間で変換したり、1列を複数列や複数行に分割したりする問題です。
5 データを加工・演算しよう 欠損値の置換・補完や重複の排除など、データの加工や演算に関する問題です。
6 データをグループ化しよう データをグルーピングして、いろいろな集計をする問題です。
7 文字列を操作しよう 正規表現を使った文字列の検索・置換やダミー変数化など、pandasの文字列処理に関する演習問題です。
8 日付時刻型のデータを操作しよう タイムゾーンの扱いやサンプリングなど、pandasの日付時刻型データの扱いに関する演習問題です。
9 テーブル表示を見やすくしよう セルの背景色や書式をセルの値に応じて変更するなど、pandasのDataFrameの表示スタイルに関する演習問題です。

pandasの機能は多岐にわたるため、実務では pandasの公式ドキュメント などで使い方を調べる技術も必要です。
そのため今回の演習問題では、あえて 他のランクでは学んでいない機能や応用的な使い方 についても出題しています。
特に、最後のパート「テーブル表示を見やすくしよう 」では、今までPyQで扱っていなかったDataFrameのスタイルを変える機能について扱っています。

Pythonとpandasの基本は学習済みで、次のレベルにランクアップしたい という方は、ぜひチャレンジしてみてください!

新ランクのポイント

今回のリリースしたコンテンツは、効果的な学習ができるよう以下の点に留意して構成しました。

  • 各問題のタイトルは「列ごとに昇順/降順を変えて確認するには」「タイムゾーンを変換するには」などのように、 「やりたいこと」が明確なタイトル にしています。もしpandasの処理でどのようにコードを書けばよいかわからない時は、本ランクを 逆引き辞典 のように使うとヒントがあるかもしれません。
  • 各問題は独立しているため、どこから学習を始めても構いません。 各問題のタイトルを見て、興味があるところから解いてみてください。
  • 各問題の冒頭には 「演習のねらい」 を設け、 実務のどのような場面で役に立つのか わかりやすくなるように構成しました。
  • 各問題にはメインとなる模範解答以外にも 「別解」を用意し、なるべくいろいろな考え方に触れられるように構成 しました。

画像: 新ランク「pandasデータ処理ドリル」の問題例 (パート「テーブル表示を見やすくしよう」より)

まとめ

今回は、新しくリリースしたコンテンツについて紹介いたしました。
新ランク「pandasデータ処理ドリル」では、pandasを使ったプログラミングの応用力や調べる技術が問われます。
この機会に、ぜひ挑戦してみてください!

新ランクの感想もお待ちしています。

Copyright ©2017- BeProud Inc. All rights reserved.