pandasドリル第8回の問題は「値の種類ごとに新しい列を作成するには?」です。
つとむ先生の紹介
20数年、最適化関連の案件に従事するビープラウドの技術士(情報工学)。2014年より最適化のモデル作成にPythonを使い始め、効率的に開発できるようになる。東京海洋大学、青山学院大学、慶應義塾大学に非常勤講師としての勤務経験がある。また、オペレーションズ・リサーチ学会に約30年所属し、理事を2期務めた。
主な著書はモデリングの諸相、Python言語によるビジネスアナリティクス、今日から使える!組合せ最適化、データ分析ライブラリーを用いた最適化モデルの作り方
問題
変数resultに格納された図
Subject | 国語 | 算数 |
---|---|---|
Name | ||
Alice | 87 | 72 |
Bob | 65 | 92 |
問題で使うDataFrame
import pandas as pd df = pd.DataFrame( [ ['Alice', '国語', 87], ['Alice', '算数', 72], ['Bob', '国語', 65], ['Bob', '算数', 92], ], columns=['Name', 'Subject', 'Point']) df
dfに格納された図
Name | Subject | Point | |
---|---|---|---|
0 | Alice | 国語 | 87 |
1 | Alice | 算数 | 72 |
2 | Bob | 国語 | 65 |
3 | Bob | 算数 | 92 |
回答
result = df.pivot_table('Point', 'Name', 'Subject')
解説
df.pivot_table('Point', 'Name', 'Subject')
のようにして、Excelと同じようにピボットテーブルが使えます。
- 第1引数に、表内の項目を指定します。
- 第2引数に、インデックスの項目を指定します。
- 第3引数に、列の項目を指定します。
前回の問題
第7回【CSVのデータの文字化けを解消するには?】はこちらからご覧ください。