pandasドリル第15回の問題は「教科ごとの順位を追加するには?」です。
つとむ先生の紹介
20数年、最適化関連の案件に従事するビープラウドの技術士(情報工学)。2014年より最適化のモデル作成にPythonを使い始め、効率的に開発できるようになる。東京海洋大学、青山学院大学、慶應義塾大学、上智大学に非常勤講師としての勤務経験がある。また、オペレーションズ・リサーチ学会に約30年所属し、理事を2期務めた。フェロー。
主な著書はモデリングの諸相、Python言語によるビジネスアナリティクス、今日から使える!組合せ最適化、データ分析ライブラリーを用いた最適化モデルの作り方
問題
df
に、テストの結果が入っています。
下記のように、「教科(Subject)ごとに個人の順位」の列Rankをdf
に追加してください。
順位はPointの高い順で決まります。
求められる結果(df
の内容)
Name | Subject | Point | Rank | |
---|---|---|---|---|
0 | Alice | 国語 | 87 | 1.0 |
1 | Alice | 算数 | 72 | 2.0 |
2 | Bob | 国語 | 65 | 2.0 |
3 | Bob | 算数 | 92 | 1.0 |
問題で使うDataFrame
import pandas as pd df = pd.DataFrame( [ ['Alice', '国語', 87], ['Alice', '算数', 72], ['Bob', '国語', 65], ['Bob', '算数', 92], ], columns=['Name', 'Subject', 'Point']) df
Name | Subject | Point | |
---|---|---|---|
0 | Alice | 国語 | 87 |
1 | Alice | 算数 | 72 |
2 | Bob | 国語 | 65 |
3 | Bob | 算数 | 92 |
回答
df['Rank'] = df.groupby('Subject').Point.rank(ascending=False)
解説
df.groupby('Subject').Point
でSubjectごとにグルーピングしたPointになります。
df.groupby('Subject').Point.rank(ascending=False)
で教科ごとの個人の順位になります。
ascending=False
とすることで、Pointの高い順になります。
df['Rank'] = ...
とすることで、「教科ごとの個人の順位」をRank列として追加します。
お知らせ
PyQの「pandasチャレンジ」パートではこの問題を実際に手を動かしながら学べます。
PyQで学習中の方はぜひトライしてみてください。
pandasチャレンジその7 - Pythonのオンライン学習サービスPyQ(パイキュー)
前回の問題
つとむ先生のpandasドリル【同一キーの値をリストにした辞書を作成するには?】は、こちらからご覧ください。