つとむ先生のpandasドリル【教科ごとの順位を追加するには？】

f:id:kenken0326:20210603102008p:plain

tsutomu こんにちはPyQチームのtsutomuです。
pandasドリル第15回の問題は「教科ごとの順位を追加するには？」です。

つとむ先生の紹介

20数年、最適化関連の案件に従事するビープラウドの技術士（情報工学）。2014年より最適化のモデル作成にPythonを使い始め、効率的に開発できるようになる。東京海洋大学、青山学院大学、慶應義塾大学、上智大学に非常勤講師としての勤務経験がある。また、オペレーションズ・リサーチ学会に約30年所属し、理事を2期務めた。フェロー。
主な著書はモデリングの諸相、Python言語によるビジネスアナリティクス、今日から使える!組合せ最適化、データ分析ライブラリーを用いた最適化モデルの作り方

つとむ先生の紹介
問題
- 求められる結果（dfの内容）
- 問題で使うDataFrame
回答
解説
お知らせ
前回の問題

問題

tsutomu DataFrame型の変数dfに、テストの結果が入っています。下記のように、「教科（Subject）ごとに個人の順位」の列Rankをdfに追加してください。順位はPointの高い順で決まります。

求められる結果（`df`の内容）

	Name	Subject	Point	Rank
0	Alice	国語	87	1.0
1	Alice	算数	72	2.0
2	Bob	国語	65	2.0
3	Bob	算数	92	1.0

問題で使うDataFrame

import pandas as pd

df = pd.DataFrame(
    [
        ['Alice', '国語', 87],
        ['Alice', '算数', 72],
        ['Bob', '国語', 65],
        ['Bob', '算数', 92],
    ],
    columns=['Name', 'Subject', 'Point'])
df

	Name	Subject	Point
0	Alice	国語	87
1	Alice	算数	72
2	Bob	国語	65
3	Bob	算数	92

回答

回答はクリック！

df['Rank'] = df.groupby('Subject').Point.rank(ascending=False)

解説

df.groupby('Subject').PointでSubjectごとにグルーピングしたPointになります。
df.groupby('Subject').Point.rank(ascending=False)で教科ごとの個人の順位になります。
ascending=Falseとすることで、Pointの高い順になります。
df['Rank'] = ...とすることで、「教科ごとの個人の順位」をRank列として追加します。