2022-04

Dataframe

locを省略した書き方

#locを使った書き方df.loc[:,列名または列名のリスト]#locを省略した書き方(上記と結果は同じ)df[列名または列名のリスト]pandasでは、このように同じ処理を複数の方法で書けることがあります。次のように書くことで指定した条...
日記

まだまだ道半ば

4月からついに東大のデータサイエンティストのコースに入学することが出来た。これで、大規模データの取り扱いの勉強と共にpythonの勉強を加速させて、2年以内にpythonで週1回のバイトが出来るようにしよう。それが目標。企業からの提携を受け...
Dataframe

条件で行や列を絞りこんで更新

前問では、df.locとすることで特定の条件で行を取得できることを学びました。同じ記述を使って、次のように新しい値に更新もできます。df.loc[比較結果]=新しい値=1つは定義NameAge0Alice171Bob242Carol29下記...
Dataframe

条件による絞り込み

pandasでは、特定の条件でDataFrameの行を絞り込めます。仕組みは以下のようになります。列と比較演算子を使って、特定の条件から「比較結果」を作成するDataFrame.locを使って、「比較結果」がTrueになる行を取得する具体例...
Dataframe

DataFrameへの列の追加

下記の書き方は、列名が存在していても存在していなくても使えます。df[列名]=...列名が存在するときは、値を更新します。列名が存在しないときは、新しい列を作成します。前クエスト「DataFrameの列の更新」では、計算したBMI(ボディー...
Dataframe

DataFrameに値を代入する

たとえば、DataFrameであるdfのある列に同じ値を代入するとき、下記のように行数分の要素のリストを使います。df[列名]=[同じ値,同じ値,...,同じ値]NamePoint0Alice171Bob242Carol29dfの列Poin...
Dataframe

Seriesと比較演算子

Seriesと比較演算子を組み合わせることで、Seriesの各要素が指定した条件を満たすかどうか判定した結果を得られます。具体的な例を見てみましょう。前問と同じく、下記のdfを使います。TypeDepthWidthHeight0S23515...
Dataframe

Series同士の演算

pandasでは、Series同士の演算も可能です。たとえばdf*dfのように書くと、列1と列2の各要素を掛け算した結果のSeriesが得られます。具体的な例を見てみましょう。ダンボールのサイズを表す下記のdfを使います。TypeDepth...
Dataframe

DataFrameの計算

掛け算NamePoint0Alice171Bob242Carol29列Pointに対して、各要素の値を2倍にする結果を取得したいとします。列PointはイテラブルなSeriesなので、下記のように、2倍にした結果を取得できます。[point...
Dataframe

CSVファイルへの書き込み

DataFrameの中身をCSVファイルに書き込む際は、to_csv()メソッドを使います。次のように、第1引数に書き込み先のファイルのパスを指定します。df.to_csv(ファイルパス)read_csv()同様、to_csv()にもさまざ...