| Index ソフト・ハード Python | 用語 |
|
例外 ・プログラムの実行中に発生するエラーを例外と言う。 ・例外が発生するとそのエラー情報をもつ例外オブジェクトが生成される。 デコレータ ・アットマーク(@)を使った記法で、関数に何らかの意味をもたせ、機能を付加 環境構築 ・テキストエディタ、Pythonインタプリタのインストール 開発環境 ・プログラムを作成するために必要なツール類 テキストエディタ PythonインタプリタPythonインタプリタ ・プログラムを実行する際にプログラムを逐次解釈しながら実行する。 ・コンパイルして実行形式に変換する必要がない。 ・インタプリタ型の言語は動作が遅い。 Pythonインタプリタは最適化が進み、遅さは改善されている。Pandasの欠損値(missing value) ・データ内の変数で、存在しない値 データ分析の手法の中には欠損値を扱えないものがある。・欠損値の表現 NaN (Not a Number) 主に数値型の欠損値を表すために使用される。 NumPyからPandasに継承(numpy.nanのエイリアス) IEEE 754 浮動小数点標準で定義(参考) None:Python標準のNoneTypeという独自の型を持つオブジェクト 浮動小数点数のNaNとは別 Pandasは、オブジェクト型データではNoneをそのまま欠損値として扱う。 pd.NA:Pandas 1.0(2020)以降に導入 整数型、文字列型、ブール型でも欠損値としてpd.NAを扱える。 数値型でNaNを使うとfloatに変換されてしまう問題の解消 sr_pd_na = pd.Series([1, 2, pd.NA, 4], dtype='Int64') ブール型でNoneを使うとオブジェクト型になってしまう問題の解消・欠損値の補完 df_fill_const = df.fillna(0) # 数値列は0、文字列はNaNのまま df_ffill = df.fillna(method='ffill') # 前の有効な値で欠損値を補完 (forward fill)。 df_bfill = df.fillna(method='bfill') # 次の行の値で補完 (backward fill)。 数値列の欠損値を、その列の平均値や中央値で補完するのは一般的な手法 df_mean_fill['N'] = df_mean_fill['N'].fillna(df_mean_fill['N'].mean()) |
| All Rights Reserved. Copyright (C) ITCL | |