この記事の概要
KNIME(ナイム)のMissing Value(ミッシングバリュー)ノードを解説します。
このノードは欠損値「?」に任意の数字を入れることができます。
データの取りこぼしの補間や穴埋めなどに有用なノードです。
そのほかの代表的なノードの一覧はこちら。
欠損値を埋めるならMissing value(ミッシングバリュー)
KNIMEでワークフローを処理していると「?」と書かれたセルが出てくることが
多々あります。
これは欠損値と言って、元々のデータが空白だったり
該当するセルの値が見当たらない場合に出現します。
今回はそんな欠損値を他の値に置き換えるノード
Missing Value(ミッシングバリュー)を紹介します。
Missing Value(ミッシングバリュー)の使い方
エクセルでデータや表で一部のデータが抜けていたり、空白だったりすることはありませんか?
空白データを任意のデータに置き換えたり、平均値や中央値を取って補完することができるノードが
Missing Value(ミッシングバリュー)です。
欠損値が出たままだとその後の処理でエラーが起こる場合があるので
欠損値を平均値や固定値で埋めるためにこのノードを使用します。
欠損値はもともと空白のセルが含まれているエクセルファイルを読み込んだ場合や
データ型の変更に等によりセルが空白になった場合に「?」で表示されるセルの事です。
欠損値「?」を数値に置き換える
Missing Value(ミッシングバリュー)の入出力結果が下記になります。
入力に欠損値「?」を含むデータを入力します。
左側のテーブル赤線で囲った部分の「?」が欠損値です。
右側のテーブルではその欠損値「?」がすべて置き換わっているのが分かると思います。
一番上にあるデータを下の行にコピーすることも出来ます!
Configure(設定)画面の解説
設定は簡単です。
Defaultタブの画面は何も触らなくてOKです。
ここで細かい設定ができます。
まず欠損値を置き換える列(カラム)を選択します。
選択した後「add」ボタンを押して右側にカラムを追加します。
追加した後ドロップボックスの中から欠損値の置換方法を選択します。
欠損値置き換え後の値の設定
欠損値をどのような値に置き換えるか選択できます。
下記は代表的な置き換え値です。
MeanやFix Value 、Firstをよく使うと思います。
Average Interpolation:平均補間値の値に欠損値を置き換えします。
Fix Value:欠損値を指定した値に置き換えます。
Do nothing:欠損値に対して何もしません。
Linear Interpolation:欠損値を線形補値に置き換えします。
Most Frequent Value:欠損値を最頻値に置き換えします。
Maximum:欠損値を最大値に置き換えします。
Mean:欠損値を平均値に置き換えします。
Median:欠損値を中央値に置き換えします。
Minimum:欠損値を最小値に置き換えします。
Most Frequent Value:欠損値を移動平均値に置き換えします。
First:欠損値をデータの最初の文字列、数字に置き換えします。
Last:欠損値をデータの最後の文字列、数字に置き換えします。
Next Value:欠損値を次の値(下のセル)の値に置き換えします。
Previous Value:欠損値を前の値(上のセル)の値に置き換えします。
あとがき
いかがでしたでしょうか?
Missing Value(ミッシングバリュー)は地味なノードですが空白を埋める面倒な作業を
一度に処理してくれる大変便利なノードです。
?マークが処理の邪魔になるときはMissing Valueを使用して欠損値を消しましょう!
それでは!
0 件のコメント:
コメントを投稿
ここにコメントを書いてね!