-->

【KNIME】(ナイム)欠損値を他の値に置き換えよう!Missing Value(ミッシングバリュー)

2022/05/27

Knime

t f B! P L

この記事の概要

KNIME(ナイム)のMissing Value(ミッシングバリュー)ノードを解説します。
このノードは欠損値「?」に任意の数字を入れることができます。
データの取りこぼしの補間や穴埋めなどに有用なノードです。


欠損値を埋めるならMissing value(ミッシングバリュー)

KNIMEでワークフローを処理していると「?」と書かれたセルが出てくることが
多々あります。
これは欠損値と言って、元々のデータが空白だったり
該当するセルの値が見当たらない場合に出現します。

今回はそんな欠損値を他の値に置き換えるノード
Missing Value(ミッシングバリュー)を紹介します。

Missing Value(ミッシングバリュー)の使い方

エクセルでデータや表で一部のデータが抜けていたり、空白だったりすることはありませんか?
空白データを任意のデータに置き換えたり、平均値や中央値を取って補完することができるノードが
Missing Value(ミッシングバリュー)です。

欠損値が出たままだとその後の処理でエラーが起こる場合があるので
欠損値を平均値や固定値で埋めるためにこのノードを使用します。

欠損値はもともと空白のセルが含まれているエクセルファイルを読み込んだ場合や
データ型の変更に等によりセルが空白になった場合に「?」で表示されるセルの事です。

欠損値「?」を数値に置き換える

Missing Value(ミッシングバリュー)の入出力結果が下記になります。
入力に欠損値「?」を含むデータを入力します。

左側のテーブル赤線で囲った部分の「?」が欠損値です。
右側のテーブルではその欠損値「?」がすべて置き換わっているのが分かると思います。



欠損値は任意の値や平均値、直前の値などに置き換えることができます。
欠損値をなくすことで空白セルを無くしてデータの補間をすることができます!

一番上にあるデータを下の行にコピーすることも出来ます!


Configure(設定)画面の解説

設定は簡単です。
Defaultタブの画面は何も触らなくてOKです。



続いてColumn Settingsの画面に移動します。
ここで細かい設定ができます。
まず欠損値を置き換える列(カラム)を選択します。

選択した後「add」ボタンを押して右側にカラムを追加します。
追加した後ドロップボックスの中から欠損値の置換方法を選択します。








欠損値置き換え後の値の設定 

欠損値をどのような値に置き換えるか選択できます。
下記は代表的な置き換え値です。
MeanやFix Value 、Firstをよく使うと思います。

Average Interpolation:平均補間値の値に欠損値を置き換えします。

Fix Value:欠損値を指定した値に置き換えます。

Do nothing:欠損値に対して何もしません。

Linear Interpolation欠損値を線形補値に置き換えします。

Most Frequent Value欠損値を最頻値に置き換えします。

Maximum欠損値を最大値に置き換えします。

Mean欠損値を平均値に置き換えします。

Median欠損値を中央値に置き換えします。

Minimum欠損値を最小値に置き換えします。

Most Frequent Value欠損値を移動平均値に置き換えします。

First:欠損値をデータの最初の文字列、数字に置き換えします。

Last欠損値をデータの最後の文字列、数字に置き換えします。

Next Value:欠損値を次の値(下のセル)の値に置き換えします。

Previous Value欠損値を前の値(上のセル)の値に置き換えします。


あとがき

いかがでしたでしょうか?
Missing Value(ミッシングバリュー)は地味なノードですが空白を埋める面倒な作業を
一度に処理してくれる大変便利なノードです。

?マークが処理の邪魔になるときはMissing Valueを使用して欠損値を消しましょう!

それでは!





このブログを検索

注目の投稿

【KNIME】(ナイム)最強の表計算マクロソフト!KNIME(ナイム)のご紹介!使い方は?できることは?

この記事の概要 KNIME(ナイム)は表計算、マクロ動作を主機能とするフリーソフト。 エクセルと同等の機能を有しており、行列計算やグラフ描画可能。 ノードと呼ばれる箱を線で繋ぐことで計算処理を行う事が出来るため 関数名などを覚える必要はなく、処理の内容が分かりやすい。 Pytho...

スポンサー広告

スポンサー広告

QooQ