Excel の[重複の削除]ボタンに依存するのをやめる — データをクリーンアップする 3 つの安全な方法

in tech

Excel の[重複を削除]ボタンは、無害なクリーンアップ ショートカットのように見えますが、1 回間違えてクリックすると、実際にまだ必要なデータを完全に削除してしまう可能性があります。ソース レコードを危険にさらすのではなく、組み込みツールを使用して、破壊的な編集を行わずにデータセットを安全に検査、抽出、再構築します。

このガイドのすべての例では Excel テーブル (Ctrl+T) 名前付き T_連絡先。手順を進めるには、この表を含む Excel ワークブックの無料コピーをダウンロードしてください。リンクをクリックすると、画面の右上隅にダウンロード ボタンが表示されます。

なぜそのボタンをクリックすることが危険なクリーンアップ行為なのか

Excel 専用の重複削除ツール (データ > データ ツール > 重複の削除) は最もリスクの高いユーティリティの 1 つです。これをクリックすると、Excel はデータセットから行を完全に消去します。ファイルを保存して閉じた後で、その情報が実際に必要だったことがわかった場合でも、[元に戻す]ボタンを押しても問題が解決されるとは限りません。

ここでの本当の落とし穴は、列チェックリストの仕組みです。 Excel のポップアップ メニューは、スキャンする列を選択できる安全機能のように見えます。ただし、ここに落とし穴があります。列のチェックを外すと、Excel はエントリを照合するときにそれらのフィールドの差異を無視するように指示されるだけです。一致するものが見つかった場合でも、Excel は行全体を削除します。

T_Contacts テーブルでは、「名前」、「電話番号」、「電子メール」をチェックしたままにし、「送信元」だけをオフにすることで、システムの裏をかこうとする可能性があります。これにより、Sarah Smith と Michael Brown の真の重複は正常に削除されますが (連絡先フィールドがすべて完全に一致するため)、Alex Jones に関しては矛盾が発生します。彼の 2 つの行には異なる電子メール アドレスが含まれているため、Excel はそれらを別のレコードとして扱い、両方をそのまま残します。

次に、[電子メール]列と[ソース]列のチェックを外して、Excel に重複した「Alex Jones」を強制的に検索させると、ツールは彼の名前と番号を照合しますが、更新された電子メール アドレスを含む行は即座に蒸発します。言い換えれば、リストが乱雑になるかデータが失われるかのどちらかを選択する必要があるということです。

このツールはまた、あなたの仕組みを完全に隠します。信頼性の高いスプレッドシートを構築するには、変更を追跡し、エラーのトラブルシューティングを行うことができるように、明示的な監査証跡を維持することが重要です。破壊的なツールに依存することは、自分の作品を見せろという数学教師のアドバイスを無視するようなものです。結果だけが見えてしまうと、それがどのように生成されたのか、どこで問題が起こったのかを検証する方法がありません。

最後に、結果はスナップショットです。新しい行がテーブルに追加されると、クリーンアップされた出力はすでに古くなっているため、正確さを維持したい場合は、プロセスを手動で繰り返す必要があります。

したがって、重複の削除を使用する代わりに、元のデータを保存しながら、データセットが変更されても同期を保つ動的で再現可能な結果を​​生成するツールを使用できます。

OS

Windows、macOS、iPhone、iPad、Android

無料トライアル

1ヶ月

Microsoft 365 には、最大 5 台のデバイスで Word、Excel、PowerPoint などの Office アプリ、1 TB の OneDrive ストレージなどへのアクセスが含まれています。


条件付き書式を使用して重複データを視覚的に分離します

行を 1 つも削除せずに繰り返しを特定する

乱雑なスプレッドシートを監査する必要がある場合は、削除ではなく可視化に重点を置く必要があります。条件付き書式を使用すると、データのすべての行をそのまま維持しながら、繰り返しのエントリにスポットライトを当てることができます。つまり、繰り返しのエントリをどう処理するかを決定する前に調査できます。

これにより、データ損失のパラドックスが完全に解決されます。重複した名前を削除せずに強調表示すると、Alex Jones が異なる電子メール アドレスで 2 回表示されていることがわかります。データは削除されていないため、正しいアドレスを確認して、自分でリストを安全に消去できます。

このツールの使用方法は次のとおりです。

  1. を選択します。 名前 カラム。

  2. を開きます。 リボンのタブをクリックします。

  3. クリック 条件付き書式設定 > セルの強調表示ルール > 重複値

  4. 左側のドロップダウン メニューが次のように設定されていることを確認します。 重複を選択してください 配色をクリックして、 わかりました

Excel では、繰り返される名前 (Alex Jones、Sarah Smith、Michael Brown) が即座に強調表示されます。さらに、強調表示は動的であるため、新しい行が追加されたり値が変更されたりすると、重複がリアルタイムで自動的に更新されます。

基礎となるデータを失うことなく、詳細を並べて比較し、レコードを手動で更新できるようになりました。

面倒な作業は数式に任せましょう

通常、宛名ラベルを簡単に印刷するためのクリーンなリストを作成するために重複の削除にアクセスする場合は、元のテーブルを変更する必要はありません。代わりに、ソース データをスキャンし、ワークブックの別のセクションにクリーンな配列を出力する動的 UNIQUE 関数を使用できます。何よりも、テーブルが大きくなるにつれて自動的に更新されます。

UNIQUE は通常、名前や電子メール アドレスなどの値の完全なリストが必要な場合に、単一の列で使用されます。複数の列にわたって使用すると、Excel は各行を値の一意の組み合わせとして扱います。

この関数の使用は簡単です。

  1. クリーンなリストを保存する空のセル (セル F2 など) を選択します。

  2. タイプ:

    =UNIQUE(
  3. を選択します。 名前 列に右かっこを入力して式を完成させます。

    =UNIQUE(T_Contacts(Name))
  4. プレス 入力

Excel は結果を自動的に出力し、ソース テーブルとの同期を維持しながら、リストを一意の名前のクリーンなセットに減らします。

高度で再現可能なデータ スクラビングのためのマスター Power Query

複雑なスプレッドシートをクリーンアップするための究極のツールキット

大規模なデータセットや定期的なレポートの場合、Power Query は、データのクリーニングと変換を行うための Excel の最も信頼できるツールの 1 つです。元のワークシートを変更する代わりに、データのコピーをインポートし、一連の反復可能な変換ステップを適用して、クリーンアップされた結果を新しいシートに出力します。

どのレコードを保持するかを制御する必要がある場合は、重複を削除する前にデータを並べ替えます。ネイティブの重複削除ツールとは異なり、Power Query では反復可能な変換の一部としてその並べ替えが保存されるため、更新するたびに同じロジックが適用されます。

ワークフローは次のとおりです。

  1. 選択 任意の細胞 テーブル内で、 データ タブをクリックして選択します テーブル/範囲から をクリックして Power Query エディターを開きます。

  2. 必要に応じて、 データを並べ替える そのため、最も関連性の高いレコードが最初に表示されます。たとえば、電子メール ソースが電話ソースよりも最新の場合は、[ソース]列を昇順で並べ替えます。

  3. を選択します。 名前 列(または長押し) Ctrl 行全体の重複排除には複数の列を選択します)。

  4. 右クリック そして選択します 重複の削除
  5. クリック 閉じてロードタブ。

次に、Power Query は、元のテーブルを変更せずに、クリーンアップされたデータ リストを新しいワークシートにドロップします。また、クエリを更新するたびに、同じ手順が新しいデータまたは更新されたデータに再適用され、プロセスを手動でやり直すことなく結果の一貫性が保たれます。


自動化で Excel ワークフローをレベルアップする

条件付き書式設定は重複をリアルタイムで安全に検査するのに役立ち、UNIQUE はライブ更新のクリーンなリストを生成し、Power Query は更新時に一貫性を保つ構造化データセットを再構築できます。これらを組み合わせることで、Excel の破壊的なワークフローが透明で反復可能な動的なプロセスに置き換えられます。これらのツールが毎日のクリーンアップを処理する場合、ワークフローを自動化し、組み込み機能を超えて拡張するには、Excel の Python を使用するのが自然な次のステップです。

このテーマについてさらに詳しく知りたい方は以下をご覧ください

詳しい情報を見る

関連記事

前の投稿
ルーターのせいにするのはやめてください。Windows が帯域幅を使い果たしている可能性があります。
次の投稿
Oura Ring 5 が正式版となり、来週出荷開始