WOPAN

Excelスキルを大公開!習得して同僚の3倍の収入をゲット!

クリックしてフォロー ▲ AiqiSEM

ツール|  体験 | 情報  | ケーススタディ  |  職場セクション

SEMとフィード広告に重点を置く

著者:秦陸

寄稿者: [email protected]

WeChat: aiqijun02

情報フローやSEMなど、最適化プロセスではデータ分析が不可欠です。そのため、Excelスプレッドシートを頻繁に使用せざるを得ません。Excelのスキルを習得すれば、作業効率は間違いなく倍増します。今日は主にExcelのスキルについてご紹介します。

この説明はまだ概要であり、画像とテキストはBaidu Experienceから引用しています。ご質問やご提案がございましたら、メッセージをお送りいただくか、オンラインで検索してください。いつものように、SQLとPythonに関する情報もコンテンツに追加していきます。

ショートカットキー

Excel には多くのキーボード ショートカットがあり、主に効率を向上するためのものは次のとおりです。

Ctrl + 矢印キーを押すと、セル カーソルがデータの端 (スペース) にすばやく移動します。

Ctrl + Shift + 矢印キーを押してセルをすばやく選択し、データの端 (スペースの位置) を選択します。

列全体を選択するには、Ctrl + Space を押します。

Shift + スペースバーを押すと行全体が選択されます。

表の内容全体を選択するには、Ctrl+A を押します。

Alt+Enter、改行。

Ctrl + Enter を押すと、現在のセルからデータと関数が入力されます。

Ctrl+S を押すとすぐに読み取って保存できます。意味はお分かりでしょう。

Ctrl+Z で現在のアクションを元に戻します。

効率を重視する方は、キーボードショートカットをもっと覚えることをお勧めします。Macユーザーの場合は、CtrlキーをCommandキーに置き換えるのが一般的です。

フォーマット変換

Excel の書式設定と変換は見落とされがちですが、書式設定はデータ アナリストにとってあらゆるシナリオに不可欠な部分であり、後続の SQL および Python データ型の基礎として機能します。

通常、Excel 形式は数値、テキスト、時刻の形式に分類されます。

数値は一般的に、整数(Int)と小数点/浮動小数点数(Float)の2種類に分類されます。この2つの境界は曖昧な場合が多く、SQLとPythonでは計算効率と精度が絡み、区別がより複雑になります。

テキストは中国語と英語に分割されており、それぞれバイト単位で保存されており、文字長が異なります。中国語の文字は、特にPython 2ではエンコードの問題が発生しやすい傾向があります。また、WindowsとMacの環境によっても違いがあります。文字化けが発生するのは、通常、中国語のエンコードエラーが原因です。

Excel では、時刻形式を数値と直接交換することができ、加算と減算を使用して日数を変換することもできます。

時刻の形式は、2018年3月16日、2018/03/16、2018-03-16など、多岐にわたります。データソースが多数ある場合、混乱を招く可能性があります。カスタム形式を使用することで、時刻を標準化できます。

ここでは、時刻形式の概要と一般的な例をいくつか示します (ただし、プログラミング言語によって違いはあります)。

YYYY はワイルドカードの 4 桁の年形式を表します。

MM はワイルドカードの 2 桁の月形式を表します。

DD はワイルドカードの 2 桁の日付形式を表します。

HH はワイルドカードの 2 桁の時間 (24 時間) 形式を表します。

hh はワイルドカードの 2 桁の小文字 (12 時間) 形式を表します。

mm は 2 桁のワイルドカード形式を表します。

ss はワイルドカードの 2 桁の秒形式を表します。

例えば、2018/03/16はyyyy/MM/ddと表記されます。

2018-03-16 23:59:59 は次のように表記されます: yyyy-MM-dd HH:mm:ss

配列

多くの人は配列を使わない、あるいはこの機能の存在すら知らないでしょう。しかし、データ分析が進むにつれて、配列はますます使われるようになっています。Rの配列やPythonのリストに似ています。

配列は複数の要素で構成されます。通常の関数は単一の値を返しますが、配列型関数は複数の値を返します。

配列は中括弧で表されます。関数内で配列を使用する場合は、Ctrl+Shift+Enter キーを使用して入力してください。そうしないとエラーが発生します。

配列の最も基本的な使い方を見てみましょう。A1:D1の範囲を選択し、「={1,2,3,4}」と入力します。これは中括弧です。Ctrl+Shift+Enterを押します。配列内の4つの値がそれぞれ4つのセルに渡されていることがわかります。これは配列のユニークな使い方です。

配列と関数の応用を見てみましょう。中括弧{}を使うと、1と「a」、2と「b」、3と「c」を対応させることができます。これは1対1の対応です。専門用語ではマッピングと呼ばれます。

=lookup(検索値,{1,2,3},{"a","b","c"})

Excelの配列にも同様に強力な機能があり、オンラインで検索すれば効率化に役立つ情報を入手できます。しかし、Pythonの配列ははるかに強力なので、ここでは詳しく説明しません。

Excelは複数のセルの内容を結合できますが、分割は得意ではありません。テキストを区切り位置に配置する機能を使えば、特定のルールに従って列を分割できます。これはデータのクリーニングによく使用されます。

前の例では、地域データの列があり、都市と地域を2つの列に分割したいと考えていました。一般的な方法は、MID関数とFIND関数を使って「city」の文字を検索し、抽出することです。しかし、最も速い方法は、「c​​ity」を列区切り文字として使用することです。

ここで考えさせられる質問があります。都市と地区の両方が存在する場合、それらをどのように個別にリストすればよいのでしょうか。

SQL と Python には同様の spill() 関数があります。

セルを結合する

セルはレポートの構成に使用されます。印刷などの最終出力形式でない限り、セルを恣意的に結合することは避けてください。

セルを結合すると、ほとんどの関数が正しく動作しなくなり、バッチデータ処理やフォーマット変換に影響を及ぼします。また、セルの結合はPythonやSQLの読み取りエラーを引き起こす可能性があります。

ピボットテーブル

ピボット テーブルは非常に強力な機能です。初めてその使い方を学んだときは驚きました。

ピボット テーブルの主な機能は、データを集計し、各サブセグメントに対して sum() および count() 演算を実行することです。

下の画像では、計算したいデータを選択し、「ピボットテーブルの作成」をクリックしました。

この時点で、新しいシートが作成されます。これは、生データと集計された計算データを分離できるピボットテーブルの利点です。

ピボット テーブルの基本的な考え方は集計であり、同じフィールド名を持つデータをグループ化する、つまりデータをカテゴリ別にグループ化することです。

列と行の設定により、異なる軸に沿ってデータが表示されます。ドラッグ&ドロップ操作で、必要なレポート構造を簡単に設定できます。

集計関数は SQL の `goroup by` 関数に似ていますが、Python にはより強力な `pandas.pivot_table()` 関数があります。

重複を削除する

データのクリーニングと検証を素早く行う方法です。列に含まれる一意の値の数を確認したり、データのクリーニングに使用できます。


これは、SQL の distinct キーワードや Python の set キーワードと同様に機能します。

条件付き書式

条件付き書式はデータの視覚化に使用できます。大量のデータから上位3つの値を見つける関数を使用する場合、rank()関数を使用してデータを並べ替え、1、2、3をフィルター処理することができます。

条件付き書式設定は、色を使用して要素を強調表示する、非常に直感的な別の簡単な方法です。

最初の行と最初の列を固定する

Excelでは、通常、最初の行はフィールド名を含むヘッダー行です。行や列の数が多いと、データの確認が難しくなる場合があります。最初の行を固定することで、データの閲覧と操作が容易になります。

ヘッダーは比較的重要な概念です。PythonとRでは、`read_csv`関数に専用のパラメータ`header=true`があり、テーブルヘッダーを列名として読み取るかどうかを決定します。

カスタム ドロップダウン メニュー (データ検証)

データ検証は、セルへの入力をいくつかの固定値に制限する制約です。ドロップダウンメニューは、ドロップダウン矢印を許可することで実現される、より高度なアプリケーションです。


カスタム名

カスタム命名は非常に便利なテクニックです。領域、変数、配列に名前を付けることができます。後で頻繁に使用する必要がある場合、再度検索することなく、簡単に参照できます。これが再利用の概念です。

A1:A3 領域を NUM と名付けました。

=sum(NUM) を直接使用することは、sum(A1:A3) と同じです。

初心者にとって、データベースを理解する良い方法は、無数のテーブルやシートと考えることです。各テーブルには、上の画像のNUMのように、固有の名前が付けられています。データベース操作では、これらのテーブル名を使用して、SUMやCOUNTなどの関数を用いて、検索、結合、その他の類似の操作を実行します。

数式エラーを見つける

この機能は、数式エラーが発生し、その原因がわからない場合、特にネストされたIF文、複数のテーブルを結合する場合、または複雑なロジックの場合に役立ちます。数式エラーを見つけるには、ステップごとの計算が必要となるため、問題を正確に特定するのに非常に便利です。


グループ化と階層表示

グループ化と階層表示は、レポートでよく使用されます。レポートの行数が多い場合、グループ化することで行の切り替えや非表示を素早く行うことができます。この機能は、コンサルティングレポートや財務レポートなど、より専門的なレポートで特に役立ちます。この機能は「データ」メニューにあります。

分析ツールライブラリ

分析ツールキットは、高度な分析を可能にする強力なツールで、多くの統計計算、テスト関数、その他のツールが含まれています。Excelにはデフォルトでインストールされていないため、[ツール]メニューのアドインとしてインストールする必要があります(インストール方法はバージョンによって若干異なる場合があります)

分析ツールキットは統計パッケージであり、ソルバーは決定木に似た最適解を計算します。両者の分析手法については後ほど詳しく説明します。

Mac は不自由になったようです。

サードパーティ製アプリケーション

Excel は、非常に強力な機能を提供し、BI タスクも実行できるサードパーティのアドインをサポートしています。

アプリストアにある公式のMicrosoft Powerアプリはどれも非常に優れています。下の画像はPower Mapです。

サードパーティのアプリストアにMac版がないのは本当に残念です。Windowsユーザーは最新バージョンを使うべきです。2010年以前のバージョンにはプラグインがありません。サードパーティ製アプリは深く探求する価値があります。従来型の業界のデータアナリストはそれらの学習に注力する必要がありますが、インターネットアナリストはそうではありません。

——— 注目記事のおすすめ ———

データ:検索ランキング|モバイルインターネット|情報フロープラットフォーム 

プラットフォーム: Baidu | Tencent | Sina | Tencent Ads | Toutiao

最適化:住宅改修 | ゲーム | 教育 |金融 |不動産 | 非企業|ウェディングフォトグラフィー 電子商取引

ツール:サードパーティの監視  |  パワーポイント  |  コンバージョンデータトラッキング  |  ファネルを促進する|  データツールの収集

  こちらをクリック!Excelを無料で学ぼう!