電気回路技術者からITエンジニアを目指す!

子持ちのアラフォー回路屋さんがITエンジニアを目指します

別ファイルになっているデータとデータを結びつけて分析したいときは、pythonを使って欲しい!

よくある光景

新製品を開発しているときに、ちょっと過去の製品の生産時の消費電流データが気になったりすること、ありますよね。

電池寿命の要求仕様がシビアだったりするときに、部品のロットにより、消費電流がどのくらい変わるんだろう、ということがとっても気になります。

でも、工場から出てきたデータは、生産時の消費電流データと部品のロットに関する情報がバラバラのcsvに入っているもの。

そう、こんな感じに。

f:id:galleon_blue:20181014100252p:plain

この例だと、まだ簡単ですが、順番がごちゃごちゃだったり、組立工程と検査工程とで採番の仕方が違ったりするともっと大変・・。

Excelで頑張るのもいいけれど・・

面倒くさいけれどExcelでvlookup関数でまとめるか!

と頑張るのもいいですが、こういうときは、pythonも試してみませんか?

ちょっと勉強して慣れてやれば、python を使ったほうが、はるかにお手軽簡単なのです。

python + pandas なら

例えば、これだけの記述をするだけで・・・

f:id:galleon_blue:20181014100751p:plain

下の表が作れるのです。

消費電流(current)データとロットが直接つながっているデータ。まず、ほしかったデータはこれです。

f:id:galleon_blue:20181014100906p:plain

見たくもない大量の数値を、シートをまたいで関数を呼び出しつつ集計する、なんてことも不要です。

集計も簡単

そして、追加で数行の処理をすることで、部品のロットごとの平均値やばらつきの集計も簡単にできてしまいます。

f:id:galleon_blue:20181014101300p:plain

これも、Excelでやろうとすると、ちょっとめんどくさいやつです。

詳しい手順はこちら

上にあるような処理は、全部フリー(無料!)でできてしまいます。

手順は以下の通り。

1. anacondaのインストール

www.galleon.blue

2. jupyter notebookの起動 3. コードの実行

それぞれの段階の詳しい方法や解説は、随時追加します!

今回使ったサンプルデータとソースコードは以下からダウンロード可能です。

github.com