電気回路技術者からITエンジニアを目指す!

子持ちのアラフォー回路屋さんがITエンジニアを目指します

どんなツイートに「いいね」や「リツイート」が付くか、pythonで分析してみた 2018/11/18版

 目的

  1. pythonでデータ分析を行う練習をしたい
  2. twitterでの情報発信の効率を高めるべく、これまでの傾向を分析したい

 

 やったこと概要

  1. twitter analyticsからツイートのcsvデータを取得する
  2. 取得したcsvデータをpythonで読み込む
  3. ツイート内容について、特徴(ツイートに特定の言葉が含まれる、等)を抜き出す
  4. 3.で抜き出した特徴の有無で、データを分類したグループを作る
  5. グループごとの「いいね」や「リツイート」を比べる

 

結果の概要

※ あくまで、私のアカウントだとこうだった、という結果です

 url付き(リンクや画像)のツイートは、いいねやリツイートが付きやすい

データ数は、

・URL無し 127件

・URL有り 108件

f:id:galleon_blue:20181118115003p:plain

 

分析結果(URLのあるなしで分類したあと、平均値をとった)

URL無し : インプレッションは多い

URL有り : リツイート、いいね、ユーザープロフィールのクリック、の全部多い

f:id:galleon_blue:20181118115213p:plain

 

URL無しのインプレッションが多くなっているのは、たぶん↓で述べるprogate関連のツイートが外れ値になっているから。

  

progateについてのツイートはインプレッションやいいねが伸びやすい

データ数は、「progate」という子渡場がツイート本文に

含まれないもの 225件

含まれるもの 10件

f:id:galleon_blue:20181118115615p:plain

分析結果(「progate」のあるなしで分類したあと、平均値をとった)

「progate」無し : すべての点で負けている

「progate」有り : すべての点で勝っている

f:id:galleon_blue:20181118115758p:plain

まあ、それぞれの平均値をインプレッション数で割った、「いいね率」みたいな数値を出せば、progate無しのほうが強そう。

 

progate抜きで、url(リンクや画像)有無の比較

データ数

URL無し 118件

URLあり 107件

f:id:galleon_blue:20181118120301p:plain

分析結果(URLのあるなしで分類したあと、平均値をとった)

インプレッションほか、すべての値でURL付きのほうが良い結果になってます。

f:id:galleon_blue:20181118120433p:plain

 

処理方法

以下に、どんな処理をしているか、まとめました。

qiita.com

 

まとめ

pythonを使うと、なれれば、こんな分析が10分くらいでできちゃいます。

 

なお、あくまで、私のアカウントだとこうだった、という結果です。

 

参考

note.mu